Amazon lanseeraa pilvipohjaisen asiakirjantunnistuspalvelun

Tarvitseeko sinun poimia tietoja nopeasti ja automaattisesti useista asiakirjoista? Ja tallennetaanko ne lisäksi skannausten tai valokuvien muodossa? Olet onnekas, jos olet Amazon Web Services (AWS) -asiakas. Amazon ilmoitti pääsyn avaamisesta Teksti, pilvipohjainen ja täysin hallittu palvelu, joka käyttää koneoppimista analysoimaan taulukoita, tekstilomakkeita ja kokonaisia ​​tekstisivuja suosituissa sähköisissä muodoissa. Toistaiseksi se on saatavilla vain tietyillä AWS-alueilla, erityisesti USA:n itäosissa (Ohio ja Pohjois-Virginia), US Westissä (Oregon) ja EU:ssa (Irlanti), ja Textract tulee julkisuuteen ensi vuonna.

Amazon lanseeraa pilvipohjaisen asiakirjantunnistuspalvelun

Amazonin mukaan Textract on huomattavasti tehokkaampi kuin perinteiset optiset merkintunnistusjärjestelmät. Amazon S3 -ämpäriin tallennetuista tiedostoista se voi poimia kenttien ja taulukoiden sisällön ottaen huomioon kontekstin, jossa nämä tiedot esitetään, esimerkiksi järjestelmä korostaa automaattisesti verolomakkeiden nimet ja sosiaaliturvatunnukset tai loppusummat. valokuvatuista kuiteista. Kuten Amazon huomauttaa Lehdistötiedote, Textract tukee kuvamuotoja, kuten skannauksia, PDF-tiedostoja ja valokuvia, ja toimii tehokkaasti kontekstin kanssa rahoituspalveluihin, vakuutuksiin ja terveydenhuoltoon liittyvissä asiakirjoissa.

Textract tallentaa tulokset JSON-muodossa, johon on merkitty sivunumerot, osiot, lomaketunnisteet ja tietotyypit, ja valinnaisesti integroituu tietokanta- ja analytiikkapalveluihin, kuten Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena ja koneoppimistuotteet, kuten Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate ja Amazon SageMaker jälkikäsittelyyn. Vaihtoehtoisesti poimitut tiedot voidaan siirtää suoraan kolmannen osapuolen pilvipalveluihin kirjanpito- ja auditointitarkoituksiin tai tukemaan älykkäitä hakuja dokumenttiarkistoissa. Amazonin mukaan Textract voi "tarkasti" käsitellä miljoonia sivuja erilaisia ​​asiakirjoja "vain muutamassa tunnissa".

Monet AWS-asiakkaat käyttävät jo Textractia, mukaan lukien Globe and Mail, Ison-Britannian kansallinen sääpalvelu, PricewaterhouseCoopers, Healthfirst, voittoa tavoittelematon hoidettu hoitoorganisaatio, sekä robottiprosessiautomaatioyritykset UiPath, Ripcord ja Blue Prism. Candor, startup, jonka tavoitteena on tuoda läpinäkyvyyttä asuntolainateollisuuteen, käyttää Textractia poimimaan tietoja asiakirjoista, kuten tiliotteista, maksutodistuksista ja erilaisista veroasiakirjoista nopeuttaakseen asiakkaidensa lainan hyväksymisprosessia.

"Amazon Textractin voima on siinä, että se poimii tarkasti teksti- ja strukturoidut tiedot käytännöllisesti katsoen mistä tahansa dokumentista ilman aikaisempaa koneoppimista", sanoi Amazon Machine Learningin varapuheenjohtaja Swami Sivasubramanian. "Lisäksi integraatiota muihin AWS-palveluihin, Amazon Textractin ympärillä kasvava laaja yhteisö antaa asiakkaillemme mahdollisuuden saada todellista lisäarvoa tiedostokokoelmistaan, työskennellä tehokkaammin, parantaa tietoturvan noudattamista, automatisoida tietojen syöttämistä ja nopeuttaa liiketoimintapäätöksiä."

Alta voit katsoa Textractin esityksen re:Invent 2018 -sivustolla englanniksi.



Lähde: 3dnews.ru

Lisää kommentti