Tarvitseeko sinun poimia tietoja nopeasti ja automaattisesti useista asiakirjoista? Ja tallennetaanko ne lisäksi skannausten tai valokuvien muodossa? Olet onnekas, jos olet Amazon Web Services (AWS) -asiakas. Amazon ilmoitti pääsyn avaamisesta
Amazonin mukaan Textract on huomattavasti tehokkaampi kuin perinteiset optiset merkintunnistusjärjestelmät. Amazon S3 -ämpäriin tallennetuista tiedostoista se voi poimia kenttien ja taulukoiden sisällön ottaen huomioon kontekstin, jossa nämä tiedot esitetään, esimerkiksi järjestelmä korostaa automaattisesti verolomakkeiden nimet ja sosiaaliturvatunnukset tai loppusummat. valokuvatuista kuiteista. Kuten Amazon huomauttaa
Textract tallentaa tulokset JSON-muodossa, johon on merkitty sivunumerot, osiot, lomaketunnisteet ja tietotyypit, ja valinnaisesti integroituu tietokanta- ja analytiikkapalveluihin, kuten Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena ja koneoppimistuotteet, kuten Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate ja Amazon SageMaker jälkikäsittelyyn. Vaihtoehtoisesti poimitut tiedot voidaan siirtää suoraan kolmannen osapuolen pilvipalveluihin kirjanpito- ja auditointitarkoituksiin tai tukemaan älykkäitä hakuja dokumenttiarkistoissa. Amazonin mukaan Textract voi "tarkasti" käsitellä miljoonia sivuja erilaisia asiakirjoja "vain muutamassa tunnissa".
Monet AWS-asiakkaat käyttävät jo Textractia, mukaan lukien Globe and Mail, Ison-Britannian kansallinen sääpalvelu, PricewaterhouseCoopers, Healthfirst, voittoa tavoittelematon hoidettu hoitoorganisaatio, sekä robottiprosessiautomaatioyritykset UiPath, Ripcord ja Blue Prism. Candor, startup, jonka tavoitteena on tuoda läpinäkyvyyttä asuntolainateollisuuteen, käyttää Textractia poimimaan tietoja asiakirjoista, kuten tiliotteista, maksutodistuksista ja erilaisista veroasiakirjoista nopeuttaakseen asiakkaidensa lainan hyväksymisprosessia.
"Amazon Textractin voima on siinä, että se poimii tarkasti teksti- ja strukturoidut tiedot käytännöllisesti katsoen mistä tahansa dokumentista ilman aikaisempaa koneoppimista", sanoi Amazon Machine Learningin varapuheenjohtaja Swami Sivasubramanian. "Lisäksi integraatiota muihin AWS-palveluihin, Amazon Textractin ympärillä kasvava laaja yhteisö antaa asiakkaillemme mahdollisuuden saada todellista lisäarvoa tiedostokokoelmistaan, työskennellä tehokkaammin, parantaa tietoturvan noudattamista, automatisoida tietojen syöttämistä ja nopeuttaa liiketoimintapäätöksiä."
Alta voit katsoa Textractin esityksen re:Invent 2018 -sivustolla englanniksi.
Lähde: 3dnews.ru