Amazon izlaiž mākoņpakalpojumu dokumentu atpazīšanai

Vai jums ir nepieciešams ātri un automātiski iegūt informāciju no vairākiem dokumentiem? Un vai tie arī tiek glabāti skenētu vai fotogrāfiju veidā? Jums veicas, ja esat Amazon Web Services (AWS) klients. Amazon paziņoja par piekļuves atvēršanu Tekstraksts, uz mākoņiem balstīts un pilnībā pārvaldīts pakalpojums, kas izmanto mašīnmācīšanos, lai analizētu tabulas, teksta formas un veselas teksta lapas populāros elektroniskos formātos. Pagaidām tas būs pieejams tikai atsevišķos AWS reģionos, īpaši ASV austrumos (Ohaio un Ziemeļvirdžīnijā), ASV rietumos (Oregonā) un ES (Īrijā), bet nākamgad Textract būs pieejams ikvienam.

Amazon izlaiž mākoņpakalpojumu dokumentu atpazīšanai

Saskaņā ar Amazon teikto, Textract ir ievērojami efektīvāka nekā parastās optiskās rakstzīmju atpazīšanas sistēmas. No failiem, kas glabājas Amazon S3 spainī, tas var iegūt lauku un tabulu saturu, pamatojoties uz kontekstu, kurā šī informācija tiek sniegta, piemēram, automātiski izceļot vārdus un sociālās apdrošināšanas numurus nodokļu veidlapās vai kopsummas nofotografētajās kvītīs. Kā atzīmē Amazon preses relīze, Textract atbalsta attēlu formātus, piemēram, skenētus attēlus, PDF failus un fotogrāfijas, un efektīvi strādā ar kontekstu dokumentos, kas raksturīgi finanšu pakalpojumiem, apdrošināšanai un veselības aprūpei.

Textract saglabā rezultātus JSON formātā, anotācijās ar lappušu numuriem, sadaļām, veidlapu etiķetēm un datu tipiem, un pēc izvēles tiek integrēti ar datu bāzes un analītikas pakalpojumiem, piemēram, Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena un mašīnmācīšanās produktiem, piemēram, Amazon Comprehend. , Amazon Comprehend Medical, Amazon Translate un Amazon SageMaker pēcapstrādei. Alternatīvi, iegūtos datus var pārsūtīt tieši uz trešās puses mākoņpakalpojumiem grāmatvedības un audita atbilstības nolūkos vai atbalstīt viedo meklēšanu dokumentu arhīvos. Saskaņā ar Amazon teikto, Textract var “precīzi” apstrādāt miljoniem dažādu dokumentu lappušu “tikai dažu stundu laikā”.

Daudzi AWS klienti jau izmanto Textract, tostarp Globe and Mail, Apvienotās Karalistes Nacionālais laikapstākļu dienests, PricewaterhouseCoopers, bezpeļņas pārvaldītā aprūpes organizācija Healthfirst un robotu procesu automatizācijas uzņēmumi UiPath, Ripcord un Blue Prism. Candor, jaunuzņēmums, kura mērķis ir nodrošināt caurspīdīgumu hipotekāro kredītu nozarē, izmanto Textract, lai iegūtu datus no tādiem dokumentiem kā bankas izraksti, maksājumu veidlapas un dažādi nodokļu dokumenti, lai paātrinātu aizdevuma apstiprināšanas procesu saviem klientiem.

"Amazon Textract spēks ir tāds, ka tas precīzi izvelk tekstu un strukturētus datus praktiski no jebkura dokumenta, neizmantojot uzlabotas mašīnmācības," sacīja Amazon Machine Learning viceprezidents Svami Sivasubramanians. “Papildus integrācijai ar citiem AWS pakalpojumiem, lielā Amazon Textract kopiena ļauj mūsu klientiem gūt patiesu vērtību no savām failu kolekcijām, strādāt efektīvāk, uzlabot drošības atbilstību, automatizēt datu ievadi un paātrināt biznesa lēmumu pieņemšanu.”

Zemāk iespējams noskatīties Textract prezentāciju konferencē re:Invent 2018 angļu valodā.



Avots: 3dnews.ru

Pievieno komentāru