Aveți nevoie să extrageți rapid și automat informații din mai multe documente? Și sunt stocate și sub formă de scanări sau fotografii? Ai noroc dacă ești client Amazon Web Services (AWS). Amazon a anunțat deschiderea accesului la
Potrivit Amazon, Texttract este semnificativ mai eficient decât sistemele convenționale de recunoaștere optică a caracterelor. Din fișierele stocate într-o găleată Amazon S3, poate extrage conținutul câmpurilor și tabelelor în funcție de contextul în care sunt prezentate informațiile, cum ar fi evidențierea automată a numelor și numerelor de securitate socială pe formularele fiscale sau totalurile de pe chitanțele fotografiate. După cum notează Amazon
Textul stochează rezultatele în format JSON, adnotate cu numere de pagină, secțiuni, etichete de formular și tipuri de date și, opțional, se integrează cu baze de date și servicii de analiză, cum ar fi Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena și produse de învățare automată, cum ar fi Amazon Comprehend. , Amazon Comprehend Medical, Amazon Translate și Amazon SageMaker pentru post-procesare. Alternativ, datele extrase pot fi transferate direct către servicii cloud terțe în scopuri de contabilitate și auditare a conformității sau pentru a sprijini căutări inteligente ale arhivelor de documente. Potrivit Amazon, Texttract poate procesa „cu acuratețe” milioane de pagini de documente diferite în „doar câteva ore”.
Numeroși clienți AWS folosesc deja Textract, inclusiv Globe and Mail, Serviciul Național Meteorologic din Marea Britanie, PricewaterhouseCoopers, organizația non-profit de îngrijire gestionată Healthfirst și companiile de automatizare a proceselor robotizate UiPath, Ripcord și Blue Prism. Candor, un startup care își propune să aducă transparență în industria creditelor ipotecare, folosește Textextract pentru a extrage date din documente precum extrase de cont bancare, talonoane de plată și diverse documente fiscale pentru a accelera procesul de aprobare a împrumutului pentru clienții săi.
„Puterea Amazon Texttract este că extrage cu acuratețe text și date structurate din practic orice document, fără a fi nevoie de învățare automată avansată”, a declarat Swami Sivasubramanian, vicepreședinte al Amazon Machine Learning. „Pe lângă integrarea cu alte servicii AWS, comunitatea mare care crește în jurul Amazon Textract permite clienților noștri să câștige valoare reală din colecțiile lor de fișiere, să lucreze mai eficient, să îmbunătățească conformitatea cu securitatea, să automatizeze introducerea datelor și să accelereze deciziile de afaceri.”
Mai jos puteți urmări prezentarea Texttract la conferința re:Invent 2018 în limba engleză.
Sursa: 3dnews.ru