Amazon lansează serviciul cloud pentru recunoașterea documentelor

Aveți nevoie să extrageți rapid și automat informații din mai multe documente? Și sunt stocate și sub formă de scanări sau fotografii? Ai noroc dacă ești client Amazon Web Services (AWS). Amazon a anunțat deschiderea accesului la Text, un serviciu bazat pe cloud și complet gestionat care utilizează învățarea automată pentru a analiza tabele, formulare de text și pagini întregi de text în formate electronice populare. Deocamdată, va fi disponibil doar în anumite regiuni AWS, în special estul SUA (Ohio și Virginia de Nord), vestul SUA (Oregon) și UE (Irlanda), dar anul viitor Texttract va fi disponibil pentru toată lumea.

Amazon lansează serviciul cloud pentru recunoașterea documentelor

Potrivit Amazon, Texttract este semnificativ mai eficient decât sistemele convenționale de recunoaștere optică a caracterelor. Din fișierele stocate într-o găleată Amazon S3, poate extrage conținutul câmpurilor și tabelelor în funcție de contextul în care sunt prezentate informațiile, cum ar fi evidențierea automată a numelor și numerelor de securitate socială pe formularele fiscale sau totalurile de pe chitanțele fotografiate. După cum notează Amazon comunicat de presa, Texttract acceptă formate de imagine precum scanări, PDF-uri și fotografii și funcționează eficient cu contextul în documente specifice serviciilor financiare, asigurărilor și asistenței medicale.

Textul stochează rezultatele în format JSON, adnotate cu numere de pagină, secțiuni, etichete de formular și tipuri de date și, opțional, se integrează cu baze de date și servicii de analiză, cum ar fi Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena și produse de învățare automată, cum ar fi Amazon Comprehend. , Amazon Comprehend Medical, Amazon Translate și Amazon SageMaker pentru post-procesare. Alternativ, datele extrase pot fi transferate direct către servicii cloud terțe în scopuri de contabilitate și auditare a conformității sau pentru a sprijini căutări inteligente ale arhivelor de documente. Potrivit Amazon, Texttract poate procesa „cu acuratețe” milioane de pagini de documente diferite în „doar câteva ore”.

Numeroși clienți AWS folosesc deja Textract, inclusiv Globe and Mail, Serviciul Național Meteorologic din Marea Britanie, PricewaterhouseCoopers, organizația non-profit de îngrijire gestionată Healthfirst și companiile de automatizare a proceselor robotizate UiPath, Ripcord și Blue Prism. Candor, un startup care își propune să aducă transparență în industria creditelor ipotecare, folosește Textextract pentru a extrage date din documente precum extrase de cont bancare, talonoane de plată și diverse documente fiscale pentru a accelera procesul de aprobare a împrumutului pentru clienții săi.

„Puterea Amazon Texttract este că extrage cu acuratețe text și date structurate din practic orice document, fără a fi nevoie de învățare automată avansată”, a declarat Swami Sivasubramanian, vicepreședinte al Amazon Machine Learning. „Pe lângă integrarea cu alte servicii AWS, comunitatea mare care crește în jurul Amazon Textract permite clienților noștri să câștige valoare reală din colecțiile lor de fișiere, să lucreze mai eficient, să îmbunătățească conformitatea cu securitatea, să automatizeze introducerea datelor și să accelereze deciziile de afaceri.”

Mai jos puteți urmări prezentarea Texttract la conferința re:Invent 2018 în limba engleză.



Sursa: 3dnews.ru

Adauga un comentariu