Gyorsan és automatikusan kell információkat kinyernie több dokumentumból? És ezeket szkennelt vagy fényképek formájában is tárolják? Szerencséje van, ha Ön az Amazon Web Services (AWS) ügyfele. Az Amazon bejelentette a hozzáférés megnyitását
Az Amazon szerint a Textract lényegesen hatékonyabb, mint a hagyományos optikai karakterfelismerő rendszerek. Az Amazon S3 tárolójában tárolt fájlokból ki tudja bontani a mezők és táblázatok tartalmát az adott információ kontextusa alapján, például automatikusan kiemeli a neveket és a társadalombiztosítási számokat az adóűrlapokon, vagy a végösszegeket a fényképezett nyugtákon. Ahogy az Amazon megjegyzi
A Textract az eredményeket JSON formátumban tárolja, oldalszámokkal, szakaszokkal, űrlapcímkékkel és adattípusokkal ellátva, és opcionálisan integrálható olyan adatbázis- és elemzési szolgáltatásokkal, mint az Amazon Elasticsearch Service, az Amazon DynamoDB, az Amazon Athena és a gépi tanulási termékekkel, például az Amazon Comprehenddel. , Amazon Comprehend Medical, Amazon Translate és Amazon SageMaker az utófeldolgozáshoz. Alternatív megoldásként a kinyert adatok közvetlenül továbbíthatók harmadik fél felhőszolgáltatásaihoz számviteli és auditálási célból, vagy a dokumentumarchívumokban való intelligens keresés támogatása érdekében. Az Amazon szerint a Textract „pontosan” képes több millió oldalnyi különböző dokumentum feldolgozására „csak néhány óra alatt”.
Számos AWS-ügyfél használja már a Textractot, köztük a Globe and Mail, az Egyesült Királyság Nemzeti Meteorológiai Szolgálata, a PricewaterhouseCoopers, a Healthfirst non-profit menedzselt gondozási szervezet, valamint az UiPath, a Ripcord és a Blue Prism robotfolyamat-automatizálási cégek. A Candor, egy startup, amelynek célja, hogy átláthatóságot teremtsen a jelzáloghitel-ágazatban, a Textract segítségével adatokat nyer ki olyan dokumentumokból, mint a banki kivonatok, fizetési csonkok és különféle adózási dokumentumok, hogy felgyorsítsa ügyfelei hitel-jóváhagyási folyamatát.
„Az Amazon Textract ereje abban rejlik, hogy gyakorlatilag bármilyen dokumentumból pontosan kinyeri a szöveget és a strukturált adatokat anélkül, hogy speciális gépi tanulásra lenne szükség” – mondta Swami Sivasubramanian, az Amazon Machine Learning alelnöke. „Az egyéb AWS-szolgáltatásokkal való integráció mellett az Amazon Textract körül növekvő közösség lehetővé teszi ügyfeleink számára, hogy valódi értéket nyerjenek fájlgyűjteményükből, hatékonyabban dolgozhassanak, javítsák a biztonsági megfelelést, automatizálják az adatbevitelt és felgyorsítsák az üzleti döntéseket.”
Alább megtekintheti a Textract előadását a re:Invent 2018 konferencián angol nyelven.
Forrás: 3dnews.ru