Az Amazon felhőszolgáltatást indít a dokumentumfelismeréshez

Gyorsan és automatikusan kell információkat kinyernie több dokumentumból? És ezeket szkennelt vagy fényképek formájában is tárolják? Szerencséje van, ha Ön az Amazon Web Services (AWS) ügyfele. Az Amazon bejelentette a hozzáférés megnyitását Szöveg, egy felhő alapú és teljesen felügyelt szolgáltatás, amely gépi tanulást használ táblázatok, szöveges űrlapok és teljes szövegoldalak elemzésére népszerű elektronikus formátumokban. Egyelőre csak bizonyos AWS-régiókban lesz elérhető, konkrétan az USA keleti részén (Ohio és Észak-Virginia), az USA nyugati részén (Oregon), valamint az EU-ban (Írország), de jövőre mindenki számára elérhető lesz a Textract.

Az Amazon felhőszolgáltatást indít a dokumentumfelismeréshez

Az Amazon szerint a Textract lényegesen hatékonyabb, mint a hagyományos optikai karakterfelismerő rendszerek. Az Amazon S3 tárolójában tárolt fájlokból ki tudja bontani a mezők és táblázatok tartalmát az adott információ kontextusa alapján, például automatikusan kiemeli a neveket és a társadalombiztosítási számokat az adóűrlapokon, vagy a végösszegeket a fényképezett nyugtákon. Ahogy az Amazon megjegyzi sajtóközlemény, A Textract támogatja az olyan képformátumokat, mint a szkennelt képek, PDF-ek és fényképek, és hatékonyan együttműködik a pénzügyi szolgáltatásokra, a biztosításra és az egészségügyre vonatkozó dokumentumok kontextusával.

A Textract az eredményeket JSON formátumban tárolja, oldalszámokkal, szakaszokkal, űrlapcímkékkel és adattípusokkal ellátva, és opcionálisan integrálható olyan adatbázis- és elemzési szolgáltatásokkal, mint az Amazon Elasticsearch Service, az Amazon DynamoDB, az Amazon Athena és a gépi tanulási termékekkel, például az Amazon Comprehenddel. , Amazon Comprehend Medical, Amazon Translate és Amazon SageMaker az utófeldolgozáshoz. Alternatív megoldásként a kinyert adatok közvetlenül továbbíthatók harmadik fél felhőszolgáltatásaihoz számviteli és auditálási célból, vagy a dokumentumarchívumokban való intelligens keresés támogatása érdekében. Az Amazon szerint a Textract „pontosan” képes több millió oldalnyi különböző dokumentum feldolgozására „csak néhány óra alatt”.

Számos AWS-ügyfél használja már a Textractot, köztük a Globe and Mail, az Egyesült Királyság Nemzeti Meteorológiai Szolgálata, a PricewaterhouseCoopers, a Healthfirst non-profit menedzselt gondozási szervezet, valamint az UiPath, a Ripcord és a Blue Prism robotfolyamat-automatizálási cégek. A Candor, egy startup, amelynek célja, hogy átláthatóságot teremtsen a jelzáloghitel-ágazatban, a Textract segítségével adatokat nyer ki olyan dokumentumokból, mint a banki kivonatok, fizetési csonkok és különféle adózási dokumentumok, hogy felgyorsítsa ügyfelei hitel-jóváhagyási folyamatát.

„Az Amazon Textract ereje abban rejlik, hogy gyakorlatilag bármilyen dokumentumból pontosan kinyeri a szöveget és a strukturált adatokat anélkül, hogy speciális gépi tanulásra lenne szükség” – mondta Swami Sivasubramanian, az Amazon Machine Learning alelnöke. „Az egyéb AWS-szolgáltatásokkal való integráció mellett az Amazon Textract körül növekvő közösség lehetővé teszi ügyfeleink számára, hogy valódi értéket nyerjenek fájlgyűjteményükből, hatékonyabban dolgozhassanak, javítsák a biztonsági megfelelést, automatizálják az adatbevitelt és felgyorsítsák az üzleti döntéseket.”

Alább megtekintheti a Textract előadását a re:Invent 2018 konferencián angol nyelven.



Forrás: 3dnews.ru

Hozzászólás