Amazon хидмати абриро барои шинохтани ҳуҷҷатҳо оғоз мекунад

Оё ба шумо лозим аст, ки маълумотро аз якчанд ҳуҷҷатҳо зуд ва ба таври худкор истихроҷ кунед? Ва оё онҳо инчунин дар шакли скан ё аксҳо нигоҳ дошта мешаванд? Агар шумо муштарии Amazon Web Services (AWS) бошед, шумо хушбахт ҳастед. Amazon эълон кард, ки дастрасӣ ба Матн, хидмати ба абр асосёфта ва пурра идорашаванда, ки омӯзиши мошинро барои таҳлили ҷадвалҳо, шаклҳои матн ва тамоми саҳифаҳои матн дар форматҳои маъмули электронӣ истифода мебарад. Дар айни замон, он танҳо дар минтақаҳои интихобшудаи AWS, махсусан дар ИМА Шарқӣ (Огайо ва Вирҷинияи Шимолӣ), ИМА Ғарбӣ (Орегон) ва ИА (Ирландия) дастрас хоҳад буд, аммо соли оянда Textract барои ҳама дастрас хоҳад буд.

Amazon хидмати абриро барои шинохтани ҳуҷҷатҳо оғоз мекунад

Мувофиқи Amazon, Textract нисбат ба системаҳои анъанавии шинохти аломатҳои оптикӣ ба таври назаррас самараноктар аст. Аз файлҳои дар сатили Amazon S3 нигоҳ дошташуда, он метавонад мундариҷаи майдонҳо ва ҷадвалҳоро бар асоси контекст, ки дар он маълумот пешниҳод карда мешавад, ба мисли худкор таъкид кардани номҳо ва рақамҳои амнияти иҷтимоӣ дар варақаҳои андоз ё ҷамъбаст дар квитансияҳои аксбардорӣ истихроҷ кунад. Тавре ки Amazon қайд мекунад матбуот, Texttract форматҳои тасвириро ба мисли сканҳо, PDFҳо ва аксҳо дастгирӣ мекунад ва бо контекст дар ҳуҷҷатҳои мушаххаси хадамоти молиявӣ, суғурта ва тандурустӣ самаранок кор мекунад.

Матн натиҷаҳоро дар формати JSON нигоҳ медорад, ки бо рақамҳои саҳифаҳо, бахшҳо, тамғакоғазҳо ва намудҳои додаҳо шарҳ дода шудааст ва ихтиёрӣ бо хидматҳои пойгоҳи додаҳо ва таҳлилҳо ба монанди Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena ва маҳсулоти омӯзиши мошинсозӣ, ба монанди Amazon Comprehend ҳамгиро мешавад. , Amazon Comprehend Medical, Amazon Translate ва Amazon SageMaker барои коркарди баъдӣ. Интихобан, маълумоти истихроҷшуда метавонад мустақиман ба хидматҳои абрии тарафи сеюм бо мақсади баҳисобгирӣ ва аудити мутобиқат ё дастгирии ҷустуҷӯи оқилонаи бойгониҳои ҳуҷҷатҳо интиқол дода шавад. Мувофиқи Amazon, Textract метавонад миллионҳо саҳифаҳои ҳуҷҷатҳои гуногунро дар тӯли "ҳамагӣ чанд соат" "дақиқ" коркард кунад.

Мизоҷони сершумори AWS аллакай Textract-ро истифода мебаранд, аз ҷумла Globe and Mail, Хадамоти миллии обу ҳавои Британияи Кабир, PricewaterhouseCoopers, ташкилоти ғайритиҷоратии нигоҳубини Healthfirst ва ширкатҳои автоматикунонии равандҳои роботии UiPath, Ripcord ва Blue Prism. Candor, як стартап, ки ҳадафи шаффофиятро дар соҳаи ипотека таъмин мекунад, Textract-ро барои истихроҷи маълумот аз ҳуҷҷатҳо ба монанди ҳисоботи бонкӣ, ҳисобҳои пардохт ва ҳуҷҷатҳои гуногуни андоз барои суръат бахшидан ба раванди тасдиқи қарз барои муштариёнаш истифода мебарад.

"Қудрати Amazon Textract дар он аст, ки он матн ва маълумоти сохториро аз ҳама гуна ҳуҷҷат бидуни ниёз ба омӯзиши пешрафтаи мошинсозӣ дақиқ истихроҷ мекунад" гуфт Свами Сивасубраманян, ноиби президенти Amazon Machine Learning. "Ба ғайр аз ҳамгироӣ бо дигар хидматҳои AWS, ҷомеаи бузурге, ки дар атрофи Amazon Textract афзоиш меёбад, ба мизоҷони мо имкон медиҳад, ки аз коллексияи файлҳои худ арзиши воқеӣ ба даст оранд, самараноктар кор кунанд, мутобиқати амниятро беҳтар кунанд, вуруди маълумотро автоматӣ кунанд ва тасмимҳои тиҷоратиро суръат бахшанд."

Дар зер шумо метавонед муаррифии Textract-ро дар конфронси re:Invent 2018 бо забони англисӣ тамошо кунед.



Манбаъ: 3dnews.ru

Илова Эзоҳ