Amazon документти таануу үчүн булут кызматын ишке киргизди

Сизге бир нече документтерден маалыматты тез жана автоматтык түрдө алуу керекпи? Жана алар ошондой эле сканирленген же фотосүрөттөр түрүндө сакталат? Эгер сиз Amazon Web Services (AWS) кардары болсоңуз, ийгиликке жетесиз. Amazon кирүү мүмкүнчүлүгүн ачканын жарыялады Текст, популярдуу электрондук форматтарда таблицаларды, текст формаларын жана тексттин бүт барактарын талдоо үчүн машина үйрөнүүнү колдонгон булутка негизделген жана толук башкарылуучу кызмат. Азырынча ал тандалган AWS аймактарында, атап айтканда Чыгыш АКШда (Огайо жана Түндүк Вирджиния), Батыш АКШда (Орегон) жана ЕБде (Ирландия) гана жеткиликтүү болот, бирок кийинки жылы Textract баарына жеткиликтүү болот.

Amazon документти таануу үчүн булут кызматын ишке киргизди

Amazon айтымында, Textract кадимки оптикалык белгилерди таануу системаларына караганда кыйла натыйжалуу. Amazon S3 чакасында сакталган файлдардан ал маалымат берилген контексттин негизинде талаалардын жана таблицалардын мазмунун чыгара алат, мисалы, салык формаларындагы ысымдарды жана Социалдык камсыздандыруу номерлерин автоматтык түрдө бөлүп көрсөтүү же сүрөткө түшкөн дүмүрчөктөрдөгү жыйынтыктар. Amazon белгилегендей пресс-релиз, Текст скандоо, PDF жана сүрөттөр сыяктуу сүрөт форматтарын колдойт жана финансылык кызматтарга, камсыздандырууга жана саламаттыкты сактоого тиешелүү документтердеги контекст менен эффективдүү иштейт.

Texttract натыйжаларды JSON форматында сактайт, аннотацияланган барак номерлери, бөлүмдөр, форма энбелгилери жана маалымат түрлөрү жана кошумча маалымат базасы жана Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena сыяктуу аналитика кызматтары жана Amazon Comprehend сыяктуу машина үйрөнүү өнүмдөрү менен интеграцияланат. , Amazon Comprehend Medical, Amazon Translate жана Amazon SageMaker кийинки иштетүү үчүн. Же болбосо, алынган маалыматтар бухгалтердик эсепке алуу жана шайкештикти текшерүү максатында же документ архивдерин интеллектуалдык издөөнү колдоо үчүн түздөн-түз үчүнчү тараптын булут кызматтарына өткөрүлүп берилиши мүмкүн. Амазондун айтымында, Textract миллиондогон баракчаларды "бир нече сааттын ичинде" "так" иштете алат.

Көптөгөн AWS кардарлары Globe and Mail, Улуу Британиянын Улуттук Метеорология кызматы, PricewaterhouseCoopers, Healthfirst коммерциялык эмес башкарылган тейлөө уюму жана UiPath, Ripcord жана Blue Prism робототехника процесстерин автоматташтыруучу компанияларды кошкондо Textract'ты колдонушат. Ипотекалык тармакка ачык-айкындыкты алып келүүнү максат кылган Candor стартап, кардарлары үчүн насыяны бекитүү процессин тездетүү үчүн банктык көчүрмөлөр, төлөм такталары жана ар кандай салык документтери сыяктуу документтерден маалыматтарды алуу үчүн Textract колдонот.

Amazon Machine Learning вице-президенти Свами Сивасубраманиан: "Amazon Textractтин күчү - ал текстти жана структураланган маалыматтарды өнүккөн машиналык үйрөнүүнүн кереги жок дээрлик бардык документтен так чыгарып алууда". "Башка AWS кызматтары менен интеграциялануудан тышкары, Amazon Textract айланасында өсүп жаткан чоң коомчулук биздин кардарларыбызга файл жыйнактарынан чыныгы баалуулукка ээ болууга, натыйжалуураак иштөөгө, коопсуздуктун сакталышын жакшыртууга, маалыматтарды киргизүүнү автоматташтырууга жана бизнес чечимдерин тездетүүгө мүмкүндүк берет."

Төмөндө сиз Re:Invent 2018 конференциясында Textractтин презентациясын англис тилинде көрө аласыз.



Source: 3dnews.ru

Комментарий кошуу