Амазон нь баримт бичиг таних үүлэн үйлчилгээг эхлүүллээ

Та олон баримтаас мэдээллийг хурдан бөгөөд автоматаар гаргаж авах шаардлагатай юу? Мөн тэдгээрийг сканнер эсвэл гэрэл зургийн хэлбэрээр хадгалдаг уу? Хэрэв та Amazon Web Services (AWS) хэрэглэгч бол азтай байна. Амазон нь нэвтрэх эрхээ нээлээ Текст, үүлэнд суурилсан, бүрэн удирдлагатай үйлчилгээ нь машин сургалтыг ашиглан хүснэгт, текстийн хэлбэр, текстийн бүх хуудсыг түгээмэл цахим форматаар шинжлэхэд ашигладаг. Одоогоор энэ нь зөвхөн AWS-ийн сонгогдсон бүс нутагт, тухайлбал АНУ-ын зүүн хэсэг (Охайо ба Хойд Виржиниа), Баруун АНУ (Орегон), ЕХ (Ирланд) зэрэгт ашиглах боломжтой боловч ирэх жил Textract хүн бүр ашиглах боломжтой болно.

Амазон нь баримт бичиг таних үүлэн үйлчилгээг эхлүүллээ

Amazon-ийн үзэж байгаагаар Textract нь ердийн оптик тэмдэгт таних системээс хамаагүй илүү үр дүнтэй байдаг. Энэ нь Amazon S3 хувин дотор хадгалагдсан файлуудаас татварын маягт дээрх нэр, Нийгмийн даатгалын дугаар, эсвэл гэрэл зурагтай баримт дээрх нийт дүнг автоматаар тодруулах гэх мэт мэдээллийг танилцуулж буй контекст дээр үндэслэн талбар болон хүснэгтийн агуулгыг гаргаж авах боломжтой. Amazon-д тэмдэглэснээр хэвлэлийн мэдээ, Textract нь сканнер, PDF болон гэрэл зураг зэрэг зургийн форматыг дэмждэг бөгөөд санхүүгийн үйлчилгээ, даатгал, эрүүл мэндийн үйлчилгээ зэрэгтэй холбоотой баримт бичгийн контексттэй үр дүнтэй ажилладаг.

Текст нь үр дүнг хуудасны дугаар, хэсэг, маягтын шошго, өгөгдлийн төрлөөр тэмдэглэсэн JSON форматаар хадгалдаг бөгөөд Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, Amazon Comprehend зэрэг машин сургалтын бүтээгдэхүүн зэрэг мэдээллийн сан, аналитик үйлчилгээнүүдтэй сонголттойгоор нэгтгэдэг. , Amazon Comprehend Medical, Amazon Translate, Amazon SageMaker зэрэг нь дараах боловсруулалтанд зориулагдсан. Түүнчлэн, гаргаж авсан өгөгдлийг нягтлан бодох бүртгэл, аудитын нийцлийн зорилгоор эсвэл баримт бичгийн архивын ухаалаг хайлтыг дэмжих зорилгоор гуравдагч талын үүлэн үйлчилгээнд шууд шилжүүлж болно. Amazon-ийн хэлснээр, Textract нь "хэдхэн цагийн дотор" олон сая хуудас өөр өөр баримт бичгүүдийг "нямбай" боловсруулж чаддаг.

Globe and Mail, Их Британийн Үндэсний цаг уурын алба, PricewaterhouseCoopers, Healthfirst ашгийн бус менежментийн тусламж үйлчилгээний байгууллага, робот процессын автоматжуулалтын UiPath, Ripcord, Blue Prism компаниуд зэрэг AWS-ийн олон хэрэглэгчид Textract-ийг аль хэдийн ашигладаг. Ипотекийн зээлийн салбарт ил тод байдлыг бий болгох зорилготой "Candor" стартап компани нь харилцагчдынхаа зээлийг батлах үйл явцыг хурдасгахын тулд банкны хуулга, төлбөрийн баримт, татварын янз бүрийн баримт бичгүүдээс өгөгдлийг гаргаж авахдаа Textract ашигладаг.

Amazon Machine Learning-ийн дэд ерөнхийлөгч Свами Сивасубраманиан "Amazon Textract-ийн хүч бол дэвшилтэт машин сурах шаардлагагүйгээр бараг бүх баримтаас текст болон бүтэцлэгдсэн өгөгдлийг үнэн зөв гаргаж авдагт оршино." "Бусад AWS үйлчилгээнүүдтэй нэгтгэхээс гадна Amazon Textract-ийн эргэн тойронд хөгжиж буй томоохон нийгэмлэг нь манай үйлчлүүлэгчдэд файл цуглуулгаасаа бодит үнэ цэнийг олж авах, илүү үр дүнтэй ажиллах, аюулгүй байдлын шаардлагыг сайжруулах, өгөгдөл оруулах автоматжуулалт, бизнесийн шийдвэрүүдийг хурдасгах боломжийг олгодог."

Re:Invent 2018 чуулган дээр Textract-ийн илтгэлийг англи хэл дээр үзэх боломжтой.



Эх сурвалж: 3dnews.ru

сэтгэгдэл нэмэх