Inilunsad ng Amazon ang cloud service para sa pagkilala sa dokumento

Kailangan mo bang mabilis at awtomatikong kunin ang impormasyon mula sa maraming dokumento? At sila ba ay nakaimbak din sa anyo ng mga pag-scan o mga litrato? Maswerte ka kung isa kang customer ng Amazon Web Services (AWS). Inanunsyo ng Amazon ang pagbubukas ng access sa Teksto, isang cloud-based at ganap na pinamamahalaang serbisyo na gumagamit ng machine learning para suriin ang mga talahanayan, text form, at buong page ng text sa mga sikat na electronic format. Sa ngayon, magiging available lang ito sa mga piling rehiyon ng AWS, partikular sa Eastern US (Ohio at Northern Virginia), Western US (Oregon), at EU (Ireland), ngunit sa susunod na taon magiging available na ang Texttract sa lahat.

Inilunsad ng Amazon ang cloud service para sa pagkilala sa dokumento

Ayon sa Amazon, ang Texttract ay makabuluhang mas mahusay kaysa sa maginoo optical character recognition system. Mula sa mga file na nakaimbak sa isang Amazon S3 bucket, maaari nitong kunin ang mga nilalaman ng mga field at talahanayan batay sa konteksto kung saan ipinakita ang impormasyong iyon, gaya ng awtomatikong pag-highlight ng mga pangalan at numero ng Social Security sa mga form ng buwis o mga kabuuan sa mga nakuhanan ng larawan na resibo. Tulad ng tala ng Amazon sa press release, Sinusuportahan ng Texttract ang mga format ng larawan tulad ng mga pag-scan, PDF at mga larawan, at epektibong gumagana sa konteksto sa mga dokumentong partikular sa mga serbisyong pinansyal, insurance at pangangalagang pangkalusugan.

Ang mga text store ay nagreresulta sa JSON na format, na may annotated na mga numero ng page, mga seksyon, mga label ng form, at mga uri ng data, at opsyonal na isinasama sa mga serbisyo ng database at analytics gaya ng Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, at mga produkto ng machine learning. gaya ng Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate, at Amazon SageMaker para sa post-processing. Bilang kahalili, ang na-extract na data ay maaaring direktang ilipat sa mga third-party na serbisyo sa cloud para sa mga layunin ng pagsunod sa accounting at pag-audit o upang suportahan ang mga matalinong paghahanap ng mga archive ng dokumento. Ayon sa Amazon, ang Texttract ay maaaring "tumpak na" magproseso ng milyun-milyong pahina ng iba't ibang mga dokumento sa "ilang oras lamang."

Maraming customer ng AWS ang gumagamit na ng Texttract, kabilang ang Globe and Mail, National Weather Service ng UK, PricewaterhouseCoopers, non-for-profit na managed care organization na Healthfirst, at mga robotic process automation company na UiPath, Ripcord, at Blue Prism. Ang Candor, isang startup na naglalayong magdala ng transparency sa industriya ng mortgage, ay gumagamit ng Textract upang kunin ang data mula sa mga dokumento tulad ng mga bank statement, pay stub at iba't ibang mga dokumento sa buwis upang mapabilis ang proseso ng pag-apruba ng pautang para sa mga customer nito.

β€œAng kapangyarihan ng Amazon Texttract ay tumpak itong kumukuha ng text at structured na data mula sa halos anumang dokumento nang hindi nangangailangan ng advanced machine learning,” sabi ni Swami Sivasubramanian, vice president ng Amazon Machine Learning. "Bilang karagdagan sa pagsasama sa iba pang mga serbisyo ng AWS, ang malaking komunidad na lumalaki sa paligid ng Amazon Texttract ay nagbibigay-daan sa aming mga customer na makakuha ng tunay na halaga mula sa kanilang mga koleksyon ng file, gumana nang mas mahusay, mapabuti ang pagsunod sa seguridad, i-automate ang pagpasok ng data, at mapabilis ang mga desisyon sa negosyo."

Sa ibaba maaari mong panoorin ang presentasyon ng Texttract sa re:Invent 2018 conference sa English.



Pinagmulan: 3dnews.ru

Magdagdag ng komento