Amazon yn lansio gwasanaeth adnabod dogfennau cwmwl

A oes angen i chi dynnu gwybodaeth yn gyflym ac yn awtomatig o sawl dogfen? Ac a ydynt, ar ben hynny, yn cael eu storio ar ffurf sganiau neu ffotograffau? Rydych chi mewn lwc os ydych chi'n gwsmer Gwasanaethau Gwe Amazon (AWS). Cyhoeddodd Amazon agoriad mynediad i Textract, gwasanaeth sy'n seiliedig ar gwmwl ac wedi'i reoli'n llawn sy'n defnyddio dysgu peirianyddol i ddadansoddi tablau, ffurflenni testun, a thudalennau cyfan o destun mewn fformatau electronig poblogaidd. Am y tro, dim ond mewn rhanbarthau AWS dethol y bydd ar gael, yn benodol Dwyrain yr UD (Ohio a Gogledd Virginia), Gorllewin yr UD (Oregon), a'r UE (Iwerddon), gyda Textract yn mynd yn gyhoeddus y flwyddyn nesaf.

Amazon yn lansio gwasanaeth adnabod dogfennau cwmwl

Yn Γ΄l Amazon, mae Textract yn llawer mwy effeithlon na systemau adnabod nodau optegol confensiynol. O ffeiliau sydd wedi'u storio mewn bwced Amazon S3, gall dynnu cynnwys meysydd a thablau, gan ystyried y cyd-destun y cyflwynir y wybodaeth hon ynddo, er enghraifft, mae'r system yn tynnu sylw'n awtomatig at yr enwau a'r rhifau nawdd cymdeithasol ar ffurflenni treth neu'r cyfansymiau derbynebau y tynnwyd llun ohonynt. Fel y noda Amazon yn Datganiad i'r wasg, Mae Textract yn cefnogi fformatau delwedd fel sganiau, PDFs, a lluniau, ac yn gweithio'n effeithlon gyda chyd-destun mewn dogfennau sy'n benodol i wasanaethau ariannol, yswiriant, a gofal iechyd.

Mae Textract yn arbed canlyniadau mewn fformat JSON wedi'i anodi Γ’ rhifau tudalennau, adrannau, labeli ffurflenni, a mathau o ddata, ac yn ddewisol yn integreiddio Γ’ gwasanaethau cronfa ddata a dadansoddeg fel Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, a chynhyrchion dysgu peiriannau, megis Amazon Comprehend, Amazon Comprehend Medical, Amazon Translate, ac Amazon SageMaker ar gyfer Γ΄l-brosesu. Fel arall, gellir trosglwyddo'r data a echdynnwyd yn uniongyrchol i wasanaethau cwmwl trydydd parti at ddibenion cyfrifyddu ac archwilio cydymffurfiaeth neu i gefnogi chwiliadau craff mewn archifau dogfennau. Yn Γ΄l Amazon, gall Textract brosesu miliynau o dudalennau o wahanol ddogfennau yn "gywir" mewn "dim ond ychydig oriau."

Mae llawer o gwsmeriaid AWS eisoes yn defnyddio Textract, gan gynnwys Globe and Mail, Gwasanaeth Tywydd Cenedlaethol y DU, PricewaterhouseCoopers, Healthfirst, sefydliad gofal dielw a reolir, a chwmnΓ―au awtomeiddio prosesau robotig UiPath, Ripcord, a Blue Prism. Mae Candor, cwmni newydd sy'n ceisio dod Γ’ thryloywder i'r diwydiant morgeisi, yn defnyddio Textract i dynnu data o ddogfennau fel datganiadau banc, bonion cyflog a dogfennau treth amrywiol i gyflymu'r broses cymeradwyo benthyciad ar gyfer ei gleientiaid.

β€œPΕ΅er Amazon Textract yw ei fod yn echdynnu data testunol a strwythuredig yn gywir o bron unrhyw ddogfen heb fod angen dysgu peiriant ymlaen llaw,” meddai Swami Sivasubramanian, is-lywydd Amazon Machine Learning. "Yn ogystal ag integreiddio Γ’ gwasanaethau AWS eraill, mae'r gymuned fawr sy'n tyfu o amgylch Amazon Textract yn galluogi ein cwsmeriaid i gael gwerth gwirioneddol o'u casgliadau ffeiliau, gweithio'n fwy effeithlon, gwella cydymffurfiaeth Γ’ diogelwch, awtomeiddio mewnbynnu data, a chyflymu penderfyniadau busnes."

Isod gallwch wylio cyflwyniad Textract yn re:Invent 2018 yn Saesneg.



Ffynhonnell: 3dnewyddion.ru

Ychwanegu sylw