Amazon uruchamia usługę w chmurze do rozpoznawania dokumentów

Czy potrzebujesz szybko i automatycznie wyodrębniać informacje z wielu dokumentów? Czy są one także przechowywane w formie skanów lub fotografii? Jeśli jesteś klientem Amazon Web Services (AWS), masz szczęście. Amazon ogłosił otwarcie dostępu do Tekst, w pełni zarządzana usługa oparta na chmurze, która wykorzystuje uczenie maszynowe do analizowania tabel, formularzy tekstowych i całych stron tekstu w popularnych formatach elektronicznych. Na razie będzie dostępny tylko w wybranych regionach AWS, w szczególności we wschodnich Stanach Zjednoczonych (Ohio i Północna Wirginia), zachodnich Stanach Zjednoczonych (Oregon) i UE (Irlandia), ale w przyszłym roku Texttract będzie dostępny dla wszystkich.

Amazon uruchamia usługę w chmurze do rozpoznawania dokumentów

Według Amazona Texttract jest znacznie wydajniejszy niż konwencjonalne systemy optycznego rozpoznawania znaków. Z plików przechowywanych w zasobniku Amazon S3 może wyodrębnić zawartość pól i tabel w oparciu o kontekst, w jakim te informacje są prezentowane, na przykład automatyczne wyróżnianie nazwisk i numerów ubezpieczenia społecznego w formularzach podatkowych lub sum na sfotografowanych paragonach. Jak zauważa Amazon w informacja prasowaTextract obsługuje formaty obrazów, takie jak skany, pliki PDF i fotografie, a także skutecznie współpracuje z kontekstem w dokumentach specyficznych dla usług finansowych, ubezpieczeń i opieki zdrowotnej.

Texttract przechowuje wyniki w formacie JSON, opatrzone adnotacjami z numerami stron, sekcjami, etykietami formularzy i typami danych oraz opcjonalnie integruje się z bazami danych i usługami analitycznymi, takimi jak Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena i produktami do uczenia maszynowego, takimi jak Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate i Amazon SageMaker do przetwarzania końcowego. Alternatywnie wyodrębnione dane można przesłać bezpośrednio do usług chmurowych stron trzecich w celach księgowych i audytowych dotyczących zgodności lub w celu wsparcia inteligentnego przeszukiwania archiwów dokumentów. Według Amazona Textract może „dokładnie” przetworzyć miliony stron różnych dokumentów w „zaledwie kilka godzin”.

Wielu klientów AWS korzysta już z Textract, w tym Globe and Mail, brytyjska National Weather Service, PricewaterhouseCoopers, organizacja non-profit Healthfirst zajmująca się opieką zarządzaną oraz firmy zajmujące się automatyzacją procesów UiPath, Ripcord i Blue Prism. Candor, startup, którego celem jest zapewnienie przejrzystości w branży kredytów hipotecznych, wykorzystuje Texttract do wyodrębniania danych z dokumentów, takich jak wyciągi bankowe, odcinki wypłat i różne dokumenty podatkowe, aby przyspieszyć proces zatwierdzania pożyczki dla swoich klientów.

„Moc Amazon Textract polega na tym, że dokładnie wyodrębnia tekst i dane strukturalne z praktycznie dowolnego dokumentu bez potrzeby zaawansowanego uczenia maszynowego” – powiedział Swami Sivasubramanian, wiceprezes Amazon Machine Learning. „Oprócz integracji z innymi usługami AWS, duża społeczność rosnąca wokół Amazon Textract pozwala naszym klientom czerpać rzeczywistą wartość ze swoich zbiorów plików, pracować wydajniej, poprawiać zgodność z wymogami bezpieczeństwa, automatyzować wprowadzanie danych i przyspieszać decyzje biznesowe”.

Poniżej możesz obejrzeć prezentację Textract na konferencji re:Invent 2018 w języku angielskim.



Źródło: 3dnews.ru

Dodaj komentarz