Amazon meluncurkan layanan cloud untuk pengenalan dokumen

Apakah Anda perlu mengekstrak informasi dari banyak dokumen dengan cepat dan otomatis? Dan apakah juga disimpan dalam bentuk scan atau foto? Anda beruntung jika Anda adalah pelanggan Amazon Web Services (AWS). Amazon mengumumkan pembukaan akses ke Teks, layanan berbasis cloud dan terkelola sepenuhnya yang menggunakan pembelajaran mesin untuk menganalisis tabel, formulir teks, dan seluruh halaman teks dalam format elektronik populer. Untuk saat ini, Textract hanya akan tersedia di wilayah AWS tertentu, khususnya AS Timur (Ohio dan Virginia Utara), AS Barat (Oregon), dan UE (Irlandia), namun tahun depan Textract akan tersedia untuk semua orang.

Amazon meluncurkan layanan cloud untuk pengenalan dokumen

Menurut Amazon, Textract secara signifikan lebih efisien dibandingkan sistem pengenalan karakter optik konvensional. Dari file yang disimpan dalam bucket Amazon S3, ia dapat mengekstrak konten bidang dan tabel berdasarkan konteks penyajian informasi tersebut, seperti secara otomatis menyorot nama dan nomor Jaminan Sosial pada formulir pajak atau total pada tanda terima yang difoto. Seperti yang dicatat Amazon jumpa pers, Textract mendukung format gambar seperti pindaian, PDF, dan foto, dan bekerja secara efektif dengan konteks dalam dokumen khusus untuk layanan keuangan, asuransi, dan perawatan kesehatan.

Textract menyimpan hasil dalam format JSON, dianotasi dengan nomor halaman, bagian, label formulir, dan tipe data, dan secara opsional terintegrasi dengan basis data dan layanan analitik seperti Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena, dan produk pembelajaran mesin, seperti Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate, dan Amazon SageMaker untuk pasca-pemrosesan. Alternatifnya, data yang diekstraksi dapat ditransfer langsung ke layanan cloud pihak ketiga untuk tujuan kepatuhan akuntansi dan audit atau untuk mendukung pencarian arsip dokumen secara cerdas. Menurut Amazon, Textract dapat “secara akurat” memproses jutaan halaman dokumen berbeda “hanya dalam beberapa jam.”

Banyak pelanggan AWS yang telah menggunakan Textract, termasuk Globe and Mail, Layanan Cuaca Nasional Inggris, PricewaterhouseCoopers, organisasi perawatan terkelola nirlaba Healthfirst, dan perusahaan otomatisasi proses robotik UiPath, Ripcord, dan Blue Prism. Candor, sebuah startup yang bertujuan untuk menghadirkan transparansi pada industri hipotek, menggunakan Textract untuk mengekstrak data dari dokumen seperti laporan bank, bukti pembayaran, dan berbagai dokumen pajak untuk mempercepat proses persetujuan pinjaman bagi pelanggannya.

“Kelebihan Amazon Textract adalah secara akurat mengekstrak teks dan data terstruktur dari hampir semua dokumen tanpa memerlukan pembelajaran mesin tingkat lanjut,” kata Swami Sivasubramanian, wakil presiden Amazon Machine Learning. “Selain integrasi dengan layanan AWS lainnya, komunitas besar yang berkembang di sekitar Amazon Textract memungkinkan pelanggan kami memperoleh nilai nyata dari koleksi file mereka, bekerja lebih efisien, meningkatkan kepatuhan keamanan, mengotomatiskan entri data, dan mempercepat keputusan bisnis.”

Di bawah ini Anda dapat menyaksikan presentasi Textract pada konferensi re:Invent 2018 dalam bahasa Inggris.



Sumber: 3dnews.ru

Tambah komentar