Amazon belge tanıma için bulut hizmetini başlattı

Birden fazla belgeden hızlı ve otomatik olarak bilgi çıkarmanız mı gerekiyor? Ayrıca bunlar tarama veya fotoğraf biçiminde mi saklanıyor? Amazon Web Services (AWS) müşterisiyseniz şanslısınız. Amazon, erişime açıldığını duyurdu TekstüreTabloları, metin formlarını ve popüler elektronik formatlardaki tüm metin sayfalarını analiz etmek için makine öğrenimini kullanan bulut tabanlı ve tam olarak yönetilen bir hizmettir. Şimdilik yalnızca belirli AWS bölgelerinde, özellikle Doğu ABD (Ohio ve Kuzey Virginia), Batı ABD (Oregon) ve AB'de (İrlanda) mevcut olacak, ancak gelecek yıl Textract herkesin kullanımına sunulacak.

Amazon belge tanıma için bulut hizmetini başlattı

Amazon'a göre Texttract, geleneksel optik karakter tanıma sistemlerinden çok daha verimli. Amazon S3 klasöründe depolanan dosyalardan, alanların ve tabloların içeriklerini, vergi formlarındaki adların ve Sosyal Güvenlik numaralarının veya fotoğraflı makbuzlardaki toplamların otomatik olarak vurgulanması gibi bilgilerin sunulduğu bağlama göre çıkarabilir. Amazon'un belirttiği gibi basın bülteni, Texttract taramalar, PDF'ler ve fotoğraflar gibi görüntü formatlarını destekler ve finansal hizmetler, sigorta ve sağlık hizmetlerine özgü belgelerde bağlamla etkili bir şekilde çalışır.

Textract, sonuçları sayfa numaraları, bölümler, form etiketleri ve veri türleriyle açıklamalı olarak JSON biçiminde saklar ve isteğe bağlı olarak Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena gibi veritabanı ve analiz hizmetleriyle ve Amazon Comprehend gibi makine öğrenimi ürünleriyle entegre olur. İşlem sonrası için , Amazon Comprehend Medical, Amazon Translate ve Amazon SageMaker. Alternatif olarak, çıkarılan veriler, muhasebe ve denetim uyumluluk amaçları için veya belge arşivlerinde akıllı aramaları desteklemek amacıyla doğrudan üçüncü taraf bulut hizmetlerine aktarılabilir. Amazon'a göre Textract, milyonlarca sayfalık farklı belgeyi "sadece birkaç saat içinde" "doğru" şekilde işleyebiliyor.

Globe and Mail, Birleşik Krallık Ulusal Hava Durumu Servisi, PricewaterhouseCoopers, kar amacı gütmeyen yönetilen bakım kuruluşu Healthfirst ve robotik süreç otomasyon şirketleri UiPath, Ripcord ve Blue Prism dahil çok sayıda AWS müşterisi halihazırda Textract'ı kullanıyor. Mortgage sektörüne şeffaflık getirmeyi amaçlayan bir girişim olan Candor, müşterilerinin kredi onay sürecini hızlandırmak amacıyla banka ekstreleri, maaş bordroları ve çeşitli vergi belgeleri gibi belgelerden veri çıkarmak için Textract'ı kullanıyor.

Amazon Machine Learning başkan yardımcısı Swami Sivasubramanian, "Amazon Textract'ın gücü, gelişmiş makine öğrenimine ihtiyaç duymadan hemen hemen her belgeden metni ve yapılandırılmış verileri doğru bir şekilde çıkarmasıdır" dedi. "Amazon Textract çevresinde büyüyen büyük topluluk, diğer AWS hizmetleriyle entegrasyonun yanı sıra, müşterilerimizin dosya koleksiyonlarından gerçek değer elde etmesine, daha verimli çalışmasına, güvenlik uyumluluğunu geliştirmesine, veri girişini otomatikleştirmesine ve iş kararlarını hızlandırmasına olanak tanıyor."

Aşağıda Texttract'ın re:Invent 2018 konferansındaki sunumunu İngilizce olarak izleyebilirsiniz.



Kaynak: 3dnews.ru

Yorum ekle