Amazon เปิดตัวบริการคลาวด์สำหรับการจดจำเอกสาร

คุณต้องการดึงข้อมูลจากเอกสารหลายฉบับอย่างรวดเร็วและอัตโนมัติหรือไม่? และจัดเก็บไว้ในรูปแบบการสแกนหรือรูปถ่ายด้วยหรือไม่ คุณโชคดีหากคุณเป็นลูกค้า Amazon Web Services (AWS) Amazon ประกาศเปิดให้เข้าถึง ข้อความซึ่งเป็นบริการบนคลาวด์และการจัดการเต็มรูปแบบที่ใช้การเรียนรู้ของเครื่องเพื่อวิเคราะห์ตาราง แบบฟอร์มข้อความ และข้อความทั้งหน้าในรูปแบบอิเล็กทรอนิกส์ยอดนิยม สำหรับตอนนี้ จะพร้อมใช้งานในภูมิภาค AWS ที่เลือกเท่านั้น โดยเฉพาะสหรัฐอเมริกาตะวันออก (โอไฮโอและเวอร์จิเนียตอนเหนือ) สหรัฐอเมริกาตะวันตก (ออริกอน) และสหภาพยุโรป (ไอร์แลนด์) แต่ในปีหน้า Textract จะพร้อมใช้งานสำหรับทุกคน

Amazon เปิดตัวบริการคลาวด์สำหรับการจดจำเอกสาร

จากข้อมูลของ Amazon ระบุว่า Textract มีประสิทธิภาพมากกว่าระบบการรู้จำอักขระด้วยแสงแบบทั่วไปอย่างมาก จากไฟล์ที่จัดเก็บไว้ในบัคเก็ต Amazon S3 สามารถแยกเนื้อหาของฟิลด์และตารางตามบริบทที่นำเสนอข้อมูลนั้น เช่น การเน้นชื่อและหมายเลขประกันสังคมในแบบฟอร์มภาษีหรือผลรวมในใบเสร็จรับเงินที่มีรูปถ่ายโดยอัตโนมัติ ดังที่ Amazon บันทึกไว้ใน ข่าวประชาสัมพันธ์, Textract รองรับรูปแบบภาพ เช่น ภาพสแกน, PDF และรูปถ่าย และทำงานอย่างมีประสิทธิภาพกับบริบทในเอกสารเฉพาะด้านบริการทางการเงิน การประกันภัย และการดูแลสุขภาพ

ข้อความจัดเก็บผลลัพธ์ในรูปแบบ JSON พร้อมคำอธิบายประกอบด้วยหมายเลขหน้า ส่วน ป้ายกำกับแบบฟอร์ม และประเภทข้อมูล และอาจรวมเข้ากับบริการฐานข้อมูลและการวิเคราะห์ เช่น Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena และผลิตภัณฑ์การเรียนรู้ของเครื่อง เช่น Amazon Comprehend , Amazon Comprehend Medical, Amazon Translate และ Amazon SageMaker สำหรับการประมวลผลภายหลัง อีกทางหนึ่ง ข้อมูลที่แยกออกมาสามารถถ่ายโอนโดยตรงไปยังบริการคลาวด์ของบุคคลที่สามเพื่อวัตถุประสงค์ด้านบัญชีและการตรวจสอบการปฏิบัติตามข้อกำหนด หรือเพื่อรองรับการค้นหาเอกสารที่เก็บถาวรอย่างชาญฉลาด ตามข้อมูลของ Amazon Textract สามารถประมวลผลเอกสารต่างๆ หลายล้านหน้าได้อย่าง “แม่นยำ” ภายใน “เพียงไม่กี่ชั่วโมง”

ลูกค้า AWS จำนวนมากใช้ Textract อยู่แล้ว รวมถึง Globe and Mail, National Weather Service ของสหราชอาณาจักร, PricewaterhouseCoopers, Healthfirst องค์กรการดูแลจัดการที่ไม่แสวงหากำไร และบริษัทระบบอัตโนมัติด้านกระบวนการหุ่นยนต์ UiPath, Ripcord และ Blue Prism Candor สตาร์ทอัพที่มุ่งสร้างความโปร่งใสให้กับอุตสาหกรรมสินเชื่อที่อยู่อาศัย ใช้ Textract เพื่อดึงข้อมูลจากเอกสารต่างๆ เช่น ใบแจ้งยอดธนาคาร ต้นขั้วการจ่ายเงิน และเอกสารภาษีต่างๆ เพื่อเร่งกระบวนการอนุมัติสินเชื่อให้กับลูกค้า

“พลังของ Amazon Textract คือการดึงข้อความและข้อมูลที่มีโครงสร้างจากเอกสารแทบทุกชนิดได้อย่างแม่นยำ โดยไม่จำเป็นต้องใช้การเรียนรู้ของเครื่องขั้นสูง” Swami Sivasubramanian รองประธานของ Amazon Machine Learning กล่าว “นอกเหนือจากการผสานรวมกับบริการอื่นๆ ของ AWS แล้ว ชุมชนขนาดใหญ่ที่เติบโตรอบๆ Amazon Textract ยังช่วยให้ลูกค้าของเราได้รับคุณค่าที่แท้จริงจากการรวบรวมไฟล์ ทำงานอย่างมีประสิทธิภาพมากขึ้น ปรับปรุงการปฏิบัติตามข้อกำหนดด้านความปลอดภัย ป้อนข้อมูลอัตโนมัติ และเร่งการตัดสินใจทางธุรกิจ”

คุณสามารถดูการนำเสนอของ Textract ได้ในการประชุม re:Invent 2018 เป็นภาษาอังกฤษที่ด้านล่างนี้



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น