அமேசான் ஆவண அங்கீகாரத்திற்காக கிளவுட் சேவையை அறிமுகப்படுத்துகிறது

பல ஆவணங்களிலிருந்து தகவல்களை விரைவாகவும் தானாகவும் பிரித்தெடுக்க வேண்டுமா? மேலும் அவை ஸ்கேன் அல்லது புகைப்படங்கள் வடிவில் சேமிக்கப்பட்டுள்ளதா? நீங்கள் Amazon Web Services (AWS) வாடிக்கையாளராக இருந்தால் நீங்கள் அதிர்ஷ்டசாலி. அமேசான் அணுகலைத் திறப்பதாக அறிவித்தது உரை, பிரபலமான மின்னணு வடிவங்களில் அட்டவணைகள், உரை வடிவங்கள் மற்றும் உரையின் முழுப் பக்கங்களையும் பகுப்பாய்வு செய்ய இயந்திரக் கற்றலைப் பயன்படுத்தும் கிளவுட் அடிப்படையிலான மற்றும் முழுமையாக நிர்வகிக்கப்படும் சேவை. இப்போதைக்கு, இது தேர்ந்தெடுக்கப்பட்ட AWS பிராந்தியங்களில் மட்டுமே கிடைக்கும், குறிப்பாக கிழக்கு அமெரிக்கா (ஓஹியோ மற்றும் வடக்கு வர்ஜீனியா), மேற்கு யுஎஸ் (ஓரிகான்) மற்றும் EU (அயர்லாந்து), ஆனால் அடுத்த ஆண்டு உரை அனைவருக்கும் கிடைக்கும்.

அமேசான் ஆவண அங்கீகாரத்திற்காக கிளவுட் சேவையை அறிமுகப்படுத்துகிறது

அமேசானின் கூற்றுப்படி, வழக்கமான ஆப்டிகல் கேரக்டர் அங்கீகார அமைப்புகளை விட டெக்ஸ்ட்ராக்ட் மிகவும் திறமையானது. அமேசான் S3 வாளியில் சேமிக்கப்பட்ட கோப்புகளிலிருந்து, அந்தத் தகவல் வழங்கப்படும் சூழலின் அடிப்படையில் புலங்கள் மற்றும் அட்டவணைகளின் உள்ளடக்கங்களைப் பிரித்தெடுக்க முடியும், அதாவது வரிப் படிவங்களில் பெயர்கள் மற்றும் சமூகப் பாதுகாப்பு எண்கள் அல்லது புகைப்படம் எடுக்கப்பட்ட ரசீதுகளின் மொத்தங்கள். அமேசான் குறிப்பிடுவது போல செய்தி வெளியீடு, டெக்ஸ்ட்ராக்ட் ஸ்கேன்கள், PDFகள் மற்றும் புகைப்படங்கள் போன்ற பட வடிவங்களை ஆதரிக்கிறது, மேலும் நிதிச் சேவைகள், காப்பீடு மற்றும் சுகாதாரப் பாதுகாப்பு தொடர்பான ஆவணங்களின் சூழலில் திறம்பட செயல்படுகிறது.

பக்க எண்கள், பிரிவுகள், படிவ லேபிள்கள் மற்றும் தரவு வகைகளுடன் சிறுகுறிப்பு செய்யப்பட்ட JSON வடிவத்தில் டெக்ஸ்ட்ராக்ட் முடிவுகளை சேமிக்கிறது, மேலும் Amazon Elasticsearch Service, Amazon DynamoDB, Amazon Athena மற்றும் Amazon Comprehend போன்ற இயந்திர கற்றல் தயாரிப்புகள் போன்ற தரவுத்தள மற்றும் பகுப்பாய்வு சேவைகளுடன் விருப்பமாக ஒருங்கிணைக்கிறது. , Amazon Comprehend Medical, Amazon Translate மற்றும் Amazon SageMaker பின் செயலாக்கத்திற்கு. மாற்றாக, கணக்கியல் மற்றும் தணிக்கை இணக்க நோக்கங்களுக்காக அல்லது ஆவணக் காப்பகங்களின் அறிவார்ந்த தேடல்களை ஆதரிக்க, பிரித்தெடுக்கப்பட்ட தரவை நேரடியாக மூன்றாம் தரப்பு கிளவுட் சேவைகளுக்கு மாற்றலாம். அமேசானின் கூற்றுப்படி, டெக்ஸ்ட்ராக்ட் வெவ்வேறு ஆவணங்களின் மில்லியன் கணக்கான பக்கங்களை "சில மணிநேரங்களில்" "துல்லியமாக" செயலாக்க முடியும்.

பல AWS வாடிக்கையாளர்கள் ஏற்கனவே Textract ஐப் பயன்படுத்துகின்றனர், இதில் Globe and Mail, UK இன் தேசிய வானிலை சேவை, PricewaterhouseCoopers, இலாப நோக்கற்ற நிர்வகிக்கப்படும் பராமரிப்பு நிறுவனமான Healthfirst மற்றும் ரோபோடிக் செயல்முறை ஆட்டோமேஷன் நிறுவனங்களான UiPath, Ripcord மற்றும் Blue Prism ஆகியவை அடங்கும். அடமானத் தொழிலில் வெளிப்படைத்தன்மையைக் கொண்டுவருவதை நோக்கமாகக் கொண்ட ஒரு தொடக்க நிறுவனமான Candor, அதன் வாடிக்கையாளர்களுக்கான கடன் ஒப்புதல் செயல்முறையை விரைவுபடுத்த வங்கி அறிக்கைகள், பணம் செலுத்துதல் மற்றும் பல்வேறு வரி ஆவணங்கள் போன்ற ஆவணங்களிலிருந்து தரவைப் பிரித்தெடுக்க உரையைப் பயன்படுத்துகிறது.

அமேசான் மெஷின் லேர்னிங்கின் துணைத் தலைவர் சுவாமி சிவசுப்ரமணியன் கூறுகையில், "அமேசான் டெக்ஸ்ட்ராக்டின் சக்தி என்னவென்றால், எந்தவொரு ஆவணத்திலிருந்தும் எந்த ஆவணத்திலிருந்தும் துல்லியமாக உரை மற்றும் கட்டமைக்கப்பட்ட தரவைப் பிரித்தெடுக்கிறது" என்று Amazon Machine Learning இன் துணைத் தலைவர் சுவாமி சிவசுப்ரமணியன் கூறினார். "பிற AWS சேவைகளுடன் ஒருங்கிணைக்கப்படுவதோடு, அமேசான் உரையைச் சுற்றி வளர்ந்து வரும் பெரிய சமூகம், எங்கள் வாடிக்கையாளர்களுக்கு அவர்களின் கோப்பு சேகரிப்பில் இருந்து உண்மையான மதிப்பைப் பெறவும், திறமையாக வேலை செய்யவும், பாதுகாப்பு இணக்கத்தை மேம்படுத்தவும், தரவு உள்ளீட்டைத் தானியங்குபடுத்தவும், வணிக முடிவுகளை விரைவுபடுத்தவும் அனுமதிக்கிறது."

ஆங்கிலத்தில் re:Invent 2018 மாநாட்டில் நீங்கள் உரையின் விளக்கக்காட்சியை கீழே பார்க்கலாம்.



ஆதாரம்: 3dnews.ru

கருத்தைச் சேர்