பிக் டேட்டாவின் சகாப்தத்தின் சரிவு

பிக் டேட்டாவின் சகாப்தம் முடிவுக்கு வந்துவிட்டது என்பதை பல வெளிநாட்டு ஆசிரியர்கள் ஒப்புக்கொள்கிறார்கள். இந்த விஷயத்தில், பிக் டேட்டா என்ற சொல் ஹடூப்பை அடிப்படையாகக் கொண்ட தொழில்நுட்பங்களைக் குறிக்கிறது. பிக் டேட்டா இந்த உலகத்தை விட்டு வெளியேறிய தேதியையும், இந்த தேதி 05.06.2019/XNUMX/XNUMX என்பதையும் பல ஆசிரியர்கள் நம்பிக்கையுடன் பெயரிடலாம்.

இந்த முக்கியமான நாளில் என்ன நடந்தது?

இந்த நாளில், MAPR மேலும் செயல்பாட்டிற்கான நிதியைக் கண்டுபிடிக்க முடியாவிட்டால், அதன் வேலையை இடைநிறுத்துவதாக உறுதியளித்தது. MAPR பின்னர் ஆகஸ்ட் 2019 இல் HP ஆல் வாங்கப்பட்டது. ஆனால் ஜூன் மாதத்திற்குத் திரும்பும்போது, ​​பிக் டேட்டா சந்தைக்கான இந்தக் காலகட்டத்தின் சோகத்தை ஒருவர் கவனிக்காமல் இருக்க முடியாது. இந்த மாதம் சந்தையில் ஒரு முன்னணி நிறுவனமான CLOUDERA இன் பங்கு விலைகளில் சரிவைக் கண்டது, இது அதே ஆண்டு ஜனவரியில் நீண்டகாலமாக லாபம் ஈட்டாத HORTOWORKS உடன் இணைந்தது. சரிவு மிகவும் குறிப்பிடத்தக்கதாக இருந்தது மற்றும் 43% ஆக இருந்தது; இறுதியில், CLOUDERA இன் மூலதனம் 4,1 முதல் 1,4 பில்லியன் டாலர்களாக குறைந்தது.

ஹடூப் அடிப்படையிலான தொழில்நுட்பங்கள் துறையில் ஒரு குமிழி பற்றிய வதந்திகள் டிசம்பர் 2014 முதல் பரவி வருகின்றன, ஆனால் அது தைரியமாக கிட்டத்தட்ட ஐந்து ஆண்டுகள் நீடித்தது என்று சொல்ல முடியாது. இந்த வதந்திகள் ஹடூப் தொழில்நுட்பம் தோன்றிய நிறுவனமான கூகுள் அதன் கண்டுபிடிப்பிலிருந்து மறுத்ததை அடிப்படையாகக் கொண்டது. ஆனால் கிளவுட் செயலாக்க கருவிகளுக்கு நிறுவனங்களின் மாற்றம் மற்றும் செயற்கை நுண்ணறிவின் விரைவான வளர்ச்சியின் போது தொழில்நுட்பம் வேரூன்றியது. எனவே, திரும்பிப் பார்க்கும்போது, ​​மரணம் எதிர்பார்த்ததுதான் என்று நம்பிக்கையுடன் சொல்லலாம்.

இவ்வாறு, பிக் டேட்டாவின் சகாப்தம் முடிவுக்கு வந்துவிட்டது, ஆனால் பிக் டேட்டாவில் பணிபுரியும் செயல்பாட்டில், நிறுவனங்கள் அதில் பணிபுரியும் அனைத்து நுணுக்கங்களையும், பிக் டேட்டா வணிகத்திற்கு கொண்டு வரக்கூடிய நன்மைகளையும் உணர்ந்துள்ளன, மேலும் செயற்கையாகப் பயன்படுத்தவும் கற்றுக்கொண்டன. மூல தரவுகளிலிருந்து மதிப்பைப் பிரித்தெடுக்கும் நுண்ணறிவு.

இந்த தொழில்நுட்பத்தை மாற்றுவது எது மற்றும் பகுப்பாய்வு தொழில்நுட்பங்கள் எவ்வாறு மேலும் வளர்ச்சியடையும் என்ற கேள்வி மிகவும் சுவாரஸ்யமானது.

ஆக்மென்ட்டட் அனலிட்டிக்ஸ்

விவரிக்கப்பட்ட நிகழ்வுகளின் போது, ​​தரவு பகுப்பாய்வு துறையில் பணிபுரியும் நிறுவனங்கள் இன்னும் உட்காரவில்லை. 2019 இல் நடந்த பரிவர்த்தனைகள் பற்றிய தகவலின் அடிப்படையில் என்ன தீர்மானிக்க முடியும். இந்த ஆண்டு, சந்தையில் மிகப்பெரிய பரிவர்த்தனை மேற்கொள்ளப்பட்டது - 15,7 பில்லியன் டாலருக்கு சேல்ஸ்ஃபோர்ஸால் பகுப்பாய்வு தளமான டேபிலோவை கையகப்படுத்தியது. கூகுளுக்கும் லுக்கருக்கும் இடையே ஒரு சிறிய ஒப்பந்தம் ஏற்பட்டது. நிச்சயமாக, பெரிய தரவு தளமான அட்யூனிட்டியை க்ளிக் கையகப்படுத்தியதை ஒருவர் கவனிக்கத் தவற முடியாது.

BI சந்தைத் தலைவர்கள் மற்றும் கார்ட்னர் நிபுணர்கள் தரவு பகுப்பாய்வுக்கான அணுகுமுறைகளில் ஒரு மகத்தான மாற்றத்தை அறிவிக்கிறார்கள்; இந்த மாற்றம் BI சந்தையை முற்றிலுமாக அழித்து, BI ஐ AI உடன் மாற்றுவதற்கு வழிவகுக்கும். இந்த சூழலில், AI என்ற சுருக்கமானது "செயற்கை நுண்ணறிவு" அல்ல, மாறாக "ஆக்மென்டட் இன்டலிஜென்ஸ்" என்பதை கவனத்தில் கொள்ள வேண்டும். "ஆக்மென்டட் அனலிட்டிக்ஸ்" என்ற வார்த்தைகளுக்குப் பின்னால் என்ன இருக்கிறது என்பதை இன்னும் விரிவாகப் பார்ப்போம்.

ஆக்மென்ட்டட் ஆனாலிட்டிக்ஸ், ஆக்மென்ட்டட் ரியாலிட்டி போன்றது, பல பொதுவான போஸ்டுலேட்டுகளை அடிப்படையாகக் கொண்டது:

  • NLP (இயற்கை மொழி செயலாக்கம்) ஐப் பயன்படுத்தி தொடர்பு கொள்ளும் திறன், அதாவது. மனித மொழியில்;
  • செயற்கை நுண்ணறிவின் பயன்பாடு, இதன் பொருள் இயந்திர நுண்ணறிவு மூலம் தரவு முன்கூட்டியே செயலாக்கப்படும்;
  • நிச்சயமாக, செயற்கை நுண்ணறிவால் உருவாக்கப்பட்ட சிஸ்டத்தின் பயனருக்குப் பரிந்துரைகள் கிடைக்கின்றன.

பகுப்பாய்வு தளங்களின் உற்பத்தியாளர்களின் கூற்றுப்படி, SQL அல்லது ஒத்த ஸ்கிரிப்டிங் மொழி பற்றிய அறிவு போன்ற சிறப்பு திறன்கள் இல்லாத, புள்ளிவிவர அல்லது கணித பயிற்சி இல்லாத, பிரபலமான மொழிகளில் அறிவு இல்லாத பயனர்களுக்கு அவற்றின் பயன்பாடு கிடைக்கும். தரவு செயலாக்கம் மற்றும் தொடர்புடைய நூலகங்களில் நிபுணத்துவம் பெற்றது. "சிட்டிசன் டேட்டா சயின்டிஸ்ட்ஸ்" என்று அழைக்கப்படும் அத்தகைய நபர்கள், சிறந்த வணிகத் தகுதிகளை மட்டுமே கொண்டிருக்க வேண்டும். செயற்கை நுண்ணறிவு அவர்களுக்கு அளிக்கும் குறிப்புகள் மற்றும் முன்னறிவிப்புகளிலிருந்து வணிக நுண்ணறிவுகளைப் பெறுவதே அவர்களின் பணியாகும், மேலும் அவர்கள் NLP ஐப் பயன்படுத்தி தங்கள் யூகங்களைச் செம்மைப்படுத்தலாம்.

இந்த வகுப்பின் அமைப்புகளுடன் பணிபுரியும் பயனர்களின் செயல்முறையை விவரிக்கும், பின்வரும் படத்தை ஒருவர் கற்பனை செய்யலாம். ஒரு நபர், பணிக்கு வந்து, அதனுடன் தொடர்புடைய பயன்பாட்டைத் தொடங்குகிறார், வழக்கமான அணுகுமுறைகள் (வரிசைப்படுத்துதல், குழுவாக்கம், எண்கணித செயல்பாடுகளைச் செய்தல்) பயன்படுத்தி பகுப்பாய்வு செய்யக்கூடிய வழக்கமான அறிக்கைகள் மற்றும் டாஷ்போர்டுகளுக்கு கூடுதலாக, சில குறிப்புகள் மற்றும் பரிந்துரைகளைப் பார்க்கிறார்: “இதில் கேபிஐ, விற்பனை எண்ணிக்கையை அடைய, "தோட்டம்" வகையிலிருந்து தயாரிப்புகளுக்கு தள்ளுபடியைப் பயன்படுத்த வேண்டும்." கூடுதலாக, ஒரு நபர் கார்ப்பரேட் தூதரை தொடர்பு கொள்ளலாம்: ஸ்கைப், ஸ்லாக் போன்றவை. உரை அல்லது குரல் மூலம் ரோபோ கேள்விகளைக் கேட்கலாம்: "அதிக லாபம் தரும் ஐந்து வாடிக்கையாளர்களைக் கொடுங்கள்." பொருத்தமான பதிலைப் பெற்ற பிறகு, அவர் தனது வணிக அனுபவத்தின் அடிப்படையில் சிறந்த முடிவை எடுத்து நிறுவனத்திற்கு லாபத்தை கொண்டு வர வேண்டும்.

நீங்கள் ஒரு படி பின்வாங்கி, பகுப்பாய்வு செய்யப்படும் தகவலின் கலவையைப் பார்த்தால், இந்த கட்டத்தில், பெரிதாக்கப்பட்ட பகுப்பாய்வு தயாரிப்புகள் மக்களின் வாழ்க்கையை எளிதாக்கும். வெறுமனே, பயனர் விரும்பிய தகவலின் ஆதாரங்களுக்கு பகுப்பாய்வு தயாரிப்பை மட்டுமே சுட்டிக்காட்ட வேண்டும் என்று கருதப்படுகிறது, மேலும் நிரல் ஒரு தரவு மாதிரியை உருவாக்குதல், அட்டவணைகள் மற்றும் ஒத்த பணிகளை இணைப்பதில் கவனம் செலுத்தும்.

இவை அனைத்தும், முதலில், தரவுகளின் "ஜனநாயகமயமாக்கலை" உறுதி செய்ய வேண்டும், அதாவது. எந்தவொரு நபரும் நிறுவனத்திற்குக் கிடைக்கும் தகவல்களின் முழு வரிசையையும் பகுப்பாய்வு செய்யலாம். முடிவெடுக்கும் செயல்முறையானது புள்ளிவிவர பகுப்பாய்வு முறைகளால் ஆதரிக்கப்பட வேண்டும். தரவு அணுகல் நேரம் குறைவாக இருக்க வேண்டும், எனவே ஸ்கிரிப்டுகள் மற்றும் SQL வினவல்களை எழுத வேண்டிய அவசியமில்லை. நிச்சயமாக, அதிக ஊதியம் பெறும் டேட்டா சயின்ஸ் நிபுணர்களிடம் பணத்தைச் சேமிக்கலாம்.

அனுமானமாக, தொழில்நுட்பம் வணிகத்திற்கான மிகவும் பிரகாசமான வாய்ப்புகளை வழங்குகிறது.

பிக் டேட்டாவை மாற்றுவது எது

ஆனால், உண்மையில், நான் எனது கட்டுரையை பிக் டேட்டாவுடன் தொடங்கினேன். நவீன BI கருவிகளில் ஒரு சுருக்கமான பயணம் இல்லாமல் இந்த தலைப்பை என்னால் உருவாக்க முடியவில்லை, இதன் அடிப்படை பெரும்பாலும் பெரிய தரவு ஆகும். பெரிய தரவுகளின் தலைவிதி இப்போது தெளிவாக தீர்மானிக்கப்பட்டுள்ளது, மேலும் இது கிளவுட் தொழில்நுட்பமாகும். இப்போது ஒவ்வொரு பகுப்பாய்வு முறையிலும் கிளவுட் ஸ்டோரேஜ் உள்ளது என்பதையும், கிளவுட் சேவைகள் முன் முனையாக BI இருப்பதையும் நிரூபிப்பதற்காக BI விற்பனையாளர்களுடன் செய்யப்படும் பரிவர்த்தனைகளில் கவனம் செலுத்தினேன்.

ORACLE மற்றும் Microsoft போன்ற தரவுத்தளத் துறையில் உள்ள தூண்களைப் பற்றி மறந்துவிடாமல், வணிக வளர்ச்சியின் அவர்கள் தேர்ந்தெடுத்த திசையை கவனிக்க வேண்டியது அவசியம், இது மேகம். வழங்கப்படும் அனைத்து சேவைகளையும் கிளவுட்டில் காணலாம், ஆனால் சில கிளவுட் சேவைகள் இனி வளாகத்தில் கிடைக்காது. இயந்திர கற்றல் மாதிரிகள், பயனர்களுக்கு கிடைக்கக்கூடிய நூலகங்களை உருவாக்குதல் மற்றும் மாடல்களைத் தேர்ந்தெடுப்பதில் இருந்து தொடக்க நேரத்தை அமைப்பது வரை எளிதாக வேலை செய்வதற்கான இடைமுகங்களை உள்ளமைத்தல் ஆகியவற்றில் அவர்கள் குறிப்பிடத்தக்க பணிகளைச் செய்துள்ளனர்.

கிளவுட் சேவைகளைப் பயன்படுத்துவதன் மற்றொரு முக்கியமான நன்மை, உற்பத்தியாளர்களால் குரல் கொடுக்கப்படுகிறது, பயிற்சி மாதிரிகளுக்கான எந்தவொரு தலைப்பிலும் கிட்டத்தட்ட வரம்பற்ற தரவுத் தொகுப்புகள் கிடைக்கும்.

இருப்பினும், கேள்வி எழுகிறது: கிளவுட் தொழில்நுட்பங்கள் நம் நாட்டில் எவ்வளவு தூரம் வேர் எடுக்கும்?

ஆதாரம்: www.habr.com

கருத்தைச் சேர்