தரவு ஏரி தேவையா? தரவுக் கிடங்கை என்ன செய்வது?

இக்கட்டுரை மீடியம் பற்றிய எனது கட்டுரையின் மொழிபெயர்ப்பு - டேட்டா லேக்குடன் தொடங்குதல், இது மிகவும் பிரபலமாக மாறியது, அநேகமாக அதன் எளிமை காரணமாக இருக்கலாம். எனவே, அதை ரஷ்ய மொழியில் எழுதவும், தரவுக் கிடங்கு (DW) என்றால் என்ன, தரவு ஏரி (டேட்டா லேக்) என்றால் என்ன, தரவு நிபுணராக இல்லாத ஒரு சாதாரண நபருக்கு தெளிவுபடுத்த சிறிது சேர்க்க முடிவு செய்தேன். ஒன்றாக பழகுங்கள் .

தரவு ஏரியைப் பற்றி நான் ஏன் எழுத விரும்பினேன்? நான் 10 ஆண்டுகளுக்கும் மேலாக தரவு மற்றும் பகுப்பாய்வுகளுடன் பணிபுரிந்து வருகிறேன், இப்போது நான் வான்கூவர் தீவில் உள்ள விக்டோரியாவில் வசித்து வந்தாலும், பாஸ்டனில் உள்ள கேம்பிரிட்ஜில் உள்ள Amazon Alexa AI இல் பெரிய தரவுகளுடன் பணிபுரிகிறேன். , மற்றும் வான்கூவரில், மற்றும் சில நேரங்களில் மாஸ்கோவில் கூட, நான் மாநாடுகளில் பேசுகிறேன். நானும் அவ்வப்போது எழுதுகிறேன், ஆனால் நான் முக்கியமாக ஆங்கிலத்தில் எழுதுகிறேன், நான் ஏற்கனவே எழுதியுள்ளேன் சில புத்தகங்கள், நான் வட அமெரிக்காவிலிருந்து பகுப்பாய்வு போக்குகளைப் பகிர்ந்து கொள்ள வேண்டிய அவசியம் உள்ளது, நான் சில சமயங்களில் எழுதுகிறேன் தந்தி.

நான் எப்போதும் தரவுக் கிடங்குகளுடன் பணிபுரிந்து வருகிறேன், 2015 ஆம் ஆண்டு முதல் அமேசான் வலை சேவைகளுடன் நெருக்கமாகப் பணியாற்றத் தொடங்கினேன், பொதுவாக கிளவுட் அனலிட்டிக்ஸ் (AWS, Azure, GCP) க்கு மாறினேன். 2007 ஆம் ஆண்டு முதல் பகுப்பாய்வு தீர்வுகளின் பரிணாம வளர்ச்சியை நான் கவனித்து வருகிறேன், மேலும் டேட்டா கிடங்கு விற்பனையாளரான டெராடேட்டாவிற்காகவும் பணிபுரிந்து அதை ஸ்பெர்பேங்கில் செயல்படுத்தினேன், அப்போதுதான் ஹடூப்புடன் பிக் டேட்டா தோன்றியது. ஸ்டோரேஜ் சகாப்தம் கடந்துவிட்டது, இப்போது எல்லாம் ஹடூப்பில் உள்ளது என்று எல்லோரும் சொல்லத் தொடங்கினர், பின்னர் அவர்கள் டேட்டா லேக்கைப் பற்றி பேசத் தொடங்கினர், இப்போது தரவுக் கிடங்கின் முடிவு நிச்சயமாக வந்துவிட்டது. ஆனால் அதிர்ஷ்டவசமாக (துரதிர்ஷ்டவசமாக ஹடூப்பை அமைத்து நிறைய பணம் சம்பாதித்த சிலருக்கு), தரவுக் கிடங்கு போகவில்லை.

இந்த கட்டுரையில் தரவு ஏரி என்றால் என்ன என்று பார்ப்போம். இந்தக் கட்டுரை தரவுக் கிடங்குகளில் சிறிய அல்லது அனுபவம் இல்லாதவர்களுக்காக வடிவமைக்கப்பட்டுள்ளது.

தரவு ஏரி தேவையா? தரவுக் கிடங்கை என்ன செய்வது?

படத்தில் லேக் பிளெட் உள்ளது, இது எனக்கு மிகவும் பிடித்த ஏரிகளில் ஒன்றாகும், நான் ஒரு முறை மட்டுமே இருந்தேன் என்றாலும், என் வாழ்நாள் முழுவதும் அதை நினைவில் வைத்தேன். ஆனால் நாம் மற்றொரு வகை ஏரியைப் பற்றி பேசுவோம் - ஒரு தரவு ஏரி. உங்களில் பலர் ஏற்கனவே இந்த வார்த்தையைப் பற்றி ஒன்றுக்கு மேற்பட்ட முறை கேள்விப்பட்டிருக்கலாம், ஆனால் இன்னும் ஒரு வரையறை யாருக்கும் தீங்கு விளைவிக்காது.

முதலில், தரவு ஏரியின் மிகவும் பிரபலமான வரையறைகள் இங்கே:

"அனைத்து வகையான மூல தரவுகளின் கோப்பு சேமிப்பு நிறுவனத்தில் உள்ள எவருக்கும் பகுப்பாய்வு செய்யக் கிடைக்கும்" - மார்ட்டின் ஃபோலர்.

“டேட்டா மார்ட் என்பது ஒரு பாட்டில் தண்ணீர் என்று நீங்கள் நினைத்தால் - சுத்திகரிக்கப்பட்ட, பேக்கேஜ் செய்யப்பட்ட மற்றும் வசதியான நுகர்வுக்காக பேக்கேஜ் செய்யப்பட்ட, டேட்டா லேக் என்பது அதன் இயற்கையான வடிவில் உள்ள ஒரு பெரிய நீர்த்தேக்கமாகும். பயனர்களே, நான் எனக்காக தண்ணீரை சேகரிக்க முடியும், ஆழமாக மூழ்கலாம், ஆராயலாம்" - ஜேம்ஸ் டிக்சன்.

தரவு ஏரி என்பது பகுப்பாய்வுகளைப் பற்றியது என்பதை இப்போது நாங்கள் உறுதியாக அறிவோம், அதன் அசல் வடிவத்தில் பெரிய அளவிலான தரவைச் சேமிக்க இது அனுமதிக்கிறது, மேலும் தரவுக்கான தேவையான மற்றும் வசதியான அணுகல் எங்களிடம் உள்ளது.

நான் அடிக்கடி விஷயங்களை எளிமைப்படுத்த விரும்புகிறேன், ஒரு சிக்கலான சொல்லை எளிய வார்த்தைகளில் என்னால் விளக்க முடிந்தால், அது எவ்வாறு செயல்படுகிறது மற்றும் அது எதற்காக தேவைப்படுகிறது என்பதை நானே புரிந்துகொள்கிறேன். ஒரு நாள், நான் ஐபோன் புகைப்பட கேலரியில் சுற்றிக் கொண்டிருந்தேன், அது எனக்குப் புரிந்தது, இது ஒரு உண்மையான தரவு ஏரி, நான் மாநாடுகளுக்கு ஒரு ஸ்லைடைக் கூட செய்தேன்:

தரவு ஏரி தேவையா? தரவுக் கிடங்கை என்ன செய்வது?

எல்லாம் மிகவும் எளிமையானது. நாங்கள் தொலைபேசியில் புகைப்படம் எடுக்கிறோம், புகைப்படம் தொலைபேசியில் சேமிக்கப்படுகிறது மற்றும் iCloud இல் சேமிக்கப்படும் (கிளவுட் கோப்பு சேமிப்பு). ஃபோன் புகைப்பட மெட்டாடேட்டாவையும் சேகரிக்கிறது: என்ன காட்டப்படுகிறது, ஜியோ டேக், நேரம். இதன் விளைவாக, ஐபோனின் பயனர் நட்பு இடைமுகத்தைப் பயன்படுத்தி எங்கள் புகைப்படத்தைக் கண்டறியலாம், மேலும் குறிகாட்டிகளைக் கூட பார்க்கிறோம், எடுத்துக்காட்டாக, தீ என்ற வார்த்தையுடன் புகைப்படங்களைத் தேடும்போது, ​​​​நெருப்பின் படத்துடன் 3 புகைப்படங்களைக் காண்கிறேன். என்னைப் பொறுத்தவரை, இது ஒரு வணிக நுண்ணறிவு கருவியைப் போன்றது, இது மிக விரைவாகவும் துல்லியமாகவும் வேலை செய்கிறது.

நிச்சயமாக, பாதுகாப்பு (அங்கீகாரம் மற்றும் அங்கீகாரம்) பற்றி நாம் மறந்துவிடக் கூடாது, இல்லையெனில் எங்கள் தரவு பொது களத்தில் எளிதாக முடிவடையும். டெவலப்பர்களின் அலட்சியம் மற்றும் எளிய விதிகளைப் பின்பற்றத் தவறியதால், பெரிய நிறுவனங்கள் மற்றும் ஸ்டார்ட்அப்கள் பற்றிய தகவல்கள் பொதுவில் கிடைத்தன.

அத்தகைய எளிமையான படம் கூட தரவு ஏரி என்றால் என்ன, பாரம்பரிய தரவுக் கிடங்கில் இருந்து அதன் வேறுபாடுகள் மற்றும் அதன் முக்கிய கூறுகளை கற்பனை செய்ய உதவுகிறது:

  1. தரவை ஏற்றுகிறது (உட்கொள்ளுதல்) தரவு ஏரியின் முக்கிய அங்கமாகும். தரவு இரண்டு வழிகளில் தரவுக் கிடங்கில் நுழையலாம் - தொகுதி (இடைவெளியில் ஏற்றுதல்) மற்றும் ஸ்ட்ரீமிங் (தரவு ஓட்டம்).
  2. கோப்பு சேமிப்பு (சேமிப்பு) தரவு ஏரியின் முக்கிய அங்கமாகும். சேமிப்பகம் எளிதில் அளவிடக்கூடியதாகவும், மிகவும் நம்பகமானதாகவும், குறைந்த செலவிலும் இருக்க வேண்டும். எடுத்துக்காட்டாக, AWS இல் இது S3 ஆகும்.
  3. பட்டியல் மற்றும் தேடல் (காட்டலாக் மற்றும் தேடல்) - டேட்டா ஸ்வாம்பைத் தவிர்ப்பதற்காக (இது எல்லா தரவையும் ஒரே குவியலில் கொட்டும் போது, ​​பின்னர் அதனுடன் வேலை செய்வது சாத்தியமில்லை), தரவை வகைப்படுத்த ஒரு மெட்டாடேட்டா லேயரை உருவாக்க வேண்டும். இதனால் பயனர்கள் தங்களுக்கு பகுப்பாய்வுக்குத் தேவையான தரவை எளிதாகக் கண்டறிய முடியும். கூடுதலாக, நீங்கள் ElasticSearch போன்ற கூடுதல் தேடல் தீர்வுகளைப் பயன்படுத்தலாம். பயனர் நட்பு இடைமுகம் மூலம் தேவையான தரவைக் கண்டறிய, தேடல் உதவுகிறது.
  4. செயலாக்க (செயல்முறை) - இந்த படியானது தரவை செயலாக்குவதற்கும் மாற்றுவதற்கும் பொறுப்பாகும். நாம் தரவை மாற்றலாம், அதன் கட்டமைப்பை மாற்றலாம், சுத்தம் செய்யலாம் மற்றும் பலவற்றை செய்யலாம்.
  5. பாதுகாப்பு (பாதுகாப்பு) - தீர்வுக்கான பாதுகாப்பு வடிவமைப்பில் நேரத்தை செலவிடுவது முக்கியம். எடுத்துக்காட்டாக, சேமிப்பு, செயலாக்கம் மற்றும் ஏற்றுதல் ஆகியவற்றின் போது தரவு குறியாக்கம். அங்கீகாரம் மற்றும் அங்கீகார முறைகளைப் பயன்படுத்துவது முக்கியம். இறுதியாக, ஒரு தணிக்கை கருவி தேவை.

நடைமுறைக் கண்ணோட்டத்தில், தரவு ஏரியை மூன்று பண்புகளால் வகைப்படுத்தலாம்:

  1. எதையும் சேகரித்து சேமிக்கவும் — தரவு ஏரி அனைத்து தரவுகளையும் கொண்டுள்ளது, எந்த காலத்திற்கும் மூல பதப்படுத்தப்படாத தரவு மற்றும் செயலாக்கப்பட்ட/சுத்தம் செய்யப்பட்ட தரவு.
  2. ஆழமான ஸ்கேன் — தரவு ஏரி பயனர்களை தரவுகளை ஆராயவும் பகுப்பாய்வு செய்யவும் அனுமதிக்கிறது.
  3. நெகிழ்வான அணுகல் — தரவு ஏரி வெவ்வேறு தரவு மற்றும் வெவ்வேறு காட்சிகளுக்கு நெகிழ்வான அணுகலை வழங்குகிறது.

தரவுக் கிடங்கிற்கும் தரவு ஏரிக்கும் உள்ள வித்தியாசத்தைப் பற்றி இப்போது பேசலாம். பொதுவாக மக்கள் கேட்கிறார்கள்:

  • தரவுக் கிடங்கைப் பற்றி என்ன?
  • தரவுக் கிடங்கை டேட்டா லேக் மூலம் மாற்றுகிறோமா அல்லது அதை விரிவுபடுத்துகிறோமா?
  • தரவு ஏரி இல்லாமல் இன்னும் செய்ய முடியுமா?

சுருக்கமாக, தெளிவான பதில் இல்லை. இது அனைத்தும் குறிப்பிட்ட சூழ்நிலை, அணியின் திறன்கள் மற்றும் பட்ஜெட்டைப் பொறுத்தது. எடுத்துக்காட்டாக, தரவுக் கிடங்கை ஆரக்கிளுக்கு AWSக்கு மாற்றுவது மற்றும் அமேசான் துணை நிறுவனமான வூட் மூலம் தரவு ஏரியை உருவாக்குவது எங்கள் தரவு ஏரி கதை: AWS இல் Woot.com ஒரு சர்வர்லெஸ் டேட்டா ஏரியை எவ்வாறு உருவாக்கியது.

மறுபுறம், விற்பனையாளர் ஸ்னோஃப்ளேக் கூறுகையில், தரவு ஏரியைப் பற்றி நீங்கள் இனி சிந்திக்கத் தேவையில்லை, ஏனெனில் அவர்களின் தரவு தளம் (2020 வரை இது ஒரு தரவுக் கிடங்காக இருந்தது) தரவு ஏரி மற்றும் தரவுக் கிடங்கு இரண்டையும் இணைக்க உங்களை அனுமதிக்கிறது. நான் ஸ்னோஃப்ளேக்குடன் அதிகம் வேலை செய்யவில்லை, இது உண்மையிலேயே இதைச் செய்யக்கூடிய ஒரு தனித்துவமான தயாரிப்பு. சிக்கலின் விலை மற்றொரு விஷயம்.

முடிவில், எனது தனிப்பட்ட கருத்து என்னவென்றால், எங்கள் அறிக்கையிடலுக்கான தரவுகளின் முக்கிய ஆதாரமாக எங்களுக்கு இன்னும் ஒரு தரவுக் கிடங்கு தேவை, மேலும் பொருந்தாதவற்றை நாங்கள் தரவு ஏரியில் சேமித்து வைக்கிறோம். பகுப்பாய்வுகளின் முழுப் பணியும் முடிவெடுப்பதற்கு வணிகத்திற்கு எளிதான அணுகலை வழங்குவதாகும். ஒருவர் என்ன சொன்னாலும், வணிகப் பயனர்கள் தரவு ஏரியை விட தரவுக் கிடங்கில் மிகவும் திறமையாக வேலை செய்கிறார்கள், உதாரணமாக Amazon இல் - Redshift (பகுப்பாய்வு தரவுக் கிடங்கு) உள்ளது மற்றும் Redshift Spectrum/Athena (S3 இல் தரவு ஏரிக்கான SQL இடைமுகம்) உள்ளது ஹைவ்/பிரெஸ்டோ). மற்ற நவீன பகுப்பாய்வு தரவுக் கிடங்குகளுக்கும் இது பொருந்தும்.

ஒரு பொதுவான தரவுக் கிடங்கு கட்டமைப்பைப் பார்ப்போம்:

தரவு ஏரி தேவையா? தரவுக் கிடங்கை என்ன செய்வது?

இது ஒரு உன்னதமான தீர்வு. எங்களிடம் மூல அமைப்புகள் உள்ளன, ETL/ELT ஐப் பயன்படுத்தி நாங்கள் தரவை பகுப்பாய்வு தரவுக் கிடங்கில் நகலெடுத்து வணிக நுண்ணறிவு தீர்வுடன் இணைக்கிறோம் (எனக்கு பிடித்த அட்டவணை, உங்களுடையது என்ன?).

இந்த தீர்வு பின்வரும் குறைபாடுகளைக் கொண்டுள்ளது:

  • ETL/ELT செயல்பாடுகளுக்கு நேரம் மற்றும் வளங்கள் தேவை.
  • ஒரு விதியாக, பகுப்பாய்வு தரவுக் கிடங்கில் தரவைச் சேமிப்பதற்கான நினைவகம் மலிவானது அல்ல (எடுத்துக்காட்டாக, Redshift, BigQuery, Teradata), ஏனெனில் நாம் ஒரு முழு கிளஸ்டரையும் வாங்க வேண்டும்.
  • வணிகப் பயனர்கள் சுத்தம் செய்யப்பட்ட மற்றும் அடிக்கடி ஒருங்கிணைக்கப்பட்ட தரவுகளுக்கான அணுகலைக் கொண்டுள்ளனர் மற்றும் மூலத் தரவை அணுக முடியாது.

நிச்சயமாக, இது அனைத்தும் உங்கள் வழக்கைப் பொறுத்தது. உங்கள் தரவுக் கிடங்கில் உங்களுக்குப் பிரச்சனை இல்லை என்றால், உங்களுக்கு டேட்டா லேக் தேவையில்லை. ஆனால் இடமின்மை, சக்தி அல்லது விலை ஆகியவை முக்கிய பங்கு வகிக்கும் போது சிக்கல்கள் எழும் போது, ​​தரவு ஏரியின் விருப்பத்தை நீங்கள் பரிசீலிக்கலாம். இதனால்தான் தரவு ஏரி மிகவும் பிரபலமானது. தரவு ஏரி கட்டிடக்கலைக்கான எடுத்துக்காட்டு இங்கே:
தரவு ஏரி தேவையா? தரவுக் கிடங்கை என்ன செய்வது?
டேட்டா லேக் அணுகுமுறையைப் பயன்படுத்தி, எங்களின் டேட்டா லேக்கில் (தொகுதி அல்லது ஸ்ட்ரீமிங்) மூலத் தரவை ஏற்றுகிறோம், பிறகு தேவைக்கேற்ப தரவைச் செயலாக்குகிறோம். தரவு ஏரி வணிக பயனர்கள் தங்கள் சொந்த தரவு மாற்றங்களை (ETL/ELT) உருவாக்க அல்லது வணிக நுண்ணறிவு தீர்வுகளில் தரவை பகுப்பாய்வு செய்ய அனுமதிக்கிறது (தேவையான இயக்கி இருந்தால்).

எந்தவொரு பகுப்பாய்வு தீர்வின் குறிக்கோள் வணிக பயனர்களுக்கு சேவை செய்வதாகும். எனவே, நாம் எப்போதும் வணிகத் தேவைகளுக்கு ஏற்ப செயல்பட வேண்டும். (அமேசானில் இது கொள்கைகளில் ஒன்றாகும் - பின்னோக்கி வேலை செய்வது).

தரவுக் கிடங்கு மற்றும் தரவு ஏரி இரண்டிலும் வேலை செய்வதன் மூலம், இரண்டு தீர்வுகளையும் நாம் ஒப்பிடலாம்:

தரவு ஏரி தேவையா? தரவுக் கிடங்கை என்ன செய்வது?

தரவுக் கிடங்கு தரவு ஏரியுடன் போட்டியிடவில்லை, மாறாக அதை நிரப்புகிறது என்பது முக்கிய முடிவு. ஆனால் உங்கள் விஷயத்தில் எது சரியானது என்பதை நீங்கள் தீர்மானிக்க வேண்டும். அதை நீங்களே முயற்சி செய்து சரியான முடிவுகளை எடுப்பது எப்போதும் சுவாரஸ்யமானது.

நான் டேட்டா லேக் அணுகுமுறையைப் பயன்படுத்தத் தொடங்கிய சந்தர்ப்பங்களில் ஒன்றையும் உங்களுக்குச் சொல்ல விரும்புகிறேன். எல்லாம் மிகவும் அற்பமானது, நான் ஒரு ELT கருவியைப் பயன்படுத்த முயற்சித்தேன் (எங்களிடம் Matillion ETL இருந்தது) மற்றும் Amazon Redshift, எனது தீர்வு வேலை செய்தது, ஆனால் தேவைகளுக்கு பொருந்தவில்லை.

2 நிகழ்வுகளுக்கான தரவை வழங்க, வலைப் பதிவுகளை எடுத்து, அவற்றை மாற்றி, அவற்றைத் தொகுக்க வேண்டியிருந்தது:

  1. மார்க்கெட்டிங் குழு SEO க்கான போட் செயல்பாட்டை பகுப்பாய்வு செய்ய விரும்பியது
  2. இணையதள செயல்திறன் அளவீடுகளைப் பார்க்க IT விரும்புகிறது

மிக எளிமையான, மிக எளிமையான பதிவுகள். இங்கே ஒரு உதாரணம்:

https 2018-07-02T22:23:00.186641Z app/my-loadbalancer/50dc6c495c0c9188 
192.168.131.39:2817 10.0.0.1:80 0.086 0.048 0.037 200 200 0 57 
"GET https://www.example.com:443/ HTTP/1.1" "curl/7.46.0" ECDHE-RSA-AES128-GCM-SHA256 TLSv1.2 
arn:aws:elasticloadbalancing:us-east-2:123456789012:targetgroup/my-targets/73e2d6bc24d8a067
"Root=1-58337281-1d84f3d73c47ec4e58577259" "www.example.com" "arn:aws:acm:us-east-2:123456789012:certificate/12345678-1234-1234-1234-123456789012"
1 2018-07-02T22:22:48.364000Z "authenticate,forward" "-" "-"

ஒரு கோப்பு 1-4 மெகாபைட் எடை கொண்டது.

ஆனால் ஒரு சிரமம் இருந்தது. எங்களிடம் உலகம் முழுவதும் 7 டொமைன்கள் இருந்தன, ஒரே நாளில் 7000 ஆயிரம் கோப்புகள் உருவாக்கப்பட்டன. இது அதிக அளவு இல்லை, 50 ஜிகாபைட் மட்டுமே. ஆனால் எங்கள் ரெட்ஷிஃப்ட் கிளஸ்டரின் அளவும் சிறியதாக இருந்தது (4 முனைகள்). பாரம்பரிய முறையில் ஒரு கோப்பை ஏற்றுவதற்கு ஒரு நிமிடம் ஆனது. அதாவது, பிரச்சினை தலைகீழாகத் தீர்க்கப்படவில்லை. நான் டேட்டா லேக் அணுகுமுறையைப் பயன்படுத்த முடிவு செய்தபோது இதுதான் நடந்தது. தீர்வு இதைப் போன்றது:

தரவு ஏரி தேவையா? தரவுக் கிடங்கை என்ன செய்வது?

இது மிகவும் எளிமையானது (மேகக்கணியில் வேலை செய்வதன் நன்மை எளிமை என்பதை நான் கவனிக்க விரும்புகிறேன்). நான் பயன்படுத்தினேன்:

  • கம்ப்யூட் பவருக்கு AWS எலாஸ்டிக் மேப் குறைப்பு (ஹடூப்).
  • தரவு குறியாக்கம் மற்றும் அணுகலை கட்டுப்படுத்தும் திறன் கொண்ட கோப்பு சேமிப்பகமாக AWS S3
  • InMemory கம்ப்யூட்டிங் சக்தியாக ஸ்பார்க் மற்றும் தர்க்கம் மற்றும் தரவு மாற்றத்திற்கான PySpark
  • ஸ்பார்க்கின் விளைவாக பார்க்வெட்
  • புதிய தரவு மற்றும் பகிர்வுகள் பற்றிய மெட்டாடேட்டா சேகரிப்பாளராக AWS க்ளூ கிராலர்
  • Redshift ஸ்பெக்ட்ரம் ஏற்கனவே உள்ள Redshift பயனர்களுக்கான தரவு ஏரிக்கு SQL இடைமுகமாக

மிகச்சிறிய EMR+Spark க்ளஸ்டர் 30 நிமிடங்களில் கோப்புகளின் முழு அடுக்கையும் செயலாக்கியது. AWS க்கு பிற வழக்குகள் உள்ளன, குறிப்பாக அலெக்சாவுடன் தொடர்புடைய பல, நிறைய தரவுகள் உள்ளன.

தரவு ஏரியின் தீமைகளில் ஒன்று GDPR என்பதை சமீபத்தில் அறிந்தேன். க்ளையன்ட் அதை நீக்கச் சொல்லும் போது, ​​அந்தத் தரவு கோப்பு ஒன்றில் இருக்கும் போது, ​​டேட்டா மேனிபுலேஷன் லாங்குவேஜ் மற்றும் DELETE ஆபரேஷனை டேட்டாபேஸில் பயன்படுத்த முடியாது.

தரவுக் கிடங்கிற்கும் தரவு ஏரிக்கும் உள்ள வேறுபாட்டை இந்தக் கட்டுரை தெளிவுபடுத்தியுள்ளதாக நம்புகிறேன். நீங்கள் ஆர்வமாக இருந்தால், எனது பல கட்டுரைகள் அல்லது நான் படித்த நிபுணர்களின் கட்டுரைகளை என்னால் மொழிபெயர்க்க முடியும். மேலும் நான் வேலை செய்யும் தீர்வுகள் மற்றும் அவற்றின் கட்டிடக்கலை பற்றி கூறவும்.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்