අපට දත්ත විලක් අවශ්‍යද? දත්ත ගබඩාව සමඟ කළ යුත්තේ කුමක්ද?

මෙම ලිපිය මාධ්‍ය පිළිබඳ මගේ ලිපියේ පරිවර්තනයකි - Data Lake සමඟ ආරම්භ කිරීම, එය තරමක් ජනප්‍රිය විය, බොහෝ විට එහි සරල බව නිසා විය හැකිය. එබැවින්, දත්ත ගබඩාවක් (DW) යනු කුමක්ද, දත්ත විලක් (Data Lake) යනු කුමක්ද සහ ඒවා කෙසේද යන්න පිළිබඳව දත්ත විශේෂඥයෙකු නොවන සාමාන්‍ය පුද්ගලයෙකුට පැහැදිලි කිරීම සඳහා එය රුසියානු භාෂාවෙන් ලිවීමට සහ ටිකක් එකතු කිරීමට මම තීරණය කළෙමි. එකට එකතු වෙන්න.

දත්ත විල ගැන ලියන්න හිතුනේ ඇයි? මම වසර 10 කට වැඩි කාලයක් දත්ත සහ විශ්ලේෂණ සමඟ වැඩ කර ඇති අතර, දැන් මම අනිවාර්යයෙන්ම බොස්ටන් හි පිහිටි කේම්බ්‍රිජ් හි Amazon Alexa AI හි විශාල දත්ත සමඟ වැඩ කරමි, නමුත් මම වැන්කුවර් දූපතේ වික්ටෝරියා හි ජීවත් වුවද බොහෝ විට බොස්ටන්, සියැටල් වෙත ගියත් , සහ වැන්කුවර්හිදී සහ සමහර විට මොස්කව්හිදී පවා මම සම්මන්ත්රණවලදී කතා කරමි. මමත් විටින් විට ලියන නමුත් මම ප්‍රධාන වශයෙන් ඉංග්‍රීසියෙන් ලියන අතර මම දැනටමත් ලියා ඇත සමහර පොත්, මට උතුරු ඇමරිකාවේ විශ්ලේෂණ ප්‍රවණතා බෙදා ගැනීමේ අවශ්‍යතාවයක් ද ඇති අතර, මම සමහර විට ලියන්නෙමි විදුලි පණිවුඩ.

මම සෑම විටම දත්ත ගබඩා සමඟ වැඩ කර ඇති අතර, 2015 සිට මම Amazon Web Services සමඟ සමීපව වැඩ කිරීමට පටන් ගතිමි, සහ සාමාන්යයෙන් cloud analytics (AWS, Azure, GCP) වෙත මාරු විය. මම 2007 සිට විශ්ලේෂණ විසඳුම් පරිණාමය නිරීක්ෂණය කර ඇති අතර දත්ත ගබඩා වෙළෙන්දෙකු වන Teradata සඳහා පවා වැඩ කර එය Sberbank හි ක්‍රියාත්මක කළ අතර, Hadoop සමඟ විශාල දත්ත දර්ශනය වූයේ එවිටය. ගබඩා කිරීමේ යුගය ගෙවී ගොස් දැන් සියල්ල හදූප් මත බව හැමෝම කියන්නට පටන් ගත් අතර, පසුව දත්ත ලේක් ගැන කතා කිරීමට පටන් ගත්හ, දැන් දත්ත ගබඩාවේ අවසානය නියත වශයෙන්ම පැමිණ ඇති බව. නමුත් වාසනාවකට මෙන් (සමහර විට අවාසනාවකට Hadoop පිහිටුවා විශාල මුදලක් උපයා ගත් සමහරුන්ට), දත්ත ගබඩාව ඉවත්ව ගියේ නැත.

මෙම ලිපියෙන් අපි දත්ත විලක් යනු කුමක්දැයි සොයා බලමු. මෙම ලිපිය දත්ත ගබඩා සම්බන්ධයෙන් අඩු හෝ අත්දැකීම් නොමැති පුද්ගලයින් සඳහා අදහස් කෙරේ.

අපට දත්ත විලක් අවශ්‍යද? දත්ත ගබඩාව සමඟ කළ යුත්තේ කුමක්ද?

පින්තුරේ තියෙන්නේ ලේක් බ්ලෙඩ්, මේක මගේ ප්‍රියතම විල් වලින් එකක්, මම එක පාරයි එතන හිටියත් මට ඒක ජීවිත කාලෙටම මතක් උනේ. නමුත් අපි තවත් විලක් ගැන කතා කරමු - දත්ත විලක්. සමහර විට ඔබගෙන් බොහෝ දෙනෙක් මෙම පදය ගැන කිහිප වතාවක් අසා ඇත, නමුත් තවත් එක් අර්ථ දැක්වීමක් කිසිවෙකුට හානියක් නොවනු ඇත.

පළමුවෙන්ම, දත්ත විලක් පිළිබඳ වඩාත් ජනප්‍රිය අර්ථ දැක්වීම් මෙන්න:

"සංවිධානයේ ඕනෑම කෙනෙකුට විශ්ලේෂණය සඳහා ලබා ගත හැකි සියලු වර්ගවල අමු දත්තවල ගොනු ගබඩාවක්" - මාටින් ෆෝලර්.

“ඩේටා මාර්ට් යනු ජල බෝතලයක් යැයි ඔබ සිතන්නේ නම් - පිරිසිදු කර, ඇසුරුම් කර පහසු පරිභෝජනය සඳහා ඇසුරුම් කර ඇති අතර, දත්ත විලක් යනු එහි ස්වාභාවික ස්වරූපයෙන් විශාල ජල සංචිතයකි. පරිශීලකයිනි, මට මා වෙනුවෙන් ජලය රැස් කර ගත හැකිය, ගැඹුරට කිමිදෙන්න, ගවේෂණය කළ හැකිය" - ජේම්ස් ඩික්සන්.

දත්ත විලක් යනු විශ්ලේෂණ ගැන බව දැන් අපි නිසැකවම දනිමු, එය අපට එහි මුල් ස්වරූපයෙන් විශාල දත්ත ප්‍රමාණයක් ගබඩා කිරීමට ඉඩ සලසයි, අපට දත්ත වෙත අවශ්‍ය සහ පහසු ප්‍රවේශය ඇත.

මම බොහෝ විට දේවල් සරල කිරීමට කැමතියි, මට සංකීර්ණ යෙදුමක් සරල වචන වලින් පැහැදිලි කළ හැකි නම්, එය ක්‍රියා කරන ආකාරය සහ එය අවශ්‍ය වන්නේ කුමක්ද යන්න මටම වැටහේ. දිනක්, මම iPhone ඡායාරූප ගැලරිය තුළ ඇවිදිමින් සිටියෙමි, එය මට වැටහුණි, මෙය සැබෑ දත්ත විලක්, මම සම්මන්ත්‍රණ සඳහා විනිවිදකයක් පවා සෑදුවෙමි:

අපට දත්ත විලක් අවශ්‍යද? දත්ත ගබඩාව සමඟ කළ යුත්තේ කුමක්ද?

සෑම දෙයක්ම ඉතා සරලයි. අපි දුරකථනයෙන් ඡායාරූපයක් ගන්නෙමු, ඡායාරූපය දුරකථනයේ සුරකින අතර iCloud (වලාකුළු ගොනු ගබඩාව) වෙත සුරැකිය හැක. දුරකථනය ඡායාරූප පාරදත්ත එකතු කරයි: පෙන්වන දේ, භූ ටැගය, වේලාව. එහි ප්‍රතිඵලයක් ලෙස iPhone හි පරිශීලක-හිතකාමී අතුරුමුහුණත භාවිතා කර අපගේ ඡායාරූපය සොයා ගත හැකි අතර අපට දර්ශක පවා දැකිය හැකිය, උදාහරණයක් ලෙස, මම ගින්න යන වචනය සමඟ ඡායාරූප සොයන විට, මට ගින්නක රූපයක් සහිත ඡායාරූප 3 ක් හමු වේ. මට නම්, මෙය ඉතා ඉක්මනින් සහ පැහැදිලිව ක්‍රියා කරන ව්‍යාපාරික බුද්ධි මෙවලමක් වැනිය.

ඇත්ත වශයෙන්ම, අපි ආරක්ෂාව (අවසර දීම සහ සත්‍යාපනය) ගැන අමතක නොකළ යුතුය, එසේ නොමැතිනම් අපගේ දත්ත පහසුවෙන් පොදු වසමෙහි අවසන් විය හැකිය. සංවර්ධකයින්ගේ නොසැලකිල්ල සහ සරල නීති අනුගමනය කිරීමට අපොහොසත් වීම හේතුවෙන් දත්ත ප්‍රසිද්ධියේ ලබා ගත හැකි විශාල සමාගම් සහ ආරම්භකයින් පිළිබඳ බොහෝ ප්‍රවෘත්ති තිබේ.

එවැනි සරල පින්තූරයක් පවා දත්ත විලක් යනු කුමක්ද, සාම්ප්‍රදායික දත්ත ගබඩාවකින් එහි වෙනස්කම් සහ එහි ප්‍රධාන අංගයන් ගැන සිතා ගැනීමට අපට උපකාර කරයි:

  1. දත්ත පූරණය කරමින් (ආග්‍රහණය) යනු දත්ත විලෙහි ප්‍රධාන අංගයකි. දත්ත ක්‍රම දෙකකින් දත්ත ගබඩාවට ඇතුළු විය හැක - කාණ්ඩ (අන්තරාලවල පැටවීම) සහ ප්‍රවාහය (දත්ත ප්‍රවාහය).
  2. ගොනු ගබඩාව (ගබඩාව) යනු දත්ත විලෙහි ප්‍රධාන අංගයයි. අපට ගබඩාව පහසුවෙන් පරිමාණය කළ හැකි, අතිශයින්ම විශ්වාසදායක සහ අඩු පිරිවැයක් විය යුතුය. උදාහරණයක් ලෙස, AWS හි එය S3 වේ.
  3. නාමාවලිය සහ සෙවීම (නාමාවලිය සහ සෙවීම) - අපට දත්ත වගුරු බිම වළක්වා ගැනීම සඳහා (මෙය අපි සියලු දත්ත එක ගොඩකට දමන විට, පසුව එය සමඟ වැඩ කිරීමට නොහැකි වීමයි), දත්ත වර්ගීකරණය කිරීම සඳහා අපි පාර-දත්ත ස්ථරයක් සෑදිය යුතුය. පරිශීලකයින්ට විශ්ලේෂණය සඳහා අවශ්‍ය දත්ත පහසුවෙන් සොයා ගත හැකි වන පරිදි. මීට අමතරව, ඔබට ElasticSearch වැනි අමතර සෙවුම් විසඳුම් භාවිතා කළ හැක. පරිශීලක-හිතකාමී අතුරු මුහුණතක් හරහා අවශ්‍ය දත්ත සොයා ගැනීමට සෙවීම පරිශීලකයාට උදවු කරයි.
  4. සැකසීම (ක්‍රියාවලිය) - මෙම පියවර දත්ත සැකසීම සහ පරිවර්තනය කිරීම සඳහා වගකිව යුතුය. අපට දත්ත පරිවර්තනය කිරීමට, එහි ව්‍යුහය වෙනස් කිරීමට, එය පිරිසිදු කිරීමට සහ තවත් බොහෝ දේ කළ හැක.
  5. Безопасность (ආරක්ෂාව) - විසඳුමේ ආරක්ෂක සැලසුම සඳහා කාලය ගත කිරීම වැදගත් වේ. උදාහරණයක් ලෙස, ගබඩා කිරීමේදී, සැකසීමේදී සහ පැටවීමේදී දත්ත සංකේතනය කිරීම. සත්‍යාපනය සහ අවසර දීමේ ක්‍රම භාවිතා කිරීම වැදගත් වේ. අවසාන වශයෙන්, විගණන මෙවලමක් අවශ්ය වේ.

ප්‍රායෝගික දෘෂ්ටි කෝණයකින්, අපට දත්ත විලක් ගුණාංග තුනකින් සංලක්ෂිත කළ හැකිය:

  1. ඕනෑම දෙයක් එකතු කර ගබඩා කරන්න — දත්ත විලෙහි සියලුම දත්ත අඩංගු වේ, ඕනෑම කාල සීමාවක් සඳහා අමු සකසන ලද දත්ත සහ සැකසූ/පිරිසිදු කළ දත්ත යන දෙකම.
  2. ගැඹුරු ස්කෑන් — දත්ත විලක් පරිශීලකයින්ට දත්ත ගවේෂණය කිරීමට සහ විශ්ලේෂණය කිරීමට ඉඩ සලසයි.
  3. නම්යශීලී ප්රවේශය — දත්ත විල විවිධ දත්ත සහ විවිධ අවස්ථා සඳහා නම්‍යශීලී ප්‍රවේශයක් සපයයි.

දැන් අපට දත්ත ගබඩාවක් සහ දත්ත විලක් අතර වෙනස ගැන කතා කළ හැකිය. සාමාන්යයෙන් මිනිසුන් අසයි:

  • දත්ත ගබඩාව ගැන කුමක් කිව හැකිද?
  • අපි දත්ත ගබඩාව දත්ත විලක් සමඟ ප්‍රතිස්ථාපනය කරනවාද නැතහොත් එය පුළුල් කරනවාද?
  • දත්ත විලක් නොමැතිව තවමත් කළ හැකිද?

කෙටියෙන් කිවහොත්, පැහැදිලි පිළිතුරක් නොමැත. ඒ සියල්ල නිශ්චිත තත්ත්වය, කණ්ඩායමේ කුසලතා සහ අයවැය මත රඳා පවතී. උදාහරණයක් ලෙස, ඔරකල් වෙත දත්ත ගබඩාවක් AWS වෙත සංක්‍රමණය කිරීම සහ ඇමේසන් අනුබද්ධිත ආයතනයක් විසින් දත්ත විලක් නිර්මාණය කිරීම - Woot - අපගේ දත්ත විල කතාව: Woot.com AWS මත සේවාදායක රහිත දත්ත විලක් ගොඩනගා ගත් ආකාරය.

අනෙක් අතට, Snowflake වෙළෙන්දා පවසන්නේ ඔවුන්ගේ දත්ත වේදිකාව (2020 වන තෙක් එය දත්ත ගබඩාවක්) ඔබට දත්ත විලක් සහ දත්ත ගබඩාවක් යන දෙකම ඒකාබද්ධ කිරීමට ඉඩ සලසන බැවින් ඔබට තවදුරටත් දත්ත විලක් ගැන සිතීමට අවශ්‍ය නොවන බවයි. මම Snowflake සමඟ වැඩිපුර වැඩ කර නොමැති අතර, එය සැබවින්ම මෙය කළ හැකි අද්විතීය නිෂ්පාදනයකි. ගැටලුවේ මිල තවත් කාරණයකි.

අවසාන වශයෙන්, මගේ පුද්ගලික මතය නම්, අපගේ වාර්තාකරණය සඳහා ප්‍රධාන දත්ත මූලාශ්‍රය ලෙස අපට තවමත් දත්ත ගබඩාවක් අවශ්‍ය වන අතර, නොගැලපෙන ඕනෑම දෙයක් අපි දත්ත විලක ගබඩා කරමු. විශ්ලේෂණවල සම්පූර්ණ කාර්යභාරය වන්නේ ව්‍යාපාර සඳහා තීරණ ගැනීමට පහසු ප්‍රවේශයක් ලබා දීමයි. කවුරුන් කුමක් පැවසුවත්, ව්‍යාපාරික පරිශීලකයින් දත්ත විලකට වඩා දත්ත ගබඩාවක් සමඟ කාර්යක්ෂමව ක්‍රියා කරයි, උදාහරණයක් ලෙස Amazon හි - Redshift (විශ්ලේෂණාත්මක දත්ත ගබඩාව) සහ Redshift Spectrum/Athena (S3 හි දත්ත විලක් සඳහා SQL අතුරුමුහුණත) ඇත. හයිව්/ප්‍රෙස්ටෝ). අනෙකුත් නවීන විශ්ලේෂණ දත්ත ගබඩා සඳහාද මෙය අදාළ වේ.

සාමාන්‍ය දත්ත ගබඩා ගෘහ නිර්මාණ ශිල්පයක් දෙස බලමු:

අපට දත්ත විලක් අවශ්‍යද? දත්ත ගබඩාව සමඟ කළ යුත්තේ කුමක්ද?

මෙය සම්භාව්ය විසඳුමකි. අපට ප්‍රභව පද්ධති ඇත, ETL/ELT භාවිතයෙන් අපි දත්ත විශ්ලේෂණාත්මක දත්ත ගබඩාවකට පිටපත් කර ව්‍යාපාර බුද්ධි විසඳුමකට සම්බන්ධ කරමු (මගේ ප්‍රියතම වගුව, ඔබේ ගැන කුමක් කිව හැකිද?).

මෙම විසඳුම පහත අවාසි ඇත:

  • ETL/ELT මෙහෙයුම් සඳහා කාලය සහ සම්පත් අවශ්‍ය වේ.
  • රීතියක් ලෙස, විශ්ලේෂණාත්මක දත්ත ගබඩාවක දත්ත ගබඩා කිරීම සඳහා මතකය ලාභදායී නොවේ (උදාහරණයක් ලෙස, Redshift, BigQuery, Teradata), අපට සම්පූර්ණ පොකුරක් මිලදී ගැනීමට අවශ්‍ය බැවින්.
  • ව්‍යාපාරික පරිශීලකයින්ට පිරිසිදු කරන ලද සහ බොහෝ විට එකතු කරන ලද දත්ත වෙත ප්‍රවේශය ඇති අතර අමු දත්ත වෙත ප්‍රවේශය නොමැත.

ඇත්ත වශයෙන්ම, ඒ සියල්ල ඔබගේ නඩුව මත රඳා පවතී. ඔබට ඔබේ දත්ත ගබඩාව සමඟ ගැටළු නොමැති නම්, ඔබට දත්ත විලක් අවශ්‍ය නොවේ. නමුත් අවකාශය, බලය හෝ මිල නොමැතිකම සමඟ ගැටලු පැනනගින විට ප්රධාන කාර්යභාරයක් ඉටු කරයි, එවිට ඔබට දත්ත විලක් විකල්පය සලකා බැලිය හැකිය. දත්ත විල ඉතා ජනප්‍රිය වන්නේ එබැවිනි. දත්ත විල් ගෘහ නිර්මාණ ශිල්පයේ උදාහරණයක් මෙන්න:
අපට දත්ත විලක් අවශ්‍යද? දත්ත ගබඩාව සමඟ කළ යුත්තේ කුමක්ද?
දත්ත ලේක් ප්‍රවේශය භාවිතා කරමින්, අපි අමු දත්ත අපගේ දත්ත විල (කණ්ඩායම හෝ ප්‍රවාහය) වෙත පූරණය කරමු, පසුව අපි අවශ්‍ය පරිදි දත්ත සකසමු. දත්ත විල ව්‍යාපාරික පරිශීලකයින්ට තමන්ගේම දත්ත පරිවර්තනයක් (ETL/ELT) නිර්මාණය කිරීමට හෝ ව්‍යාපාර බුද්ධි විසඳුම් තුළ දත්ත විශ්ලේෂණය කිරීමට (අවශ්‍ය ධාවකය තිබේ නම්) ඉඩ ලබා දේ.

ඕනෑම විශ්ලේෂණ විසඳුමක ඉලක්කය වන්නේ ව්‍යාපාරික පරිශීලකයින්ට සේවය කිරීමයි. ඒ නිසා අපි හැම විටම ව්‍යාපාරික අවශ්‍යතා අනුව වැඩ කළ යුතුයි. (Amazon හි මෙය මූලධර්ම වලින් එකකි - පසුපසට වැඩ කිරීම).

දත්ත ගබඩාවක් සහ දත්ත විලක් සමඟ වැඩ කිරීම, අපට විසඳුම් දෙකම සැසඳිය හැකිය:

අපට දත්ත විලක් අවශ්‍යද? දත්ත ගබඩාව සමඟ කළ යුත්තේ කුමක්ද?

උකහා ගත හැකි ප්‍රධාන නිගමනය වන්නේ දත්ත ගබඩාව දත්ත විල සමඟ තරඟ නොකරන නමුත් එය සම්පුර්ණ කරන බවයි. නමුත් ඔබේ නඩුවට ගැලපෙන දේ තීරණය කිරීම ඔබට භාරයි. එය ඔබම උත්සාහ කර නිවැරදි නිගමන උකහා ගැනීම සැමවිටම සිත්ගන්නා සුළුය.

මම දත්ත ලේක් ප්‍රවේශය භාවිතා කිරීමට පටන් ගත් විට එක් අවස්ථාවක් ඔබට කියන්නට කැමැත්තෙමි. සෑම දෙයක්ම ඉතා සුළු දෙයකි, මම ELT මෙවලමක් භාවිතා කිරීමට උත්සාහ කළෙමි (අපට Matillion ETL තිබුණි) සහ Amazon Redshift, මගේ විසඳුම ක්‍රියාත්මක විය, නමුත් අවශ්‍යතාවලට නොගැලපේ.

අවස්ථා 2ක් සඳහා දත්ත සැපයීම සඳහා මට වෙබ් ලොග් ගැනීමට, ඒවා පරිවර්තනය කිරීමට සහ ඒවා එකතු කිරීමට අවශ්‍ය විය:

  1. අලෙවිකරණ කණ්ඩායමට SEO සඳහා බොට් ක්‍රියාකාරකම් විශ්ලේෂණය කිරීමට අවශ්‍ය විය
  2. තොරතුරු තාක්ෂණයට වෙබ් අඩවි කාර්ය සාධන ප්‍රමිතික බැලීමට අවශ්‍ය විය

ඉතා සරල, ඉතා සරල ලඝු-සටහන්. මෙන්න උදාහරණයක්:

https 2018-07-02T22:23:00.186641Z app/my-loadbalancer/50dc6c495c0c9188 
192.168.131.39:2817 10.0.0.1:80 0.086 0.048 0.037 200 200 0 57 
"GET https://www.example.com:443/ HTTP/1.1" "curl/7.46.0" ECDHE-RSA-AES128-GCM-SHA256 TLSv1.2 
arn:aws:elasticloadbalancing:us-east-2:123456789012:targetgroup/my-targets/73e2d6bc24d8a067
"Root=1-58337281-1d84f3d73c47ec4e58577259" "www.example.com" "arn:aws:acm:us-east-2:123456789012:certificate/12345678-1234-1234-1234-123456789012"
1 2018-07-02T22:22:48.364000Z "authenticate,forward" "-" "-"

එක් ගොනුවක් මෙගාබයිට් 1-4 ක් බරයි.

නමුත් එක දුෂ්කරතාවයක් තිබුණා. අපට ලොව පුරා වසම් 7 ක් තිබූ අතර එක් දිනක් තුළ ගොනු 7000 ක් නිර්මාණය විය. මෙය වැඩි පරිමාවක් නොවේ, ගිගාබයිට් 50 ක් පමණි. නමුත් අපගේ Redshift පොකුරේ විශාලත්වය ද කුඩා විය (නෝඩ් 4). සාම්ප්‍රදායික ආකාරයෙන් එක් ගොනුවක් පූරණය කිරීමට විනාඩියක් පමණ ගත විය. එනම් ප්‍රශ්නය හිස මතින් විසඳුනේ නැත. මම දත්ත ලේක් ප්‍රවේශය භාවිතා කිරීමට තීරණය කළ විට මෙය සිදුවිය. විසඳුම මේ වගේ දෙයක් පෙනුණා:

අපට දත්ත විලක් අවශ්‍යද? දත්ත ගබඩාව සමඟ කළ යුත්තේ කුමක්ද?

එය තරමක් සරල ය (වලාකුළේ වැඩ කිරීමේ වාසිය සරල බව මට සටහන් කිරීමට අවශ්‍යය). මම භාවිතා කළේ:

  • පරිගණක බලය සඳහා AWS ඉලාස්ටික් සිතියම අඩු කිරීම (Hadoop).
  • AWS S3 දත්ත සංකේතනය කිරීමට සහ ප්‍රවේශය සීමා කිරීමට හැකියාව ඇති ගොනු ගබඩාවක් ලෙස
  • InMemory පරිගණක බලය ලෙස Spark සහ තර්කනය සහ දත්ත පරිවර්තනය සඳහා PySpark
  • Spark හි ප්රතිඵලයක් ලෙස Parquet
  • AWS Glue Crawler නව දත්ත සහ කොටස් පිළිබඳ පාර-දත්ත එකතුකරන්නෙකු ලෙස
  • Redshift Spectrum දැනට පවතින Redshift භාවිතා කරන්නන් සඳහා දත්ත විලට SQL අතුරු මුහුණතක් ලෙස

කුඩාම EMR+Spark පොකුර මිනිත්තු 30කින් සම්පූර්ණ ගොනු තොගයම සකසන ලදී. AWS සඳහා වෙනත් අවස්ථා තිබේ, විශේෂයෙන් බොහෝ දත්ත Alexa හා සම්බන්ධ වේ.

මෑතකදී මම දැනගත්තා දත්ත විලක ඇති එක් අවාසියක් GDPR. ගැටළුව වන්නේ සේවාදායකයා එය මකා දැමීමට ඉල්ලා සිටින විට සහ දත්ත එක් ගොනුවක ඇති විට, අපට දත්ත ගබඩාවක මෙන් Data Manipulation Language සහ DELETE මෙහෙයුම භාවිතා කළ නොහැක.

මෙම ලිපියෙන් දත්ත ගබඩාවක් සහ දත්ත විලක් අතර වෙනස පැහැදිලි කර ඇතැයි සිතමි. ඔබ උනන්දු වූයේ නම්, මම කියවන මගේ ලිපි හෝ වෘත්තිකයන්ගේ ලිපි තවත් පරිවර්තනය කළ හැකිය. ඒ වගේම මම වැඩ කරන විසඳුම් සහ ඒවායේ ගෘහ නිර්මාණ ශිල්පය ගැන කියන්න.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න