දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

අනුපාතයෙහි ඊළඟ ප්රවාහයේ ආරම්භය අපේක්ෂාවෙන් "දත්ත සමුදාය" දත්ත සමුදායක් සැලසුම් කිරීම සඳහා වැදගත් උපදෙස් සහිත කුඩා කර්තෘ ද්රව්යයක් අපි සකස් කර ඇත. මෙම ද්රව්ය ඔබට ප්රයෝජනවත් වනු ඇතැයි අපි බලාපොරොත්තු වෙනවා.

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

දත්ත සමුදායන් සෑම තැනකම තිබේ: සරලම බ්ලොග් සහ නාමාවලි සිට විශ්වාසනීය තොරතුරු පද්ධති සහ විශාල සමාජ ජාල දක්වා. දත්ත සමුදාය සරලද සංකීර්ණද යන්න එතරම් වැදගත් නොවන්නේ එය නිවැරදිව සැලසුම් කිරීම වැදගත් වන බැවිනි. දත්ත සමුදායක් නොසැලකිලිමත් ලෙස සහ අරමුණ පිළිබඳ පැහැදිලි අවබෝධයකින් තොරව නිර්මාණය කර ඇති විට, එය අකාර්යක්ෂම වනවා පමණක් නොව, දත්ත සමුදාය සමඟ තවදුරටත් වැඩ කිරීම සැබෑ වධයක් වනු ඇත, පරිශීලකයින්ට නොපෙනෙන වනාන්තරයක් වනු ඇත. ප්‍රයෝජනවත් සහ භාවිතයට පහසු නිෂ්පාදනයක් නිර්මාණය කිරීමට ඔබට උපකාර වන දත්ත සමුදා සැලසුම් උපදෙස් කිහිපයක් මෙන්න.

1. වගුව කුමක් සඳහාද සහ එහි ව්යුහය කුමක්ද යන්න තීරණය කරන්න

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

අද, Scrum හෝ RAD (Rapid Application Development) වැනි සංවර්ධන ක්‍රම IT කණ්ඩායම් වලට ඉක්මනින් දත්ත සමුදායන් සංවර්ධනය කිරීමට උපකාරී වේ. කෙසේ වෙතත්, කාලය හඹා යාමේදී, ඉලක්කය කුමක්ද, අවසාන ප්‍රතිඵලය කුමක් විය යුතුද යන්න නොපැහැදිලි ලෙස සිතින් මවා ගනිමින් පදනමක් ගොඩනැගීමට කෙලින්ම කිමිදීමට පෙළඹවීම ඉතා විශාලය.
 
එය හරියට කණ්ඩායම කාර්යක්ෂම, වේගවත් වැඩ කෙරෙහි අවධානය යොමු කර ඇති නමුත් මෙය මිරිඟුවකි. ඔබ ව්‍යාපෘතියේ ගැඹුරට තව දුරටත් කිමිදෙන තරමට, දත්ත සමුදාය නිර්මාණයේ දෝෂ හඳුනා ගැනීමට සහ වෙනස් කිරීමට වැඩි කාලයක් ගතවනු ඇත.

එබැවින් ඔබ තීරණය කළ යුතු පළමු දෙය වන්නේ ඔබේ දත්ත සමුදාය සඳහා අරමුණ නිර්වචනය කිරීමයි. දත්ත සමුදාය සංවර්ධනය කරන්නේ කුමන ආකාරයේ යෙදුම් සඳහාද? පරිශීලකයා වාර්තා සමඟ පමණක් වැඩ කරන අතර ගනුදෙනු කෙරෙහි අවධානය යොමු කළ යුතුද, නැතහොත් ඔහු දත්ත විශ්ලේෂණ කෙරෙහි වැඩි උනන්දුවක් දක්වන්නේද? පදනම යෙදිය යුත්තේ කොතැනටද? එය පාරිභෝගික හැසිරීම නිරීක්ෂණය කරයිද නැතහොත් පාරිභෝගික සබඳතා කළමනාකරණය කරයිද? 

නිර්මාණ කණ්ඩායම මෙම ප්‍රශ්නවලට පිළිතුරු දෙන තරමට, දත්ත සමුදා සැලසුම් ක්‍රියාවලිය වඩාත් සුමට වනු ඇත.

2. ගබඩා කිරීම සඳහා මා තෝරාගත යුතු දත්ත මොනවාද?

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

කලින් සැලසුම් කරන්න. දත්ත සමුදාය නිර්මාණය කරන වෙබ් අඩවිය හෝ පද්ධතිය අනාගතයේදී කරන්නේ කුමක්ද යන්න පිළිබඳ සිතුවිලි. තාක්ෂණික පිරිවිතරවල සරල අවශ්යතා ඉක්මවා යාම වැදගත් වේ. කරුණාකර පරිශීලකයෙකු ගබඩා කළ හැකි සියලුම දත්ත වර්ග ගැන සිතන්නට පටන් නොගන්න. ඒ වෙනුවට, පරිශීලකයින්ට ලිපි ලිවීමට, ලේඛන හෝ ඡායාරූප උඩුගත කිරීමට හෝ පණිවිඩ හුවමාරු කර ගැනීමට හැකි වේද යන්න ගැන සිතන්න. මෙය එසේ නම්, ඔබ දත්ත ගබඩාවේ ඔවුන් සඳහා ඉඩක් වෙන් කළ යුතුය.

අනාගතයේදී සැලසුම් පදනමට සහාය දක්වන කණ්ඩායම, දෙපාර්තමේන්තුව හෝ සංවිධානය සමඟ වැඩ කරන්න. පාරිභෝගික සේවා විශේෂඥයින්ගේ සිට දෙපාර්තමේන්තු ප්‍රධානීන් දක්වා විවිධ මට්ටම්වල පුද්ගලයින් සමඟ සන්නිවේදනය කරන්න. මේ ආකාරයෙන්, ප්‍රතිපෝෂණ ආධාරයෙන්, ඔබට සමාගමේ අවශ්‍යතා පිළිබඳ පැහැදිලි අදහසක් ලැබෙනු ඇත. 

නොවැළැක්විය හැකි පරිදි, එකම දෙපාර්තමේන්තුව තුළ සිටින පරිශීලකයින්ගේ අවශ්‍යතා ගැටෙනු ඇත. ඔබට මෙය හමු වුවහොත්, ඔබේම අත්දැකීම් මත විශ්වාසය තැබීමට බිය නොවන්න සහ සියලු පාර්ශවයන්ට ගැලපෙන සහ දත්ත සමුදායේ අවසාන ඉලක්කය සපුරාලන සම්මුතියක් සොයා ගන්න. සහතික වන්න: අනාගතයේදී ඔබට +100500 කර්මයක් සහ කුකීස් කන්දක් ලැබෙනු ඇත.

3. පරිස්සමෙන් ආදර්ශ දත්ත

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

දත්ත ආකෘති නිර්මාණය කිරීමේදී අවධානය යොමු කළ යුතු ප්රධාන කරුණු කිහිපයක් තිබේ. අප කලින් කී පරිදි, දත්ත සමුදායේ අරමුණ ආකෘති නිර්මාණයේදී භාවිතා කළ යුතු ක්‍රම තීරණය කරයි. අපි මාර්ගගත වාර්තා සැකසීම (OLTP) සඳහා දත්ත සමුදායක් සැලසුම් කරන්නේ නම්, වෙනත් වචන වලින් වාර්තා සෑදීම, සංස්කරණය කිරීම සහ මකා දැමීම සඳහා, අපි ගනුදෙනු ආකෘතිකරණය භාවිතා කරමු. දත්ත සමුදාය සම්බන්ධ විය යුතු නම්, බහුමාන ආකෘති නිර්මාණය භාවිතා කිරීම වඩාත් සුදුසුය.

ආකෘති නිර්මාණය අතරතුර, සංකල්පීය (CDM), භෞතික (PDM) සහ තාර්කික (LDM) දත්ත ආකෘති ගොඩනගා ඇත. 

සංකල්පීය ආකෘති ආයතන සහ ඒවාට ඇතුළත් දත්ත වර්ග මෙන්ම ඒවා අතර සම්බන්ධතා විස්තර කරයි. ඔබගේ දත්ත තාර්කික කොටස් වලට බෙදන්න - එය ජීවිතය වඩාත් පහසු කරයි.
ප්රධාන දෙය මධ්යස්ථයි, එය ඉක්මවා නොයන්න.

යම් වස්තුවක් එක් වචනයකින් හෝ වාක්‍ය ඛණ්ඩයකින් වර්ගීකරණය කිරීම ඉතා අපහසු නම්, උප වර්ග (ළමා ආයතන) භාවිතා කිරීමට කාලයයි.

ආයතනයක් තමන්ගේම ජීවිතයක් ගත කරන්නේ නම්, එහි හැසිරීම සහ එහි පෙනුම මෙන්ම වෙනත් වස්තූන් සමඟ සම්බන්ධතා විස්තර කරන ගුණාංග තිබේ නම්, ඔබට ආරක්ෂිතව උප වර්ගයක් පමණක් නොව සුපිරි වර්ගයක් (මව්පියන්) ද භාවිතා කළ හැකිය. 

ඔබ මෙම රීතිය නොසලකා හැරියහොත්, අනෙකුත් සංවර්ධකයින් ඔබේ ආකෘතිය තුළ ව්‍යාකූලත්වයට පත් වනු ඇති අතර, දත්ත සහ එය එකතු කරන ආකාරය පිළිබඳ නීති රීති සම්පූර්ණයෙන්ම තේරුම් නොගනු ඇත.

තාර්කික ඒවා භාවිතයෙන් සංකල්පීය ආකෘති ක්රියාත්මක වේ. මෙම ආකෘති භෞතික දත්ත සමුදා නිර්මාණය සඳහා මාර්ග සිතියමක් වැනි ය. තාර්කික ආකෘතිය තුළ, ව්‍යාපාරික දත්ත ආයතන හඳුනාගෙන, දත්ත වර්ග තීරණය කරනු ලබන අතර, දත්ත අතර සම්බන්ධතා නියාමනය කරන රීති යතුරේ තත්ත්වය තීරණය වේ.

එවිට තාර්කික දත්ත ආකෘතිය කලින් තෝරාගත් DBMS (දත්ත සමුදා කළමනාකරණ පද්ධතිය) වේදිකාව සමඟ සංසන්දනය කර භෞතික ආකෘතියක් ලබා ගනී. දත්ත භෞතිකව ගබඩා කරන ආකාරය විස්තර කරයි.

4. නිවැරදි දත්ත වර්ග භාවිතා කරන්න

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

වැරදි දත්ත වර්ගයක් භාවිතා කිරීමෙන් අඩු නිරවද්‍ය දත්ත, වගු සම්බන්ධ වීමේ දුෂ්කරතා, උපලක්ෂණ සමමුහුර්ත කිරීමේ දුෂ්කරතා සහ පුම්බා ඇති ගොනු ප්‍රමාණයන් ඇති විය හැක.
තොරතුරු ඒකාග්‍රතාවය සහතික කිරීම සඳහා, උපලක්ෂණයක අඩංගු විය යුත්තේ එයට පිළිගත හැකි දත්ත වර්ග පමණි. දත්ත ගබඩාවට වයස ඇතුළත් කර ඇත්නම්, තීරුවේ උපරිම සංඛ්‍යා 3ක පූර්ණ සංඛ්‍යා ගබඩා කර ඇති බවට සහතික වන්න.

NULL අගයක් සහිත අවම හිස් තීරු සාදන්න. ඔබ සියලුම තීරු NULL ලෙස නිර්මාණය කරන්නේ නම්, මෙය විශාල වැරැද්දකි. ඔබට නිශ්චිත ව්‍යාපාරික කාර්යයක් කිරීමට හිස් තීරුවක් අවශ්‍ය නම්, දත්ත නොදන්නා විට හෝ තවමත් අර්ථවත් නොවන විට, එය නිර්මාණය කිරීමට නිදහස් වන්න. සියල්ලට පසු, අපට “මරණ දිනය” හෝ “ඉවත් කළ දිනය” යන තීරු කල්තියා පිරවිය නොහැක; අපි අහස දෙසට ඇඟිල්ල දිගු කරන පුරෝකථනයන් නොවේ :-).

බොහෝ ආකෘති නිර්මාණ මෘදුකාංග (ER/Studio, MySQL Workbench, SQL DBM, gliffy.com) දත්ත මඟින් දත්ත කලාපවල මූලාකෘති නිර්මාණය කිරීමට ඔබට ඉඩ සලසයි. මෙය නිවැරදි දත්ත වර්ගය, යෙදුම් තර්කනය සහ හොඳ කාර්ය සාධනය පමණක් නොව, අගය අවශ්ය බව සහතික කරයි.

5. ස්වභාවිකව යන්න

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

යතුරක් ලෙස භාවිතා කිරීමට වගුවක කුමන තීරුව තීරණය කරන විට, පරිශීලකයාට සංස්කරණය කළ හැකි ක්ෂේත්‍ර මොනවාදැයි සැමවිටම සලකා බලන්න. කිසි විටෙකත් ඒවා යතුරක් ලෙස තෝරා නොගන්න - නරක අදහසක්. ඕනෑම දෙයක් සිදු විය හැකි නමුත් එය අද්විතීය බව ඔබ සහතික කළ යුතුය.

ස්වාභාවික හෝ ව්‍යාපාරික යතුරක් භාවිතා කිරීම වඩාත් සුදුසුය. එයට අර්ථකථන අර්ථයක් ඇත, එබැවින් ඔබ දත්ත සමුදායේ අනුපිටපත් කිරීම වළක්වනු ඇත. 

ව්‍යාපාරික යතුර අද්විතීය නම් (පළමු නම, වාසගම, ස්ථානය) සහ මේසයේ විවිධ පේළිවල නැවත නැවත හෝ එය වෙනස් විය යුතු නම් මිස, ජනනය කරන ලද කෘතිම යතුර ප්‍රාථමික යතුර ලෙස නම් කළ යුතුය.

6. මධ්යස්ථව සාමාන්යකරණය කරන්න

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

දත්ත සමුදාය තුළ දත්ත ඵලදායී ලෙස සංවිධානය කිරීම සඳහා, ඔබ මාර්ගෝපදේශ මාලාවක් අනුගමනය කළ යුතු අතර දත්ත සමුදාය සාමාන්යකරණය කළ යුතුය. අනුගමනය කිරීමට සාමාන්ය ආකාර පහක් ඇත.
සාමාන්‍යකරණය සමඟ, ඔබ අතිරික්තය වළක්වා ඔබේ යෙදුමේ හෝ වෙබ් අඩවියේ භාවිතා කරන දත්තවල අඛණ්ඩතාව සහතික කරයි.

සෑම විටම, සෑම දෙයක්ම මධ්යස්ථ විය යුතුය, සාමාන්යකරණය පවා. එකම අනන්‍ය යතුරු සහිත දත්ත සමුදායේ වගු ඕනෑවට වඩා තිබේ නම්, ඔබ ඉවතට ගෙන ගොස් දත්ත සමුදාය සාමාන්‍යකරණය කර ඇත. අධික සාමාන්‍යකරණය දත්ත සමුදායේ ක්‍රියාකාරිත්වයට අහිතකර ලෙස බලපායි.

7. ඉක්මනින් පරීක්ෂා කරන්න, නිතර පරීක්ෂා කරන්න

දත්ත සමුදාය නිර්මාණය. හොඳම භාවිතයන්

පරීක්ෂණ සැලැස්ම සහ නිසි පරීක්ෂාව දත්ත සමුදා නිර්මාණයේ කොටසක් විය යුතුය.

ඔබගේ දත්ත සමුදාය පරීක්ෂා කිරීමට හොඳම ක්රමය වන්නේ අඛණ්ඩ ඒකාබද්ධතාවයයි. “දත්ත සමුදායක ජීවිතයේ දිනයක්” අනුකරණය කර සියලු මායිම් අවස්ථා හසුරුවන්නේද යන්න සහ පරිශීලක අන්තර්ක්‍රියා මොනවාදැයි පරීක්ෂා කරන්න. ඔබ ඉක්මනින් දෝෂ සොයා ගන්නා තරමට, ඔබට කාලය සහ මුදල් යන දෙකම ඉතිරි වේ.

මේවා ඔබට විශිෂ්ට ඵලදායිතාවයක් සහ කාර්යක්‍ෂමතා දත්ත ගබඩාවක් සැලසුම් කිරීමට භාවිතා කළ හැකි ඉඟි හතක් පමණි. ඔබ ඒවා අනුගමනය කරන්නේ නම්, අනාගතයේදී ඔබට බොහෝ හිසරදය වළක්වා ගත හැකිය. මෙම ඉඟි දත්ත සමුදා ආකෘති නිර්මාණයේ අයිස් කුට්ටියේ කෙළවර පමණි. ජීවිත හැක් විශාල ප්‍රමාණයක් ඇත. ඔබ භාවිතා කරන්නේ කුමන ඒවාද?

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න