විවිධ පරිශීලක දත්ත සමුදා කාන්දුවීම් හේතුවෙන් ලබාගත් ගිණුම් බිලියනයක විශ්ලේෂණය

ප්‍රකාශිතයි සත්‍යාපන පරාමිතීන් සහිත විවිධ දත්ත සමුදා කාන්දුවීම් හේතුවෙන් ලබාගත් ගිණුම් බිලියනයක එකතුවක් විශ්ලේෂණය කිරීම මත පදනම්ව ජනනය කරන ලද සංඛ්‍යාලේඛන. තවද සකස් කර ඇත සාමාන්‍ය මුරපද භාවිතයේ වාර ගණන පිළිබඳ දත්ත සහිත සාම්පල සහ ලැයිස්තු 1, 10, 100, මිලියන 1 සහ මිලියන 10 ක ජනප්‍රිය මුරපද වලින්, මුරපද හැෂ් තෝරාගැනීම වේගවත් කිරීමට භාවිතා කළ හැක.

සමහර සාමාන්‍යකරණයන් සහ සොයාගැනීම්:

  • බිලියනයක වාර්තා එකතුවෙන් මිලියන 257ක් දූෂිත දත්ත (වැරදි ආකෘතියේ අවුල් සහගත දත්ත) හෝ පරීක්ෂණ ගිණුම් ලෙස ඉවත දමන ලදී. සියලුම පෙරහන් කිරීමෙන් පසු, මිලියන 169ක මුරපද සහ මිලියන 293ක පිවිසුම් වාර්තා බිලියනයකින් හඳුනා ගන්නා ලදී.
  • වඩාත්ම ජනප්රිය මුරපදය "123456" මිලියන 7 ක් පමණ භාවිතා වේ (සියලු මුරපද වලින් 0.722%). සැලකිය යුතු ප්‍රමාදයක් සමඟ තවදුරටත් අනුගමනය කරන්න මුරපද 123456789, මුරපදය, qwerty, 12345678.
  • වඩාත්ම ජනප්‍රිය මුරපද දහසක කොටස සියලුම මුරපදවලින් 6.607%ක් වන අතර ජනප්‍රියම මුරපද මිලියනයේ කොටස 36.28%ක් වන අතර මිලියන 10ක කොටස 54%කි.
  • සාමාන්‍ය මුරපද ප්‍රමාණය අක්ෂර 9.4822 කි.
  • මුරපද වලින් 12.04% විශේෂ අක්ෂර අඩංගු වේ.
  • මුරපද වලින් 28.79% ක් අකුරු වලින් පමණක් සමන්විත වේ.
  • මුරපදවලින් 26.16%කට කුඩා අකුරු පමණක් ඇතුළත් වේ.
  • මුරපද වලින් 13.37% ක් අංක වලින් පමණක් සමන්විත වේ.
  • මුරපද වලින් 34.41% ක් අංක වලින් අවසන් වන නමුත්, සියලුම මුරපද වලින් 4.522% ක් පමණක් අංකයකින් ආරම්භ වේ.
  • මුරපද වලින් 8.83% ක් පමණක් අද්විතීය වන අතර ඉතිරිය දෙවරක් හෝ වැඩි වාර ගණනක් සිදු වේ. අද්විතීය මුරපදයක සාමාන්‍ය දිග අක්ෂර 9.7965 කි. මෙම මුරපදවලින් සමහරක් පමණක් ව්‍යාකූල අක්ෂර කට්ටලයක් වන අතර, අර්ථයෙන් තොර, සහ 7.082% ක් පමණක් විශේෂ අක්ෂර ඇතුළත් වේ. අනන්‍ය මුරපදවලින් 20.02%ක් අකුරුවලින් පමණක් සමන්විත වන අතර 15.02%ක් කුඩා අකුරුවලින් පමණක් සමන්විත වන අතර සාමාන්‍ය දිග අක්ෂර 9.36කි.
  • ස්ථාවර බඳවා ගැනීම උසස් තත්ත්වයේ, ඉහළ-එන්ට්‍රොපි මුරපද ශෛලියට සමාන වූ (අක්ෂර 10, සංඛ්‍යා අහඹු සංයෝජනය, ඉහළ සහ කුඩා අකුරු, විශේෂ අක්ෂර නොමැති, ආරම්භයේ සහ අවසානයේ විශාල අකුරු) සහ නැවත භාවිතා කරන ලදී. නැවත භාවිත කිරීමේ අනුපාතය තරමක් අඩු විය (මෙම සමහර මුරපද 10 වතාවක් පුනරාවර්තනය විය), නමුත් තවමත් මෙම මට්ටමේ මුරපද සඳහා බලාපොරොත්තු වූවාට වඩා වැඩි ය.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න