මෙම ලිපියෙන් අපි පරිවර්තනයේ න්යායික ගණනය කිරීම් විශ්ලේෂණය කරමු රේඛීය ප්රතිගාමී කාර්යයන් в ප්රතිලෝම ලොජිට් පරිවර්තන ශ්රිතය (නොඑසේ නම් ලොජිස්ටික් ප්රතිචාර ශ්රිතය ලෙස හැඳින්වේ). ඉන්පසුව, අවි ගබඩාව භාවිතා කිරීම උපරිම සම්භාවිතා ක්රමය, ලොජිස්ටික් ප්රතිගාමී ආකෘතියට අනුකූලව, අපි පාඩු ශ්රිතය ලබා ගනිමු ලොජිස්ටික් පාඩුව, හෝ වෙනත් වචන වලින් කිවහොත්, ලොජිස්ටික් ප්රතිගාමී ආකෘතියේ බර දෛශිකයේ පරාමිතීන් තෝරා ගන්නා ශ්රිතයක් අපි අර්ථ දක්වන්නෙමු. .
ලිපි දළ සටහන:
- අපි විචල්ය දෙකක් අතර රේඛීය සම්බන්ධතාවය නැවත කියමු
- පරිවර්තනයේ අවශ්යතාවය හඳුනා ගනිමු රේඛීය ප්රතිගාමී කාර්යයන් в ලොජිස්ටික් ප්රතිචාර ශ්රිතය
- අපි පරිවර්තනයන් සහ ප්රතිදානය සිදු කරමු ලොජිස්ටික් ප්රතිචාර ශ්රිතය
- පරාමිති තෝරාගැනීමේදී අඩුම වර්ග ක්රමය නරක වන්නේ මන්දැයි තේරුම් ගැනීමට උත්සාහ කරමු කාර්යයන් ලොජිස්ටික් පාඩුව
- අපි පාවිච්චි කරන්නේ උපරිම සම්භාවිතා ක්රමය තීරණය කිරීම සඳහා පරාමිති තේරීමේ කාර්යයන් :
5.1 නඩුව 1: කාර්යය ලොජිස්ටික් පාඩුව පන්ති තනතුරු සහිත වස්තූන් සඳහා 0 и 1:
5.2 නඩුව 2: කාර්යය ලොජිස්ටික් පාඩුව පන්ති තනතුරු සහිත වස්තූන් සඳහා -1 и +1:
සියලුම ගණනය කිරීම් වාචිකව හෝ කඩදාසි මත සිදු කිරීමට පහසු වන සරල උදාහරණ වලින් ලිපිය පිරී ඇත; සමහර අවස්ථාවලදී, ගණක යන්ත්රයක් අවශ්ය විය හැකිය. එහෙනම් ලෑස්ති වෙන්න :)
මෙම ලිපිය මූලික වශයෙන් අදහස් කරන්නේ යන්ත්ර ඉගෙනීමේ මූලික කරුණු පිළිබඳ මූලික මට්ටමේ දැනුමක් ඇති දත්ත විද්යාඥයින් සඳහා ය.
මෙම ලිපිය ප්රස්ථාර ඇඳීම සහ ගණනය කිරීම් සඳහා කේතයක් ද සපයනු ඇත. සියලුම කේතය භාෂාවෙන් ලියා ඇත පයිතන් 2.7. භාවිතා කරන ලද අනුවාදයේ "නවත්වය" ගැන කල්තියා පැහැදිලි කිරීමට මට ඉඩ දෙන්න - මෙය සුප්රසිද්ධ පාඨමාලාව හැදෑරීම සඳහා කොන්දේසි වලින් එකකි. යාන්ඩෙක්ස් සමානව ප්රසිද්ධ සබැඳි අධ්යාපන වේදිකාවක් මත Coursera, සහ, කෙනෙකුට උපකල්පනය කළ හැකි පරිදි, මෙම පාඨමාලාව මත පදනම්ව ද්රව්ය සකස් කරන ලදී.
01. සෘජු රේඛා යැපීම
ප්රශ්නය ඇසීම තරමක් සාධාරණ ය - රේඛීය යැපීම සහ ලොජිස්ටික් ප්රතිගමනය එයට සම්බන්ධ වන්නේ කුමක්ද?
ඒක සරලයි! ලොජිස්ටික් ප්රතිගමනය යනු රේඛීය වර්ගීකරණයට අයත් මාදිලි වලින් එකකි. සරල වචන වලින් කිවහොත්, රේඛීය වර්ගීකරණයක කාර්යය වන්නේ ඉලක්ක අගයන් පුරෝකථනය කිරීමයි විචල්ය වලින් (ප්රතිගාමී) . ලක්ෂණ අතර යැපීම බව විශ්වාස කෙරේ සහ ඉලක්ක අගයන් රේඛීය. එබැවින් වර්ගීකරණයේ නම - රේඛීය. එය ඉතා දළ වශයෙන් කිවහොත්, ලොජිස්ටික් ප්රතිගාමී ආකෘතිය පදනම් වී ඇත්තේ ලක්ෂණ අතර රේඛීය සම්බන්ධතාවයක් ඇති බවට උපකල්පනය කිරීම මතය. සහ ඉලක්ක අගයන් . මෙය සම්බන්ධතාවයයි.
චිත්රාගාරයේ පළමු උදාහරණය ඇති අතර, එය නිවැරදිව, අධ්යයනය කරන ලද ප්රමාණවල සෘජුකෝණාස්රාකාර යැපීම ගැන ය. ලිපිය සකස් කිරීමේ ක්රියාවලියේදී, දැනටමත් බොහෝ මිනිසුන් අද්දර තබා ඇති උදාහරණයක් මට හමු විය - වෝල්ටීයතාවය මත ධාරාව රඳා පැවතීම ("ව්යවහාරික ප්රතිගාමී විශ්ලේෂණය", N. Draper, G. Smith). අපි ඒකත් මෙතනින් බලමු.
අනුකූලව ඕම්ගේ නීතිය:
කොහෙද - වත්මන් ශක්තිය, - වෝල්ටියතාවය, - ප්රතිරෝධය.
අපි දැනගෙන හිටියේ නැත්නම් ඕම්ගේ නීතිය, එවිට අපට යැපීම වෙනස් කිරීමෙන් ආනුභවිකව සොයාගත හැකිය සහ මැනීම , සහාය දෙන අතරතුර ස්ථාවර. එවිට අපට පෙනෙන්නේ යැපීම් ප්රස්ථාරය බව ය от සම්භවය හරහා වැඩි හෝ අඩු සරල රේඛාවක් ලබා දෙයි. අපි "වැඩි හෝ අඩු" යැයි කියන්නේ, සම්බන්ධතාවය ඇත්ත වශයෙන්ම නිවැරදි වුවද, අපගේ මිනුම්වල කුඩා දෝෂ අඩංගු විය හැකි අතර, එම නිසා ප්රස්ථාරයේ ලකුණු හරියටම රේඛාවට වැටෙන්නේ නැති නමුත් අහඹු ලෙස එය වටා විසිරී යනු ඇත.
ප්රස්තාරය 1 "යැපීම" от »
ප්රස්ථාර ඇඳීමේ කේතය
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import random
R = 13.75
x_line = np.arange(0,220,1)
y_line = []
for i in x_line:
y_line.append(i/R)
y_dot = []
for i in y_line:
y_dot.append(i+random.uniform(-0.9,0.9))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(x_line,y_line,color = 'purple',lw = 3, label = 'I = U/R')
plt.scatter(x_line,y_dot,color = 'red', label = 'Actual results')
plt.xlabel('I', size = 16)
plt.ylabel('U', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
02. රේඛීය ප්රතිගාමී සමීකරණය පරිවර්තනය කිරීමේ අවශ්යතාවය
අපි තවත් උදාහරණයක් බලමු. අපි හිතමු අපි බැංකුවක වැඩ කරන අතර අපගේ කාර්යය වන්නේ ණය ගැනුම්කරු යම් යම් සාධක මත ණය ආපසු ගෙවීමේ සම්භාවිතාව තීරණය කිරීමයි. කාර්යය සරල කිරීම සඳහා, අපි සාධක දෙකක් පමණක් සලකා බලමු: ණය ගැනුම්කරුගේ මාසික වැටුප සහ මාසික ණය ආපසු ගෙවීමේ මුදල.
කාර්යය ඉතා කොන්දේසි සහිත ය, නමුත් මෙම උදාහරණයෙන් එය භාවිතා කිරීමට ප්රමාණවත් නොවන්නේ මන්දැයි අපට තේරුම් ගත හැකිය රේඛීය ප්රතිගාමී කාර්යයන්, සහ කාර්යය සමඟ සිදු කළ යුතු පරිවර්තනයන් මොනවාදැයි සොයා බලන්න.
අපි නැවතත් උදාහරණයට යමු. වැටුප් වැඩි වන තරමට ණය ගැණුම්කරුට ණය ආපසු ගෙවීම සඳහා මාසිකව වෙන් කිරීමට හැකි වන බව වටහා ගත හැකිය. ඒ අතරම, යම් වැටුප් පරාසයක් සඳහා මෙම සම්බන්ධතාවය තරමක් රේඛීය වනු ඇත. උදාහරණයක් ලෙස, අපි RUR 60.000 සිට RUR 200.000 දක්වා වැටුප් පරාසයක් ගනිමු සහ නිශ්චිත වැටුප් පරාසය තුළ, වැටුප් ප්රමාණය මත මාසික ගෙවීමේ ප්රමාණයේ රඳා පැවැත්ම රේඛීය වේ. නිශ්චිත වැටුප් පරාසයක් සඳහා වැටුප්-ගෙවීම් අනුපාතය 3 ට වඩා පහත වැටිය නොහැකි බව හෙළි වූ බවත්, ණය ගැණුම්කරු තවමත් සංචිතයේ RUR 5.000 ක් තිබිය යුතු බවත් කියමු. මෙම අවස්ථාවේ දී පමණක්, ණය ගැණුම්කරු බැංකුවට ණය ආපසු ගෙවනු ඇතැයි අපි උපකල්පනය කරමු. එවිට, රේඛීය ප්රතිගාමී සමීකරණය පෝරමය ගනී:
එහිදී , , , - වැටුප - ණය ගැනුම්කරු, - ණය ගෙවීම - ණය ගැනුම්කරු.
ස්ථාවර පරාමිතීන් සමඟ වැටුප් සහ ණය ගෙවීම සමීකරණයට ආදේශ කිරීම ණයක් නිකුත් කිරීම හෝ ප්රතික්ෂේප කිරීම ඔබට තීරණය කළ හැකිය.
ඉදිරිය දෙස බලන විට, දී ඇති පරාමිතීන් සමඟ අපි එය සටහන් කරමු රේඛීය ප්රතිගාමී ශ්රිතය, භාවිතා වේ ලොජිස්ටික් ප්රතිචාර කාර්යයන් ණය ආපසු ගෙවීමේ සම්භාවිතාව තීරණය කිරීම සඳහා ගණනය කිරීම් සංකීර්ණ කරන විශාල අගයන් නිෂ්පාදනය කරනු ඇත. එබැවින්, අපගේ සංගුණක අඩු කිරීමට යෝජනා කර ඇත, අපි කියමු, 25.000 ගුණයකින්. සංගුණකවල මෙම පරිවර්තනය ණයක් නිකුත් කිරීමේ තීරණය වෙනස් නොකරනු ඇත. අනාගතය සඳහා මෙම කරුණ මතක තබා ගනිමු, නමුත් දැන්, අප කතා කරන්නේ කුමක් ද යන්න වඩාත් පැහැදිලි කිරීමට, විභව ණය ගැතියන් තිදෙනෙකු සමඟ තත්වය සලකා බලමු.
වගුව 1 "විභව ණය ගැතියන්"
වගුව උත්පාදනය සඳහා කේතය
import pandas as pd
r = 25000.0
w_0 = -5000.0/r
w_1 = 1.0/r
w_2 = -3.0/r
data = {'The borrower':np.array(['Vasya', 'Fedya', 'Lesha']),
'Salary':np.array([120000,180000,210000]),
'Payment':np.array([3000,50000,70000])}
df = pd.DataFrame(data)
df['f(w,x)'] = w_0 + df['Salary']*w_1 + df['Payment']*w_2
decision = []
for i in df['f(w,x)']:
if i > 0:
dec = 'Approved'
decision.append(dec)
else:
dec = 'Refusal'
decision.append(dec)
df['Decision'] = decision
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision']]
වගුවේ ඇති දත්ත වලට අනුව, RUR 120.000 ක වැටුපක් සහිත Vasya, RUR 3.000 කින් මාසිකව ආපසු ගෙවීමට හැකි වන පරිදි ණයක් ලබා ගැනීමට අවශ්ය වේ. ණය අනුමත කිරීම සඳහා, Vasyaගේ වැටුප ගෙවීමේ ප්රමාණය මෙන් තුන් ගුණයක් ඉක්මවිය යුතු අතර, තවමත් RUR 5.000 ක් ඉතිරිව තිබිය යුතු බව අපි තීරණය කළෙමු. Vasya මෙම අවශ්යතාව තෘප්තිමත් කරයි: . 106.000 RUR පවා ඉතිරි වේ. ගණනය කිරීමේදී යන කාරණය තිබියදීත් අපි අවාසි අඩු කර ඇත 25.000 වාරයක්, ප්රතිඵලය සමාන විය - ණය අනුමත කළ හැකිය. ෆෙඩියාට ද ණයක් ලැබෙනු ඇත, නමුත් ලෙෂාට වැඩිපුරම ලැබුණද, ඔහුගේ ආහාර රුචිය මැඩපැවැත්වීමට සිදුවනු ඇත.
මෙම නඩුව සඳහා ප්රස්තාරයක් අඳින්න.
ප්රස්ථාර 2 “ණය ගන්නන් වර්ගීකරණය”
ප්රස්ථාරය ඇඳීම සඳහා කේතය
salary = np.arange(60000,240000,20000)
payment = (-w_0-w_1*salary)/w_2
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(salary, payment, color = 'grey', lw = 2, label = '$f(w,x_i)=w_0 + w_1x_{i1} + w_2x_{i2}$')
plt.plot(df[df['Decision'] == 'Approved']['Salary'], df[df['Decision'] == 'Approved']['Payment'],
'o', color ='green', markersize = 12, label = 'Decision - Loan approved')
plt.plot(df[df['Decision'] == 'Refusal']['Salary'], df[df['Decision'] == 'Refusal']['Payment'],
's', color = 'red', markersize = 12, label = 'Decision - Loan refusal')
plt.xlabel('Salary', size = 16)
plt.ylabel('Payment', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
එබැවින්, අපගේ සරල රේඛාව, කාර්යයට අනුකූලව ගොඩනගා ඇත , "නරක" ණය ගැතියන් "හොඳ" අයගෙන් වෙන් කරයි. ඔවුන්ගේ ආශාවන් ඔවුන්ගේ හැකියාවන් සමඟ නොගැලපෙන ණය ගැතියන් රේඛාවට ඉහළින් (ලෙෂා) සිටින අතර, අපගේ ආකෘතියේ පරාමිතීන් අනුව, ණය ආපසු ගෙවීමට හැකි අය රේඛාවට පහළින් (වාස්යා සහ ෆෙඩියා) සිටිති. වෙනත් වචන වලින් කිවහොත්, අපට මෙය පැවසිය හැකිය: අපගේ සෘජු රේඛාව ණය ගැතියන් පන්ති දෙකකට බෙදා ඇත. අපි ඒවා පහත පරිදි දක්වන්නෙමු: පන්තියට ණය ආපසු ගෙවීමට බොහෝ දුරට ඉඩ ඇති ණය ගැතියන් අපි වර්ග කරන්නෙමු හෝ බොහෝ විට ණය ආපසු ගෙවීමට නොහැකි වන ණය ගැතියන් අපි ඇතුළත් කරන්නෙමු.
මෙම සරල උදාහරණයෙන් නිගමන සාරාංශ කරමු. අපි කරුණක් ගනිමු සහ, ලක්ෂ්යයේ ඛණ්ඩාංක රේඛාවේ අනුරූප සමීකරණයට ආදේශ කිරීම , විකල්ප තුනක් සලකා බලන්න:
- ලක්ෂ්යය රේඛාව යටතේ නම් සහ අපි එය පන්තියට පවරමු , එවිට ශ්රිතයේ අගය සිට ධනාත්මක වනු ඇත කිරීමට . මෙයින් අදහස් කරන්නේ ණය ආපසු ගෙවීමේ සම්භාවිතාව ඇතුළත බව අපට උපකල්පනය කළ හැකිය . ක්රියාකාරී අගය විශාල වන තරමට සම්භාවිතාව වැඩි වේ.
- ලක්ෂ්යයක් රේඛාවකට ඉහළින් ඇත්නම් සහ අපි එය පන්තියට පවරමු හෝ , එවිට ශ්රිතයේ අගය සෘණාත්මක වනු ඇත කිරීමට . එවිට ණය ආපසු ගෙවීමේ සම්භාවිතාව ඇතුළත යැයි අපි උපකල්පනය කරමු සහ, ශ්රිතයේ නිරපේක්ෂ අගය වැඩි වන තරමට අපගේ විශ්වාසය වැඩි වේ.
- ලක්ෂ්යය සරල රේඛාවක් මත, පන්ති දෙකක් අතර මායිම මත වේ. මෙම අවස්ථාවේදී, ශ්රිතයේ අගය සමාන වනු ඇත සහ ණය ආපසු ගෙවීමේ සම්භාවිතාව සමාන වේ .
දැන්, අපට සාධක දෙකක් නොව දුසිම් ගනනක් සහ තුනක් නොව දහස් ගණනක් ණය ගැතියන් සිටින බව සිතමු. එවිට සරල රේඛාවක් වෙනුවට අපට ලැබෙනු ඇත m-dimensional තලය සහ සංගුණක අපි වාතයෙන් පිටතට ගෙන නොයනු ඇත, නමුත් සියලු නීතිරීතිවලට අනුව ව්යුත්පන්න කර ඇති අතර, ණය ආපසු ගෙවා ඇති හෝ නොගෙවූ ණය ගැතියන් පිළිබඳ සමුච්චිත දත්ත මත පදනම්ව. ඇත්ත වශයෙන්ම, අපි දැන් දැනටමත් දන්නා සංගුණක භාවිතා කරමින් ණය ගැතියන් තෝරා ගන්නා බව සලකන්න . ඇත්ත වශයෙන්ම, ලොජිස්ටික් ප්රතිගාමී ආකෘතියේ කාර්යය වන්නේ පරාමිතීන් තීරණය කිරීමයි , අහිමි ශ්රිතයේ අගය ලොජිස්ටික් පාඩුව අවම වශයෙන් නැඹුරු වනු ඇත. නමුත් දෛශිකය ගණනය කරන ආකාරය ගැන , අපි ලිපියේ 5 වන කොටසින් වැඩි විස්තර සොයා බලමු. මේ අතරතුර, අපි පොරොන්දු වූ ඉඩම වෙත ආපසු යන්නෙමු - අපගේ බැංකුකරු සහ ඔහුගේ ගනුදෙනුකරුවන් තිදෙනා වෙත.
කාර්යයට ස්තූතියි ණයක් දිය හැක්කේ කාටද සහ ප්රතික්ෂේප කළ යුත්තේ කාටද යන්න අපි දනිමු. නමුත් ඔබට එවැනි තොරතුරු සමඟ අධ්යක්ෂ වෙත යා නොහැක, මන්ද ඔවුන් එක් එක් ණය ගැණුම්කරු විසින් ණය ආපසු ගෙවීමේ සම්භාවිතාව අපෙන් ලබා ගැනීමට අවශ්ය වූ බැවිනි. කුමක් කරන්න ද? පිළිතුර සරලයි - අපි කෙසේ හෝ කාර්යය පරිවර්තනය කළ යුතුය , එහි අගයන් පරාසය තුළ පවතී අගයන් පරාසය තුළ පවතින ශ්රිතයකට . තවද එවැනි කාර්යයක් පවතී, එය හැඳින්වේ ලොජිස්ටික් ප්රතිචාර ශ්රිතය හෝ ප්රතිලෝම-ලොජිට් පරිවර්තනය. හමුවන්න:
එය ක්රියාත්මක වන ආකාරය පියවරෙන් පියවර බලමු ලොජිස්ටික් ප්රතිචාර ශ්රිතය. අපි ප්රතිවිරුද්ධ දිශාවට ගමන් කරන බව සලකන්න, i.e. සිට පරාසය තුළ පවතින සම්භාවිතා අගය අප දන්නා බව අපි උපකල්පනය කරමු කිරීමට ඉන්පසුව අපි මෙම අගය මුළු සංඛ්යා පරාසයටම “අවසන්” කරන්නෙමු කිරීමට .
03. අපි ලොජිස්ටික් ප්රතිචාර ශ්රිතය ලබා ගනිමු
පියවර 1. සම්භාවිතා අගයන් පරාසයක් බවට පරිවර්තනය කරන්න
කාර්යය පරිවර්තනය අතරතුර в ලොජිස්ටික් ප්රතිචාර ශ්රිතය අපි අපගේ ණය විශ්ලේෂකයා තනි කර, ඒ වෙනුවට පොත් තබන්නන් වෙත සංචාරය කරන්නෙමු. නැත, ඇත්ත වශයෙන්ම, අපි ඔට්ටු අල්ලන්නේ නැත, අපට උනන්දුවක් දක්වන සියල්ල ප්රකාශනයේ තේරුමයි, උදාහරණයක් ලෙස, අවස්ථාව 4 සිට 1 දක්වා වේ. සියලු ඔට්ටු අල්ලන්නන්ට හුරුපුරුදු අවාසිය වන්නේ “සාර්ථකත්වයේ” අනුපාතයයි “ අසාර්ථකත්වයන්". සම්භාවිතා අනුව, අසමතුලිතතාවය යනු සිදුවීමක් සිදුවීමේ සම්භාවිතාව සිදුවීම සිදු නොවන සම්භාවිතාවෙන් බෙදීමයි. සිදුවීමක් සිදුවීමේ අවස්ථාව සඳහා සූත්රය ලියා තබමු :
කොහෙද - සිදුවීමක් සිදුවීමේ සම්භාවිතාව, - සිදු නොවන සිදුවීමක සම්භාවිතාව
උදාහරණයක් ලෙස, "Veterok" යන අන්වර්ථ නාමයෙන් හඳුන්වන තරුණ, ශක්තිමත් සහ සෙල්ලක්කාර අශ්වයෙකු තරඟයකදී "මැටිල්ඩා" නම් මහලු සහ දුර්වල මහලු කාන්තාවක් පරාජය කිරීමේ සම්භාවිතාව සමාන වේ නම් , එවිට "Veterok" සඳහා සාර්ථකත්වයේ අවස්ථා වනු ඇත к සහ අනෙක් අතට, අවාසි දැන සිටීම, සම්භාවිතාව ගණනය කිරීම අපට අපහසු නොවනු ඇත :
මේ අනුව, සම්භාවිතාව අවස්ථා බවට “පරිවර්තනය” කිරීමට අපි ඉගෙන ගෙන ඇති අතර එමඟින් අගයන් ලබා ගනී කිරීමට . අපි තවත් එක් පියවරක් ගෙන සම්පූර්ණ සංඛ්යා රේඛාවට සම්භාවිතාව “පරිවර්තනය” කිරීමට ඉගෙන ගනිමු කිරීමට .
පියවර 2. සම්භාවිතා අගයන් පරාසයක් බවට පරිවර්තනය කරන්න
මෙම පියවර ඉතා සරලයි - අපි ඉයුලර්ගේ සංඛ්යාවේ පාදයට අවාසි වල ලඝුගණකය ගනිමු. සහ අපට ලැබෙන්නේ:
දැන් අපි දන්නවා එහෙම නම් , ඉන්පසු අගය ගණනය කරන්න ඉතා සරල වනු ඇති අතර, එපමනක් නොව, එය ධනාත්මක විය යුතුය: . මෙය සත්යයයි.
කුතුහලයෙන්, අපි බලමු කුමක් දැයි සොයා බලමු , එවිට අපි සෘණ අගයක් දැකීමට බලාපොරොත්තු වෙමු . අපි පරීක්ෂා කරමු: . ඒක හරි.
දැන් අපි දන්නවා සම්භාවිතා අගය පරිවර්තනය කරන්නේ කෙසේද කියා කිරීමට සිට සම්පූර්ණ සංඛ්යා රේඛාව ඔස්සේ කිරීමට . ඊළඟ පියවරේදී අපි ප්රතිවිරුද්ධ දේ කරන්නෙමු.
දැනට, ලඝුගණක නීතිවලට අනුකූලව, ශ්රිතයේ වටිනාකම දැන ගැනීම බව අපි සටහන් කරමු. , ඔබට අවාසි ගණනය කළ හැකිය:
මෙම අසමතුලිතතාවය තීරණය කිරීමේ ක්රමය ඊළඟ පියවරේදී අපට ප්රයෝජනවත් වනු ඇත.
පියවර 3. තීරණය කිරීම සඳහා සූත්රයක් ව්යුත්පන්න කරමු
ඉතින් අපි ඉගෙන ගත්තා, දැනගෙන , ශ්රිත අගයන් සොයන්න . කෙසේ වෙතත්, ඇත්ත වශයෙන්ම, අපට හරියටම ප්රතිවිරුද්ධය අවශ්යයි - වටිනාකම දැන ගැනීම සොයා ගැනීමට . මෙය සිදු කිරීම සඳහා, අපි ප්රතිලෝම අවාසි ශ්රිතය වැනි සංකල්පයක් වෙත හැරෙමු, ඒ අනුව:
ලිපියේ අපි ඉහත සූත්රය ව්යුත්පන්න නොකරනු ඇත, නමුත් අපි ඉහත උදාහරණයේ සංඛ්යා භාවිතා කර එය පරීක්ෂා කරන්නෙමු. අපි දන්නවා 4 සිට 1 දක්වා අවාසි සහිතව (), සිදුවීම සිදුවීමේ සම්භාවිතාව 0.8 () අපි ආදේශකයක් කරමු: . මෙය කලින් සිදු කරන ලද අපගේ ගණනය කිරීම් සමඟ සමපාත වේ. අපි ඉදිරියට යමු.
අවසාන පියවරේදී අපි එය නිගමනය කළෙමු , එයින් අදහස් වන්නේ ඔබට ප්රතිලෝම odds ශ්රිතයේ ආදේශනයක් කළ හැකි බවයි. අපට ලැබෙන්නේ:
ඉලක්කම් සහ හරය යන දෙකම බෙදන්න එවිට:
යම් අවස්ථාවකදී, අප කොතැනකවත් වරදක් කර නොමැති බව තහවුරු කර ගැනීම සඳහා, අපි තවත් කුඩා පරීක්ෂාවක් කරන්නෙමු. පියවර 2 දී, අපි සඳහා බව තීරණය කළා . ඉන්පසුව, අගය ආදේශ කිරීම ලොජිස්ටික් ප්රතිචාර ශ්රිතයට, අපි ලබා ගැනීමට බලාපොරොත්තු වෙමු . අපි ආදේශ කර ලබා ගනිමු:
සුභ පැතුම්, හිතවත් පාඨකය, අපි දැන් ලොජිස්ටික් ප්රතිචාර ශ්රිතය ව්යුත්පන්න කර පරීක්ෂා කර ඇත. අපි ශ්රිතයේ ප්රස්ථාරය දෙස බලමු.
ප්රස්තාරය 3 “ලොජිස්ටික් ප්රතිචාර ශ්රිතය”
ප්රස්ථාරය ඇඳීම සඳහා කේතය
import math
def logit (f):
return 1/(1+math.exp(-f))
f = np.arange(-7,7,0.05)
p = []
for i in f:
p.append(logit(i))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(f, p, color = 'grey', label = '$ 1 / (1+e^{-w^Tx_i})$')
plt.xlabel('$f(w,x_i) = w^Tx_i$', size = 16)
plt.ylabel('$p_{i+}$', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
සාහිත්යය තුළ ඔබට මෙම ශ්රිතයේ නම ද සොයාගත හැකිය සිග්මෝයිඩ් ශ්රිතය. පන්තියකට අයත් වස්තුවක සම්භාවිතාවේ ප්රධාන වෙනස සාපේක්ෂව කුඩා පරාසයක් තුළ සිදුවන බව ප්රස්ථාරයෙන් පැහැදිලිව පෙන්වයි. , කොහෙන් හරි කිරීමට .
අපගේ ණය විශ්ලේෂකයා වෙත ආපසු ගොස් ණය ආපසු ගෙවීමේ සම්භාවිතාව ගණනය කිරීමට ඔහුට උදව් කරන ලෙස මම යෝජනා කරමි, එසේ නොමැතිනම් ඔහුට ප්රසාද දීමනාවක් නොමැතිව ඉතිරි වීමේ අවදානමක් ඇත :)
වගුව 2 "විභව ණය ගැතියන්"
වගුව උත්පාදනය සඳහා කේතය
proba = []
for i in df['f(w,x)']:
proba.append(round(logit(i),2))
df['Probability'] = proba
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision', 'Probability']]
එබැවින්, ණය ආපසු ගෙවීමේ සම්භාවිතාව අපි තීරණය කර ඇත. පොදුවේ ගත් කල, මෙය සත්යයක් බව පෙනේ.
ඇත්ත වශයෙන්ම, RUR 120.000 ක වැටුපක් ඇති Vasya, සෑම මසකම RUR 3.000 ක් බැංකුවට ලබා දීමට හැකි වීමේ සම්භාවිතාව 100% කට ආසන්න වේ. මාර්ගය වන විට, බැංකුවේ ප්රතිපත්තිය මඟින් 0.3 ට වඩා වැඩි ණය ආපසු ගෙවීමේ සම්භාවිතාවක් සහිත ගනුදෙනුකරුවන්ට ණය ලබා දීම සඳහා බැංකුවකට ලෙෂා වෙත ණයක් නිකුත් කළ හැකි බව අප තේරුම් ගත යුතුය. මෙම අවස්ථාවේ දී බැංකුව සිදුවිය හැකි පාඩු සඳහා විශාල සංචිතයක් නිර්මාණය කරනු ඇත.
අවම වශයෙන් 3 ක වැටුප්-ගෙවීම් අනුපාතය සහ RUR 5.000 ක ආන්තිකයක් සමඟ සිවිලිමෙන් ලබා ගත් බව ද සටහන් කළ යුතුය. එමනිසා, බර දෛශිකය එහි මුල් ස්වරූපයෙන් භාවිතා කළ නොහැක . අපට සංගුණක විශාල ලෙස අඩු කිරීමට අවශ්ය වූ අතර, මේ අවස්ථාවේ දී අපි එක් එක් සංගුණකය 25.000 කින් බෙදුවෙමු, එනම් සාරය වශයෙන් අපි ප්රති result ලය සකස් කළෙමු. නමුත් මූලික අදියරේදී ද්රව්යය පිළිබඳ අවබෝධය සරල කිරීම සඳහා මෙය විශේෂයෙන් සිදු කරන ලදී. ජීවිතයේ දී, අපට සංගුණක සොයා ගැනීමට සහ සකස් කිරීමට අවශ්ය නොවනු ඇත, නමුත් ඒවා සොයා ගන්න. ලිපියේ ඊළඟ කොටස්වලදී අපි පරාමිති තෝරාගෙන ඇති සමීකරණ ලබා ගනිමු .
04. බරෙහි දෛශිකය නිර්ණය කිරීම සඳහා අවම කොටු ක්රමය ලොජිස්ටික් ප්රතිචාර ශ්රිතයේ
බර දෛශිකයක් තෝරා ගැනීම සඳහා මෙම ක්රමය අපි දැනටමත් දනිමු ලෙසයි අවම වර්ග ක්රමය (LSM) ඇත්ත වශයෙන්ම, ද්විමය වර්ගීකරණ ගැටළු වලදී අපි එය භාවිතා නොකරන්නේ මන්ද? ඇත්ත වශයෙන්ම, කිසිවක් භාවිතා කිරීමෙන් ඔබව වළක්වන්නේ නැත MNC, වර්ගීකරණ ගැටළු වලදී මෙම ක්රමය පමණක් වඩා අඩු නිවැරදි ප්රතිඵල ලබා දෙයි ලොජිස්ටික් පාඩුව. මේ සඳහා න්යායික පදනමක් ඇත. අපි මුලින්ම සරල උදාහරණයක් බලමු.
අපි හිතමු අපේ මාදිලි (භාවිතා කිරීම MSE и ලොජිස්ටික් පාඩුව) දැනටමත් බරෙහි දෛශිකය තෝරා ගැනීම ආරම්භ කර ඇත සහ අපි යම් පියවරකදී ගණනය කිරීම නතර කළා. මැදද, අවසානයේද, ආරම්භයේද යන්න ගැටළුවක් නොවේ, ප්රධාන දෙය නම්, අපට දැනටමත් බර දෛශිකයේ සමහර අගයන් තිබීමයි, මෙම පියවරේදී බරෙහි දෛශිකය යැයි උපකල්පනය කරමු. මාදිලි දෙකම සඳහා වෙනස්කම් නොමැත. ඉන්පසු ලැබෙන බර ගෙන ඒවා ආදේශ කරන්න ලොජිස්ටික් ප්රතිචාර ශ්රිතය () පන්තියට අයත් යම් වස්තුවක් සඳහා . තෝරාගත් බර දෛශිකයට අනුකූලව, අපගේ ආකෘතිය ඉතා වැරදියි සහ අනෙක් අතට - අපි අවස්ථා දෙකක් පරීක්ෂා කරමු - වස්තුව පන්තියට අයත් බව ආකෘතිය ඉතා විශ්වාසයි. . භාවිතා කරන විට නිකුත් කරන දඩ මොනවාදැයි බලමු MNC и ලොජිස්ටික් පාඩුව.
භාවිතා කරන අලාභ ශ්රිතය අනුව දඬුවම් ගණනය කිරීමට කේතය
# класс объекта
y = 1
# вероятность отнесения объекта к классу в соответствии с параметрами w
proba_1 = 0.01
MSE_1 = (y - proba_1)**2
print 'Штраф MSE при грубой ошибке =', MSE_1
# напишем функцию для вычисления f(w,x) при известной вероятности отнесения объекта к классу +1 (f(w,x)=ln(odds+))
def f_w_x(proba):
return math.log(proba/(1-proba))
LogLoss_1 = math.log(1+math.exp(-y*f_w_x(proba_1)))
print 'Штраф Log Loss при грубой ошибке =', LogLoss_1
proba_2 = 0.99
MSE_2 = (y - proba_2)**2
LogLoss_2 = math.log(1+math.exp(-y*f_w_x(proba_2)))
print '**************************************************************'
print 'Штраф MSE при сильной уверенности =', MSE_2
print 'Штраф Log Loss при сильной уверенности =', LogLoss_2
වරදක් පිළිබඳ නඩුවක් - ආකෘතිය පන්තියකට වස්තුවක් පවරයි 0,01 සම්භාවිතාවක් සහිතව
භාවිතය මත දඩ MNC වනුයේ:
භාවිතය මත දඩ ලොජිස්ටික් පාඩුව වනුයේ:
දැඩි විශ්වාසයක් ඇති අවස්ථාවක් - ආකෘතිය පන්තියකට වස්තුවක් පවරයි 0,99 සම්භාවිතාවක් සහිතව
භාවිතය මත දඩ MNC වනුයේ:
භාවිතය මත දඩ ලොජිස්ටික් පාඩුව වනුයේ:
දළ දෝෂයක් ඇති වූ විට පාඩු ශ්රිතය සිදුවන බව මෙම උදාහරණයෙන් මනාව පැහැදිලි වේ ලොග් පාඩුව වඩා සැලකිය යුතු ලෙස ආකෘතියට දඬුවම් කරයි MSE. අපි දැන් තේරුම් ගනිමු පාඩු ශ්රිතය භාවිතා කිරීමේ න්යායික පසුබිම කුමක්ද කියා ලොග් පාඩුව වර්ගීකරණ ගැටළු වලදී.
05. උපරිම සම්භාවිතා ක්රමය සහ ලොජිස්ටික් ප්රතිගාමීත්වය
ආරම්භයේ දී පොරොන්දු වූ පරිදි, ලිපිය සරල උදාහරණ වලින් පිරී ඇත. චිත්රාගාරයේ තවත් උදාහරණයක් සහ පැරණි අමුත්තන් ඇත - බැංකු ණය ගැතියන්: Vasya, Fedya සහ Lesha.
උදාහරණය වර්ධනය කිරීමට පෙර, ජීවිතයේ දී අපි දස හෝ සිය ගණනක් විශේෂාංග සහිත දහස් ගණනක් හෝ මිලියන ගණනක වස්තු පුහුණු නියැදියක් සමඟ කටයුතු කරන බව මම ඔබට මතක් කරමි. කෙසේ වෙතත්, මෙහි සංඛ්යා නවක දත්ත විද්යාඥයෙකුගේ හිසට පහසුවෙන් ගැලපේ.
අපි ආදර්ශයට යමු. ලෙෂාට එය නිකුත් නොකරන ලෙස ඇල්ගොරිතමයෙන් පැවසුවද, බැංකුවේ අධ්යක්ෂවරයා අවශ්යතා ඇති සෑම කෙනෙකුටම ණයක් නිකුත් කිරීමට තීරණය කළ බව සිතමු. දැන් ප්රමාණවත් කාලයක් ගෙවී ගොස් ඇති අතර, අපි දන්නවා වීරයන් තිදෙනාගෙන් ණය ගෙවා ඇත්තේ කවුද සහ නොකළේ කවුද? අපේක්ෂා කළ යුතු දේ: වාස්යා සහ ෆෙඩියා ණය ආපසු ගෙවූ නමුත් ලෙෂා එසේ නොකළේය. දැන් අපි සිතමු මෙම ප්රතිඵලය අපට නව පුහුණු නියැදියක් වනු ඇති අතර, ඒ සමඟම, ණය ආපසු ගෙවීමේ සම්භාවිතාව කෙරෙහි බලපාන සාධක පිළිබඳ සියලු දත්ත (ණය ගැනුම්කරුගේ වැටුප, මාසික ගෙවීමේ ප්රමාණය) අතුරුදහන් වී ඇත. එවිට, බුද්ධිමය වශයෙන්, සෑම තුන්වන ණය ගැණුම්කරුවෙකුම බැංකුවට ණය ආපසු නොගෙවන බව අපට උපකල්පනය කළ හැකිය, නැතහොත් වෙනත් වචනවලින් කිවහොත්, ඊළඟ ණයගැතියා ණය ආපසු ගෙවීමේ සම්භාවිතාව . මෙම බුද්ධිමය උපකල්පනය න්යායික තහවුරු කිරීමක් ඇති අතර එය පදනම් වේ උපරිම සම්භාවිතා ක්රමය, බොහෝ විට සාහිත්යයේ එය හැඳින්වේ උපරිම සම්භාවිතා මූලධර්මය.
පළමුව, අපි සංකල්පීය උපකරණ සමඟ දැන හඳුනා ගනිමු.
නියැදි සම්භාවිතාව හරියටම එවැනි නියැදියක් ලබා ගැනීමේ සම්භාවිතාව, හරියටම එවැනි නිරීක්ෂණ/ප්රතිඵල ලබා ගැනීම, i.e. එක් එක් නියැදි ප්රතිඵල ලබා ගැනීමේ සම්භාවිතාවයේ ප්රතිඵලය (උදාහරණයක් ලෙස, Vasya, Fedya සහ Lesha යන අයගේ ණය ආපසු ගෙවා හෝ නොගෙවූයේ නම්).
සම්භාවිතා කාර්යය නියැදියක සම්භාවිතාව බෙදාහැරීමේ පරාමිතීන්ගේ අගයන්ට සම්බන්ධ කරයි.
අපගේ නඩුවේදී, පුහුණු නියැදිය සාමාන්යකරණය කරන ලද බර්නූලි යෝජනා ක්රමයකි, එහි අහඹු විචල්යය අගයන් දෙකක් පමණක් ගනී: හෝ . එබැවින්, නියැදි සම්භාවිතාව පරාමිතියේ සම්භාවිතා ශ්රිතයක් ලෙස ලිවිය හැක පහත පරිදි:
ඉහත ප්රවේශය මෙසේ අර්ථ දැක්විය හැක. Vasya සහ Fedya ණය ආපසු ගෙවීමේ ඒකාබද්ධ සම්භාවිතාව සමාන වේ , Lesha ණය ආපසු නොගෙවීමේ සම්භාවිතාව සමාන වේ (එය සිදු වූයේ ණය ආපසු ගෙවීම නොවන බැවින්), එබැවින් සිදුවීම් තුනේම ඒකාබද්ධ සම්භාවිතාව සමාන වේ .
උපරිම සම්භාවිතා ක්රමය නොදන්නා පරාමිතියක් උපරිම කිරීම මගින් තක්සේරු කිරීමේ ක්රමයකි සම්භාවිතා කාර්යයන්. අපගේ නඩුවේදී, එවැනි අගයක් සොයාගත යුතුය , එහිදී එහි උපරිමයට ළඟා වේ.
සැබෑ අදහස පැමිණෙන්නේ කොහෙන්ද - සම්භාවිතා ශ්රිතය උපරිමයට ළඟා වන නොදන්නා පරාමිතියක අගය සෙවීමට? අදහසෙහි මූලාරම්භය ජනගහණය පිළිබඳ අපට ලබා ගත හැකි එකම දැනුමේ මූලාශ්රය නියැදියක් යන අදහසෙනි. ජනගහනය ගැන අප දන්නා සෑම දෙයක්ම නියැදියෙන් නියෝජනය වේ. එමනිසා, අපට පැවසිය හැක්කේ නියැදියක් යනු අපට පවතින ජනගහනයේ වඩාත්ම නිවැරදි පරාවර්තනය බවයි. එබැවින්, පවතින නියැදිය වඩාත් සම්භාවිතාව බවට පත්වන පරාමිතියක් අපට සොයාගත යුතුය.
පැහැදිලිවම, අපි කටයුතු කරන්නේ ශ්රිතයක අන්ත ලක්ෂ්යය සොයා ගැනීමට අවශ්ය ප්රශස්තිකරණ ගැටලුවක් සමඟ ය. අන්ත ලක්ෂ්යය සොයා ගැනීම සඳහා, පළමු අනුපිළිවෙලෙහි කොන්දේසිය සලකා බැලීම අවශ්ය වේ, එනම් ශ්රිතයේ ව්යුත්පන්නය ශුන්යයට සමාන කර අපේක්ෂිත පරාමිතිය සම්බන්ධයෙන් සමීකරණය විසඳන්න. කෙසේ වෙතත්, සාධක විශාල සංඛ්යාවක නිෂ්පාදනයක ව්යුත්පන්නය සෙවීම දිගු කාර්යයක් විය හැකිය; මෙය වළක්වා ගැනීම සඳහා විශේෂ තාක්ෂණයක් ඇත - ලඝුගණකයට මාරුවීම සම්භාවිතා කාර්යයන්. එවැනි පරිවර්තනයක් සිදුවිය හැක්කේ ඇයි? අපි ශ්රිතයේම අන්තය සොයන්නේ නැති බව අවධානය යොමු කරමු, සහ අන්ත ලක්ෂ්යය, එනම් නොදන්නා පරාමිතියේ අගය , එහිදී එහි උපරිමයට ළඟා වේ. ලඝුගණකයකට ගමන් කරන විට, ලඝුගණකය ඒකාකාරී ශ්රිතයක් වන බැවින්, අන්ත ලක්ෂ්යය වෙනස් නොවේ (අන්තයම වෙනස් වුවද).
ඉහත කරුණු වලට අනුකූලව, Vasya, Fedya සහ Lesha වෙතින් ණය ලබා ගනිමින් අපගේ ආදර්ශය දිගටම කරගෙන යමු. මුලින්ම අපි ඉදිරියට යමු සම්භාවිතා ශ්රිතයේ ලඝුගණකය:
දැන් අපට ප්රකාශනය පහසුවෙන් වෙන්කර හඳුනාගත හැකිය :
අවසාන වශයෙන්, පළමු පෙළ කොන්දේසිය සලකා බලන්න - අපි ශ්රිතයේ ව්යුත්පන්නය ශුන්යයට සමාන කරමු:
මේ අනුව, ණය ආපසු ගෙවීමේ සම්භාවිතාව පිළිබඳ අපගේ බුද්ධිමය ඇස්තමේන්තුව න්යායාත්මකව යුක්ති සහගත විය.
නියමයි, නමුත් අපි දැන් මෙම තොරතුරු සමඟ කුමක් කළ යුතුද? සෑම තුන්වන ණය ගැතියෙක්ම බැංකුවට මුදල් ආපසු නොදෙන බව අපි උපකල්පනය කරන්නේ නම්, පසුව අනිවාර්යයෙන්ම බංකොලොත් වනු ඇත. එය හරි, නමුත් සමාන ණය ආපසු ගෙවීමේ සම්භාවිතාව තක්සේරු කිරීමේදී පමණි ණය ආපසු ගෙවීමට බලපාන සාධක අපි සැලකිල්ලට නොගත්තෙමු: ණය ගැනුම්කරුගේ වැටුප සහ මාසික ගෙවීමේ ප්රමාණය. මෙම එකම සාධක සැලකිල්ලට ගනිමින් එක් එක් සේවාදායකයා විසින් ණය ආපසු ගෙවීමේ සම්භාවිතාව අප කලින් ගණනය කළ බව මතක තබා ගනිමු. නියත සමානතාවයට වඩා වෙනස් සම්භාවිතාවන් අප ලබා ගැනීම තර්කානුකූලයි .
සාම්පලවල සම්භාවිතාව නිර්වචනය කරමු:
නියැදි සම්භාවිතාව ගණනය කිරීම සඳහා කේතය
from functools import reduce
def likelihood(y,p):
line_true_proba = []
for i in range(len(y)):
ltp_i = p[i]**y[i]*(1-p[i])**(1-y[i])
line_true_proba.append(ltp_i)
likelihood = []
return reduce(lambda a, b: a*b, line_true_proba)
y = [1.0,1.0,0.0]
p_log_response = df['Probability']
const = 2.0/3.0
p_const = [const, const, const]
print 'Правдоподобие выборки при константном значении p=2/3:', round(likelihood(y,p_const),3)
print '****************************************************************************************************'
print 'Правдоподобие выборки при расчетном значении p:', round(likelihood(y,p_log_response),3)
නියත අගයක නියැදි සම්භාවිතාව :
සාධක සැලකිල්ලට ගනිමින් ණය ආපසු ගෙවීමේ සම්භාවිතාව ගණනය කිරීමේදී නියැදි සම්භාවිතාව :
සාධක මත පදනම්ව ගණනය කරන ලද සම්භාවිතාවක් සහිත නියැදියක සම්භාවිතාව නියත සම්භාවිතා අගයක් සහිත සම්භාවිතාවට වඩා වැඩි විය. මෙමගින් කුමක් වෙයිද? මෙයින් ඇඟවෙන්නේ එක් එක් සේවාදායකයා සඳහා ණය ආපසු ගෙවීමේ සම්භාවිතාව වඩාත් නිවැරදිව තෝරා ගැනීමට සාධක පිළිබඳ දැනුමෙන් හැකි වූ බවයි. එබැවින්, ඊළඟ ණය නිකුත් කිරීමේදී, ණය ආපසු ගෙවීමේ සම්භාවිතාව තක්සේරු කිරීම සඳහා ලිපියේ 3 වන කොටස අවසානයේ යෝජිත ආකෘතිය භාවිතා කිරීම වඩාත් නිවැරදි වනු ඇත.
නමුත් පසුව, අපට උපරිම කිරීමට අවශ්ය නම් නියැදි සම්භාවිතා කාර්යය, එසේ නම් Vasya, Fedya සහ Lesha සඳහා සම්භාවිතාවන් ඇති කරන ඇල්ගොරිතමයක් භාවිතා නොකරන්නේ මන්ද, උදාහරණයක් ලෙස, පිළිවෙලින් 0.99, 0.99 සහ 0.01 ට සමාන වේ. සමහර විට එවැනි ඇල්ගොරිතමයක් පුහුණු නියැදිය මත හොඳින් ක්රියා කරනු ඇත, මන්ද එය නියැදි සම්භාවිතා අගය සමීප කරනු ඇත. , නමුත්, පළමුව, එවැනි ඇල්ගොරිතමයක් බොහෝ විට සාමාන්යකරණ හැකියාව සමඟ දුෂ්කරතා ඇති වනු ඇත, සහ දෙවනුව, මෙම ඇල්ගොරිතම නියත වශයෙන්ම රේඛීය නොවේ. මෙම ලිපියේ සැලැස්මට අධික ලෙස පුහුණුවීමට එරෙහිව සටන් කිරීමේ ක්රම (ඒ හා සමානව දුර්වල සාමාන්යකරණ හැකියාව) පැහැදිලිවම ඇතුළත් කර නොමැති නම්, අපි දෙවන කරුණ වඩාත් විස්තරාත්මකව යමු. මෙය සිදු කිරීම සඳහා, සරල ප්රශ්නයකට පිළිතුරු දෙන්න. අප දන්නා සාධක සැලකිල්ලට ගනිමින් Vasya සහ Fedya ණය ආපසු ගෙවීමේ සම්භාවිතාව සමාන විය හැකිද? ශබ්ද තර්කනයේ දෘෂ්ටි කෝණයෙන්, ඇත්ත වශයෙන්ම නැත, එය කළ නොහැක. එබැවින් Vasya ණය ආපසු ගෙවීම සඳහා මසකට ඔහුගේ වැටුපෙන් 2.5% ක් ගෙවනු ඇත, සහ Fedya - පාහේ 27,8%. ප්රස්ථාර 2 හි “සේවාදායක වර්ගීකරණය” තුළ අපට පෙනෙන්නේ ෆෙඩියාට වඩා පන්ති වෙන් කරන රේඛාවෙන් Vasya බොහෝ දුරින් සිටින බවයි. අවසාන වශයෙන්, කාර්යය බව අපි දනිමු Vasya සහ Fedya සඳහා විවිධ අගයන් ගනී: Vasya සඳහා 4.24 සහ Fedya සඳහා 1.0. දැන්, උදාහරණයක් ලෙස, ෆෙඩියා විශාලත්වයේ අනුපිළිවෙලක් උපයා ඇත්නම් හෝ කුඩා ණයක් ඉල්ලා සිටියේ නම්, වාස්යා සහ ෆෙඩියා සඳහා ණය ආපසු ගෙවීමේ සම්භාවිතාව සමාන වේ. වෙනත් වචන වලින් කිවහොත්, රේඛීය යැපීම රැවටිය නොහැක. අපි ඇත්ත වශයෙන්ම අවාසි ගණනය කළේ නම් , සහ ඒවා තුනී වාතයෙන් පිටතට ගෙන ගියේ නැත, අපගේ වටිනාකම් බව අපට ආරක්ෂිතව පැවසිය හැකිය එක් එක් ණය ගැණුම්කරු විසින් ණය ආපසු ගෙවීමේ සම්භාවිතාව තක්සේරු කිරීමට අපට ඉඩ සලසයි, නමුත් සංගුණක නිර්ණය කිරීමට අපි එකඟ වූ බැවින් සියලුම නීතිරීතිවලට අනුව සිදු කරන ලදී, එවිට අපි එසේ උපකල්පනය කරමු - අපගේ සංගුණක සම්භාවිතාව පිළිබඳ වඩා හොඳ තක්සේරුවක් ලබා දීමට අපට ඉඩ සලසයි :)
කෙසේ වෙතත්, අපි අපගමනය කරමු. මෙම කොටසේදී බරෙහි දෛශිකය තීරණය කරන්නේ කෙසේදැයි අප තේරුම් ගත යුතුය , එක් එක් ණය ගැණුම්කරු විසින් ණය ආපසු ගෙවීමේ සම්භාවිතාව තක්සේරු කිරීමට අවශ්ය වේ.
අපි අවාසි සොයන්නේ කුමන අවි ගබඩාව සමඟද යන්න කෙටියෙන් සාරාංශ කරමු :
1. ඉලක්ක විචල්යය (අනාවැකි අගය) සහ ප්රතිඵලයට බලපාන සාධකය අතර සම්බන්ධය රේඛීය බව අපි උපකල්පනය කරමු. මෙම හේතුව නිසා එය භාවිතා වේ රේඛීය ප්රතිගාමී ශ්රිතය විශේෂ , වස්තූන් (සේවාලාභීන්) පන්තිවලට බෙදන රේඛාව и හෝ (ණය ආපසු ගෙවීමට හැකියාව ඇති සේවාදායකයින් සහ නොමැති අය). අපගේ නඩුවේදී, සමීකරණයට ආකෘතිය ඇත .
2. අපි භාවිතා කරමු ප්රතිලෝම ලොජිට් ශ්රිතය විශේෂ පන්තියකට අයත් වස්තුවක සම්භාවිතාව තීරණය කිරීමට .
3. අපගේ පුහුණු කට්ටලය සාමාන්යකරණයක් ක්රියාත්මක කිරීමක් ලෙස අපි සලකමු බර්නූලි යෝජනා ක්රම, එනම්, එක් එක් වස්තුව සඳහා අහඹු විචල්යයක් ජනනය වේ, එය සම්භාවිතාව සමඟ (එක් එක් වස්තුව සඳහා එහිම) අගය 1 සහ සම්භාවිතාව සමඟ ගනී - 0.
4. අපි උපරිම කිරීමට අවශ්ය දේ අපි දනිමු නියැදි සම්භාවිතා කාර්යය පවතින නියැදිය වඩාත්ම පිළිගත හැකි වන පරිදි පිළිගත් සාධක සැලකිල්ලට ගනිමින්. වෙනත් වචන වලින් කිවහොත්, අපි නියැදිය වඩාත් පිළිගත හැකි පරාමිති තෝරාගත යුතුය. අපගේ නඩුවේදී, තෝරාගත් පරාමිතිය ණය ආපසු ගෙවීමේ සම්භාවිතාවයි , එය අනෙක් අතට නොදන්නා සංගුණක මත රඳා පවතී . ඒ නිසා අපි එවැනි බර දෛශිකයක් සොයා ගත යුතුයි , නියැදියේ සම්භාවිතාව උපරිම වනු ඇත.
5. උපරිම කළ යුතු දේ අපි දනිමු නියැදි සම්භාවිතා කාර්යයන් භාවිතා කළ හැකිය උපරිම සම්භාවිතා ක්රමය. තවද මෙම ක්රමය සමඟ වැඩ කිරීමට ඇති සියලුම උපක්රම අපි දනිමු.
මෙය බහු-පියවර පියවරක් බවට පත්වන ආකාරයයි :)
දැන් මතක තියාගන්න ලිපියේ ආරම්භයේදීම අපට අලාභ ශ්රිත වර්ග දෙකක් ව්යුත්පන්න කිරීමට අවශ්ය වූ බව ලොජිස්ටික් පාඩුව වස්තු පන්ති නම් කරන ආකාරය මත පදනම්ව. පන්ති දෙකක් සමඟ වර්ගීකරණ ගැටළු වලදී, පන්ති ලෙස දක්වනු ලැබේ и හෝ . අංකනය මත පදනම්ව, ප්රතිදානයට අනුරූප පාඩු ශ්රිතයක් ඇත.
නඩුව 1. වස්තූන් වර්ගීකරණය и
මීට පෙර, නියැදියක සම්භාවිතාව තීරණය කිරීමේදී, ණය ගැනුම්කරු විසින් ණය ආපසු ගෙවීමේ සම්භාවිතාව සාධක මත පදනම්ව ගණනය කරන ලද සහ සංගුණක ලබා දී ඇත. , අපි සූත්රය යෙදුවෙමු:
ඇත්තටම යනු අර්ථයයි ලොජිස්ටික් ප්රතිචාර කාර්යයන් දී ඇති බර දෛශිකයක් සඳහා
එවිට නියැදි සම්භාවිතා ශ්රිතය පහත පරිදි ලිවීමෙන් කිසිවක් අපව වළක්වන්නේ නැත:
සමහර විට සමහර නවක විශ්ලේෂකයින්ට මෙම කාර්යය ක්රියාත්මක වන ආකාරය වහාම තේරුම් ගැනීමට අපහසු වේ. සියල්ල පැහැදිලි කරන කෙටි උදාහරණ 4ක් බලමු:
1. නම් (එනම්, පුහුණු නියැදියට අනුව, වස්තුව +1 පන්තියට අයත් වේ), සහ අපගේ ඇල්ගොරිතම වස්තුවක් පන්තියකට වර්ගීකරණය කිරීමේ සම්භාවිතාව තීරණය කරයි 0.9 ට සමාන වේ, එවිට මෙම නියැදි සම්භාවිතාව පහත පරිදි ගණනය කෙරේ:
2. නම් හා , එවිට ගණනය කිරීම මේ වගේ වනු ඇත:
3. නම් හා , එවිට ගණනය කිරීම මේ වගේ වනු ඇත:
4. නම් හා , එවිට ගණනය කිරීම මේ වගේ වනු ඇත:
1 සහ 3 අවස්ථා වලදී හෝ සාමාන්ය අවස්ථාවෙහිදී - වස්තුවක් පන්තියකට පැවරීමේ සම්භාවිතාව පිළිබඳ නිවැරදිව අනුමාන කළ අගයන් සමඟ සම්භාවිතා ශ්රිතය උපරිම වනු ඇති බව පැහැදිලිය. .
පන්තියකට වස්තුවක් පැවරීමේ සම්භාවිතාව නිර්ණය කිරීමේදී අපි දන්නේ නැහැ සංගුණක විතරයි , එවිට අපි ඔවුන් ගැන සොයා බලමු. ඉහත සඳහන් කළ පරිදි, මෙය ප්රශස්තිකරණ ගැටළුවක් වන අතර, බරෙහි දෛශිකය සම්බන්ධයෙන් සම්භාවිතා ශ්රිතයේ ව්යුත්පන්නය මුලින්ම සොයා ගත යුතුය. . කෙසේ වෙතත්, පළමුව, අප විසින්ම කාර්යය සරල කිරීම අර්ථවත් කරයි: අපි ලඝුගණකයේ ව්යුත්පන්නය සොයමු සම්භාවිතා කාර්යයන්.
ඇයි ලඝුගණකයෙන් පසුව, in ලොජිස්ටික් දෝෂ කාර්යයන්, අපි ලකුණ වෙනස් කළා මත . සෑම දෙයක්ම සරල ය, ආකෘතියක ගුණාත්මකභාවය තක්සේරු කිරීමේ ගැටළු වලදී ශ්රිතයක අගය අවම කිරීම සිරිතක් බැවින්, අපි ප්රකාශනයේ දකුණු පැත්ත ගුණ කළෙමු. සහ ඒ අනුව, උපරිම කිරීම වෙනුවට, දැන් අපි කාර්යය අවම කරමු.
ඇත්ත වශයෙන්ම, මේ මොහොතේ, ඔබේ ඇස් ඉදිරිපිට, පාඩු ශ්රිතය වෙහෙස මහන්සි වී ව්යුත්පන්න විය - ලොජිස්ටික් පාඩුව පන්ති දෙකක් සහිත පුහුණු කට්ටලයක් සඳහා: и .
දැන්, සංගුණක සොයා ගැනීමට, අපට අවශ්ය වන්නේ ව්යුත්පන්නය සොයා ගැනීම පමණි ලොජිස්ටික් දෝෂ කාර්යයන් ඉන්පසුව, ශ්රේණිගත සම්භවය හෝ ස්ටෝචස්ටික් අනුක්රමණ බැසීම් වැනි සංඛ්යාත්මක ප්රශස්තකරණ ක්රම භාවිතා කරමින්, වඩාත් ප්රශස්ත සංගුණක තෝරන්න . එහෙත්, ලිපියේ සැලකිය යුතු පරිමාවක් ලබා දී, ඔබ විසින්ම අවකලනය සිදු කිරීමට යෝජනා කර ඇත, නැතහොත් සමහර විට මෙය එවැනි සවිස්තරාත්මක උදාහරණ නොමැතිව අංක ගණිතය සමඟ ඊළඟ ලිපිය සඳහා මාතෘකාවක් වනු ඇත.
නඩුව 2. වස්තූන් වර්ගීකරණය и
මෙහි ප්රවේශය පන්ති සමඟ සමාන වනු ඇත и , නමුත් අලාභ ශ්රිතයේ ප්රතිදානය සඳහා මාර්ගය ම ය ලොජිස්ටික් පාඩුව, වඩාත් විසිතුරු වනු ඇත. අපි පටන් ගනිමු. සම්භාවිතා කාර්යය සඳහා අපි ක්රියාකරු භාවිතා කරන්නෙමු "එහෙනම්...."... එනම්, නම් th object එක අයිති class එකට , පසුව නියැදියේ සම්භාවිතාව ගණනය කිරීම සඳහා අපි සම්භාවිතාව භාවිතා කරමු , වස්තුව පන්තියට අයත් නම් , එවිට අපි සම්භාවිතාවයට ආදේශ කරමු . සම්භාවිතා කාර්යය පෙනෙන්නේ මෙයයි:
එය ක්රියා කරන ආකාරය අපි අපගේ ඇඟිලි මත විස්තර කරමු. අපි අවස්ථා 4 ක් සලකා බලමු:
1. නම් и , එවිට නියැදීමේ සම්භාවිතාව "යනු ඇත"
2. නම් и , එවිට නියැදීමේ සම්භාවිතාව "යනු ඇත"
3. නම් и , එවිට නියැදීමේ සම්භාවිතාව "යනු ඇත"
4. නම් и , එවිට නියැදීමේ සම්භාවිතාව "යනු ඇත"
1 සහ 3 අවස්ථා වලදී, ඇල්ගොරිතම මගින් සම්භාවිතාව නිවැරදිව නිර්ණය කළ විට, එය පැහැදිලිය. සම්භාවිතා කාර්යය උපරිම වනු ඇත, එනම්, අපට ලබා ගැනීමට අවශ්ය වූයේ මෙයයි. කෙසේ වෙතත්, මෙම ප්රවේශය තරමක් අපහසු වන අතර ඊළඟට අපි වඩාත් සංයුක්ත අංකනය සලකා බලමු. නමුත් පළමුව, ලකුණේ වෙනසක් සමඟ සම්භාවිතා ශ්රිතය ලඝුගණක කරමු, දැන් අපි එය අවම කරමු.
අපි ඒ වෙනුවට ආදේශ කරමු ප්රකාශනය :
සරල ගණිත ක්රම භාවිතයෙන් ලඝුගණකය යටතේ නිවැරදි පදය සරල කර ලබා ගනිමු:
දැන් ක්රියාකරු ඉවත් කිරීමට කාලයයි "එහෙනම්....". වස්තුවක් විට බව සලකන්න පන්තියට අයත් වේ , පසුව ලඝුගණකය යටතේ ප්රකාශනයේ, හරයෙහි, බලයට ඔසවා ඇත , වස්තුව පන්තියට අයත් නම් , එවිට $e$ බලයට ඔසවනු ලැබේ . එබැවින්, අවස්ථා දෙකම එකකට ඒකාබද්ධ කිරීමෙන් උපාධිය සඳහා අංකනය සරල කළ හැකිය: . එවිට ලොජිස්ටික් දෝෂ ශ්රිතය පෝරමය ගනු ඇත:
ලඝුගණක නීතිවලට අනුකූලව, අපි කොටස පෙරළා ලකුණ නිවා දමමු ""(අඩු) ලඝුගණකය සඳහා, අපට ලැබෙන්නේ:
මෙන්න පාඩු ශ්රිතය ලොජිස්ටික් පාඩුව, පන්ති සඳහා පවරා ඇති වස්තූන් සමඟ පුහුණු කට්ටලයේ භාවිතා වේ: и .
හොඳයි, මේ අවස්ථාවේදී මම මගේ නිවාඩු ලබාගෙන අපි ලිපිය අවසන් කරමු.
සහායක ද්රව්ය
1. සාහිත්යය
1) ව්යවහාරික ප්රතිගාමී විශ්ලේෂණය / N. Draper, G. Smith - 2nd ed. – එම්.: මූල්ය හා සංඛ්යාලේඛන, 1986 (ඉංග්රීසියෙන් පරිවර්තනය)
2) සම්භාවිතා න්යාය සහ ගණිතමය සංඛ්යාලේඛන / වී.ඊ. Gmurman - 9 වන සංස්කරණය. - එම්.: උසස් පාසල, 2003
3) සම්භාවිතා න්යාය / N.I. Chernova - Novosibirsk: Novosibirsk State University, 2007
4) ව්යාපාර විශ්ලේෂණ: දත්ත සිට දැනුම දක්වා / Paklin N. B., Oreshkov V. I. - 2nd ed. - ශාන්ත පීටර්ස්බර්ග්: පීටර්, 2013
5) දත්ත විද්යාව මුල සිටම දත්ත විද්යාව / ජොයෙල් ග්රාස් - ශාන්ත පීටර්ස්බර්ග්: BHV පීටර්ස්බර්ග්, 2017
6) දත්ත විද්යා විශේෂඥයින් සඳහා ප්රායෝගික සංඛ්යාලේඛන / P. Bruce, E. Bruce - St. Petersburg: BHV Petersburg, 2018
2. දේශන, පාඨමාලා (වීඩියෝ)
1)
2)
3)
4)
5)
3. අන්තර්ජාල මූලාශ්ර
1)
2)
4)
5)
8)
මූලාශ්රය: www.habr.com