هن آرٽيڪل ۾، اسان تبديلي جي نظرياتي حسابن جو تجزيو ڪنداسين لڪير ريگريشن افعال в inverse logit transformation function (ٻي صورت ۾ لوجسٽڪ ريسپانس فنکشن سڏجي ٿو). پوء، هٿيار استعمال ڪندي وڌ ۾ وڌ امڪان جو طريقولاجسٽڪ ريگريشن ماڊل جي مطابق، اسان نقصان جي فنڪشن کي حاصل ڪندا آهيون منطقي نقصان، يا ٻين لفظن ۾، اسان هڪ فنڪشن جي وضاحت ڪنداسين جنهن سان وزن ویکٹر جا پيرا ميٽرز لاجسٽڪ ريگريشن ماڊل ۾ چونڊيا ويندا آهن. .
آرٽيڪل جو خاڪو:
- اچو ته ٻن متغيرن جي وچ ۾ لڪير واري رشتي کي ورجائي
- اچو ته تبديلي جي ضرورت کي سڃاڻون لڪير ريگريشن افعال в لاجسٽڪ ردعمل فنڪشن
- اچو ته تبديلين ۽ پيداوار کي انجام ڏيو لاجسٽڪ ردعمل فنڪشن
- اچو ته سمجھڻ جي ڪوشش ڪريون ته ڇو گھٽ ۾ گھٽ چوڪن جو طريقو خراب آھي جڏھن پيٽرول چونڊيو ڪم منطقي نقصان
- اسان استعمال ڪريون ٿا وڌ ۾ وڌ امڪان جو طريقو مقرر ڪرڻ لاء پيٽرولر جي چونڊ جو ڪم :
5.1. ڪيس 1: فنڪشن منطقي نقصان ڪلاس نامزدگي سان شيون لاء 0 и 1:
5.2. ڪيس 2: فنڪشن منطقي نقصان ڪلاس نامزدگي سان شيون لاء -1 и +1:
مضمون سادو مثالن سان ڀريل آهي، جنهن ۾ سڀ حساب آسان آهن زباني يا ڪاغذ تي؛ ڪن حالتن ۾، هڪ ڳڻپيوڪر گهربل هجي. پوء تيار ٿي وڃو :)
هي آرٽيڪل بنيادي طور تي ڊيٽا سائنسدانن لاءِ آهي جن وٽ مشين لرننگ جي بنيادي ڳالهين ۾ ابتدائي سطح جي ڄاڻ آهي.
آرٽيڪل گراف ۽ حسابن جي ڊرائنگ لاءِ ڪوڊ پڻ مهيا ڪندو. سڀ ڪوڊ ٻولي ۾ لکيل آهي سري لنڪس. مون کي اڳواٽ بيان ڪرڻ ڏيو "ناولٽي" جي استعمال ٿيل نسخي جي باري ۾ - هي هڪ آهي شرطن مان معروف ڪورس وٺڻ لاءِ. Yandex هڪ جيتري معروف آن لائن تعليمي پليٽ فارم تي Coursera، ۽، جيئن ڪو سمجهي سگهي ٿو، مواد تيار ڪيو ويو هن ڪورس جي بنياد تي.
01. سڌي لائين انحصار
اهو سوال پڇڻ بلڪل مناسب آهي - لڪير انحصار ۽ منطقي رجعت جو ان سان ڇا تعلق آهي؟
اهو سادو آهي! لاجسٽڪ ريگريشن ھڪڙو نمونو آھي جيڪو لڪير طبقي سان تعلق رکي ٿو. سادي لفظن ۾، هڪ لڪير طبقي جو ڪم ٽارگيٽ ويلن جي اڳڪٿي ڪرڻ آهي متغيرن کان (رجعت ڪندڙ) . اهو يقين آهي ته خاصيتن جي وچ ۾ انحصار ۽ ھدف جا قدر لڪير تنهن ڪري درجه بندي جو نالو - لڪير. ان کي بلڪل واضح طور تي رکڻ لاءِ، لاجسٽڪ ريگريشن ماڊل ان فرض تي مبني آهي ته خاصيتن جي وچ ۾ هڪ لڪير تعلق آهي. ۽ ھدف جا قدر . هي تعلق آهي.
اسٽوڊيو ۾ پهريون مثال آهي، ۽ اهو آهي، صحيح طور تي، مطالعي جي مقدار جي rectilinear انحصار بابت. آرٽيڪل تيار ڪرڻ جي عمل ۾، مون کي هڪ مثال مليو جنهن اڳ ۾ ئي ڪيترن ئي ماڻهن کي ڪنڊ تي مقرر ڪيو آهي - وولٹیج تي ڪرنٽ جو انحصار ("Applied regression analysis"، N. Draper، G. Smith). اسان ان کي هتي به ڏسنداسين.
جي مطابق اوم جو قانون:
ڪٿي - موجوده طاقت، - وولٹیج، - مزاحمت.
جيڪڏهن اسان کي خبر نه هئي اوم جو قانون، پوءِ اسان انحصار ڳولي سگهون ٿا تجرباتي طور تي تبديل ڪندي ۽ ماپڻ ، سپورٽ ڪرڻ دوران مقرر. پوء اسان ڏسندا سين ته انحصار گراف от اصل ذريعي وڌيڪ يا گهٽ سڌي لڪير ڏئي ٿو. اسان چئون ٿا ”وڌيڪ يا گهٽ“ ڇاڪاڻ ته، جيتوڻيڪ لاڳاپو اصل ۾ درست آهي، اسان جي ماپن ۾ ننڍيون غلطيون ٿي سگهن ٿيون، ۽ ان ڪري گراف تي پوائنٽون شايد لڪيءَ تي بلڪل نه هجن، پر ان جي چوڌاري پکڙيل هونديون.
گراف 1 "انحصار" от »
چارٽ ڊرائنگ ڪوڊ
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import random
R = 13.75
x_line = np.arange(0,220,1)
y_line = []
for i in x_line:
y_line.append(i/R)
y_dot = []
for i in y_line:
y_dot.append(i+random.uniform(-0.9,0.9))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(x_line,y_line,color = 'purple',lw = 3, label = 'I = U/R')
plt.scatter(x_line,y_dot,color = 'red', label = 'Actual results')
plt.xlabel('I', size = 16)
plt.ylabel('U', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
02. لڪير ريگريشن مساوات کي تبديل ڪرڻ جي ضرورت آهي
اچو ته هڪ ٻيو مثال ڏسو. اچو ته تصور ڪريون ته اسان هڪ بينڪ ۾ ڪم ڪريون ٿا ۽ اسان جو ڪم اهو آهي ته قرض وٺندڙ جي قرض جي واپسي جي امڪان کي ڪجهه عنصرن جي بنياد تي. ڪم کي آسان ڪرڻ لاءِ، اسان صرف ٻن عنصرن تي غور ڪنداسين: قرض وٺندڙ جي مھينا تنخواه ۽ مھينا قرض جي واپسي جي رقم.
اهو ڪم تمام مشروط آهي، پر هن مثال سان اسان سمجهي سگهون ٿا ته اهو استعمال ڪرڻ ڪافي ناهي لڪير ريگريشن افعال، ۽ اهو پڻ معلوم ڪريو ته ڪهڙي تبديلي جي ضرورت آهي فنڪشن سان.
اچو ته مثال ڏانهن واپس وڃو. اهو سمجھيو ويو آهي ته اعلي تنخواه، وڌيڪ قرضدار قرض جي واپسي لاء مھينا مختص ڪرڻ جي قابل هوندا. ساڳئي وقت، هڪ خاص تنخواه جي حد تائين هن تعلق کي ڪافي سڌريل ٿيندو. مثال طور، اچو ته تنخواه جي حد 60.000 RUR کان 200.000 RUR تائين وٺون ۽ فرض ڪريو ته مخصوص تنخواه جي حد ۾، تنخواه جي سائيز تي مھينن جي ادائيگي جي ماپ جو انحصار لڪير آھي. اچو ته چئو ته اجوري جي مخصوص حد لاءِ اهو ظاهر ڪيو ويو ته تنخواه کان ادائيگي جو تناسب 3 کان هيٺ نٿو اچي سگهي ۽ قرض وٺندڙ وٽ اڃا تائين 5.000 RUR رزرو هجڻ لازمي آهي. ۽ صرف هن صورت ۾، اسان اهو فرض ڪنداسين ته قرضدار بينڪ ڏانهن قرض ادا ڪندو. پوء، لڪير ريگريشن مساوات فارم وٺي ويندي:
جتي , , , - تنخواه - قرض وٺندڙ، - قرض جي ادائيگي - قرض وٺندڙ.
معاوضي ۽ قرض جي ادائيگي کي مقرر ڪيل پيٽرولن سان مساوات ۾ تبديل ڪرڻ توهان فيصلو ڪري سگهو ٿا ته قرض جاري ڪرڻ يا رد ڪرڻ.
اڳتي ڏسي رهيا آهيون، اسان اهو نوٽ ڪريون ٿا، ڏنل پيٽرولن سان لڪير regression فعل، ۾ استعمال ٿيل لاجسٽڪ جوابي ڪم وڏيون قيمتون پيدا ڪنديون جيڪي قرض جي واپسي جي امڪانن کي طئي ڪرڻ لاءِ حسابن کي پيچيده ڪنديون. تنهن ڪري، اهو تجويز ڪيو ويو آهي ته اسان جي کوٽائي کي گهٽائڻ، اچو ته 25.000 ڀيرا. کوٽائي ۾ هي تبديلي قرض جاري ڪرڻ جو فيصلو تبديل نه ڪندي. اچو ته هن نقطي کي مستقبل لاءِ ياد رکون، پر هاڻي، ان کي وڌيڪ واضح ڪرڻ لاءِ ته اسان ڪهڙي ڳالهه ڪري رهيا آهيون، اچو ته ٽن امڪاني قرض وٺندڙن سان صورتحال تي غور ڪريون.
جدول 1 ”ممڪن قرض وٺندڙ“
ٽيبل ٺاهڻ لاء ڪوڊ
import pandas as pd
r = 25000.0
w_0 = -5000.0/r
w_1 = 1.0/r
w_2 = -3.0/r
data = {'The borrower':np.array(['Vasya', 'Fedya', 'Lesha']),
'Salary':np.array([120000,180000,210000]),
'Payment':np.array([3000,50000,70000])}
df = pd.DataFrame(data)
df['f(w,x)'] = w_0 + df['Salary']*w_1 + df['Payment']*w_2
decision = []
for i in df['f(w,x)']:
if i > 0:
dec = 'Approved'
decision.append(dec)
else:
dec = 'Refusal'
decision.append(dec)
df['Decision'] = decision
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision']]
جدول ۾ ڏنل ڊيٽا جي مطابق، واسيا، 120.000 RUR جي تنخواه سان، هڪ قرض حاصل ڪرڻ چاهي ٿو ته هو ان کي 3.000 RUR تي ماهوار ادا ڪري سگهي ٿو. اسان طئي ڪيو آهي ته قرض منظور ڪرڻ لاءِ، واسيا جي تنخواه ادائگي جي رقم کان ٽي ڀيرا وڌيڪ هجڻ گهرجي، ۽ اڃا به 5.000 RUR باقي هجڻ گهرجي. Vasya هن گهرج کي پورو ڪري ٿو: . جيتوڻيڪ 106.000 RUR باقي رهي ٿو. ان حقيقت جي باوجود ته جڏهن حساب اسان امڪان کي گهٽايو آهي 25.000 ڀيرا، نتيجو ساڳيو هو - قرض منظور ڪري سگهجي ٿو. فديا کي به قرض ملندو، پر ليشا، ان حقيقت جي باوجود ته هو سڀ کان وڌيڪ حاصل ڪري ٿو، پنهنجي ڀاڄي کي ختم ڪرڻو پوندو.
اچو ته هن معاملي لاء گراف ٺاهي.
چارٽ 2 ”قرض وٺندڙن جي درجه بندي“
گراف ڊرائنگ لاءِ ڪوڊ
salary = np.arange(60000,240000,20000)
payment = (-w_0-w_1*salary)/w_2
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(salary, payment, color = 'grey', lw = 2, label = '$f(w,x_i)=w_0 + w_1x_{i1} + w_2x_{i2}$')
plt.plot(df[df['Decision'] == 'Approved']['Salary'], df[df['Decision'] == 'Approved']['Payment'],
'o', color ='green', markersize = 12, label = 'Decision - Loan approved')
plt.plot(df[df['Decision'] == 'Refusal']['Salary'], df[df['Decision'] == 'Refusal']['Payment'],
's', color = 'red', markersize = 12, label = 'Decision - Loan refusal')
plt.xlabel('Salary', size = 16)
plt.ylabel('Payment', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
تنهن ڪري، اسان جي سڌي لڪير، فنڪشن جي مطابق ٺهيل آهي ، "خراب" قرض وٺندڙن کي "سٺن" کان الڳ ڪري ٿو. اهي قرضدار جن جون خواهشون انهن جي صلاحيتن سان ٺهڪندڙ نه آهن اهي لڪير کان مٿانهون آهن (ليشا)، جڏهن ته اهي، جيڪي اسان جي ماڊل جي معيارن جي مطابق، قرض واپس ڪرڻ جي قابل آهن، اهي لڪير کان هيٺ آهن (واسيا ۽ فيڊيا). ٻين لفظن ۾، اسان اهو چئي سگهون ٿا: اسان جي سڌي لائين قرضدارن کي ٻن طبقن ۾ ورهائي ٿي. اچو ته انهن کي هن ريت بيان ڪريون: طبقي ڏانهن اسان انهن قرضدارن جي درجه بندي ڪنداسين جيڪي گهڻو ڪري قرض واپس ڪرڻ جا امڪان آهن جيئن يا اسان انهن قرضدارن کي شامل ڪنداسين جيڪي گهڻو ڪري قرض واپس ڪرڻ جي قابل نه هوندا.
اچو ته هن سادي مثال مان نتيجن کي اختصار ڪريون. اچو ته هڪ نقطو وٺون ۽، نقطي جي همراهن کي لڪير جي لاڳاپيل مساوات ۾ تبديل ڪرڻ ، ٽن اختيارن تي غور ڪريو:
- جيڪڏهن پوائنٽ لائن هيٺ آهي ۽ اسان ان کي ڪلاس ۾ تفويض ڪريون ٿا ، پوءِ فنڪشن جو قدر کان مثبت ٿيندو ڪرڻ . ان جو مطلب اهو آهي ته اسان فرض ڪري سگهون ٿا ته قرض واپس ڪرڻ جو امڪان اندر آهي . وڏي فنڪشن جي قيمت، اعلي امڪان.
- جيڪڏهن هڪ نقطو هڪ لڪير کان مٿي آهي ۽ اسان ان کي ڪلاس ۾ تفويض ڪريون ٿا يا ، پوءِ فنڪشن جو قدر منفي ٿيندو کان ڪرڻ . پوء اسان اهو فرض ڪنداسين ته قرض جي واپسي جو امڪان اندر آهي ۽، فنڪشن جي تمام گهڻي قدر، اسان جو اعتماد اوترو وڌيڪ.
- پوائنٽ هڪ سڌي لڪير تي آهي، ٻن طبقن جي وچ ۾ حد تي. انهي حالت ۾، فنڪشن جو قدر برابر هوندو ۽ قرض جي واپسي جو امڪان برابر آهي .
هاڻي اچو ته تصور ڪريون ته اسان وٽ ٻه عنصر نه، پر درجن، ۽ ٽي نه، پر هزارين قرضدار آهن. پوءِ اسان وٽ سڌي لڪير جي بدران هوندي m-dimensional جهاز ۽ coefficients اسان کي ٿلهي هوا مان نه ڪڍيو ويندو، پر سڀني قاعدن جي مطابق، ۽ قرضدار جي جمع ڪيل ڊيٽا جي بنياد تي، جن قرض واپس ڪيو آهي يا نه ڪيو آهي. ۽ درحقيقت، ياد رکو ته اسان هاڻي قرضدار چونڊي رهيا آهيون اڳ ۾ ئي ڄاڻايل گنجائش استعمال ڪندي . حقيقت ۾، لوجسٽڪ ريگريشن ماڊل جو ڪم صحيح طور تي پيٽرولر کي طئي ڪرڻ آهي ، جنهن تي نقصان جي ڪم جو قدر منطقي نقصان گهٽ ۾ گهٽ وڌندو. پر ویکٹر ڪيئن ڳڻيو ويندو آهي ، اسان مضمون جي 5 هين حصي ۾ وڌيڪ معلوم ڪنداسين. ساڳئي وقت ۾، اسان واعدو ڪيل زمين ڏانهن موٽندا آهيون - اسان جي بينڪر ۽ سندس ٽن گراهڪن ڏانهن.
فنڪشن جي مهرباني اسان ڄاڻون ٿا ته ڪنهن کي قرض ڏئي سگهجي ٿو ۽ ڪنهن کي رد ڪرڻ جي ضرورت آهي. پر توهان اهڙي معلومات سان ڊائريڪٽر ڏانهن نٿا وڃو، ڇاڪاڻ ته اهي اسان کان هر قرضدار طرفان قرض جي واپسي جو امڪان حاصل ڪرڻ چاهيندا هئا. ڇا ڪجي؟ جواب سادو آهي - اسان کي ڪنهن به طرح فنڪشن کي تبديل ڪرڻ جي ضرورت آهي ، جن جا قدر رينج ۾ آهن هڪ فنڪشن ڏانهن جنهن جا قدر رينج ۾ هوندا . ۽ اهڙي فنڪشن موجود آهي، ان کي سڏيو ويندو آهي لاجسٽڪ جوابي فنڪشن يا inverse-logit تبديلي. ملن:
اچو ته قدم سان قدم ڏسو ته اهو ڪيئن ڪم ڪري ٿو لاجسٽڪ ردعمل فنڪشن. نوٽ ڪريو ته اسان مخالف طرف ھلنداسين، يعني. اسان اهو فرض ڪنداسين ته اسان ڄاڻون ٿا امڪاني قدر، جيڪا رينج کان وٺي آهي ڪرڻ ۽ پوءِ اسان هن قدر کي انگن جي پوري حد تائين ”اَڻ“ ڪنداسين ڪرڻ .
03. اسان لاجسٽڪ جوابي فنڪشن حاصل ڪندا آهيون
قدم 1. امڪاني قدرن کي رينج ۾ تبديل ڪريو
فنڪشن جي تبديلي دوران в لاجسٽڪ ردعمل فنڪشن اسان پنهنجي ڪريڊٽ تجزيه نگار کي اڪيلو ڇڏي ڏينداسين ۽ ان جي بدران بک ميڪرز جو دورو ڪنداسين. نه، يقيناً، اسين شرطون نه لڳائينداسين، سڀ ڪجھ اسان جي دلچسپيءَ ۾ آهي اظهار جي معنيٰ آهي، مثال طور، موقعو 4 کان 1 آهي. شرط، سڀني شرطن کان واقف آهن، ”ڪاميابي“ ۽ ”ڪاميابي“ جو تناسب آهي. ناڪاميون“. امڪاني اصطلاحن ۾، odds هڪ واقعا واقع ٿيڻ جو امڪان آهي ورهايل واقعي جي نه ٿيڻ جي امڪان سان. اچو ته هڪ واقعا ٿيڻ جي موقعي لاءِ فارمولا لکون :
ڪٿي - واقع ٿيڻ جو امڪان، - واقعا نه ٿيڻ جو امڪان
مثال طور، جيڪڏهن اهو امڪان آهي ته هڪ نوجوان، مضبوط ۽ چنچل گهوڙي جي لقب سان ”ويٽروڪ“ نالي هڪ پوڙهو ۽ ٻڍڙي پوڙهي عورت ”مٽيلڊا“ کي ريس ۾ هارائي. ، پوءِ “Veterok” لاءِ ڪاميابي جا موقعا هوندا к ۽ ان جي برعڪس، مشڪلاتن کي ڄاڻڻ، اهو اسان لاءِ امڪان جو اندازو لڳائڻ ڏکيو نه هوندو. :
اهڙيء طرح، اسان "ترجمو" ڪرڻ سکيو آهي امڪانن کي موقعن ۾، جيڪي قدرن مان وٺندا آهن ڪرڻ . اچو ته هڪ وڌيڪ قدم کڻون ۽ سکو ته ”ترجمو“ ڪرڻ جي امڪان کي پوري نمبر لائين مان ڪرڻ .
قدم 2. امڪاني قدرن کي رينج ۾ تبديل ڪريو
هي قدم تمام سادو آهي - اچو ته اوائلر جي نمبر جي بنياد تي گنجائش جي لاگارٿم کي وٺون ۽ اسان حاصل ڪريون ٿا:
هاڻي اسان ڄاڻون ٿا ته جيڪڏهن ، پوءِ قدر کي ڳڻيو تمام سادو هوندو ۽، ان کان علاوه، اهو مثبت هجڻ گهرجي: . هي سچ آهي.
تجسس کان ٻاهر، اچو ته چيڪ ڪريو ته ڇا ، پوءِ اسان کي هڪ منفي قدر ڏسڻ جي اميد آهي . اسان چيڪ ڪريون ٿا: . اهو درست آهي.
هاڻي اسان ڄاڻون ٿا ته امڪاني قدر کي ڪيئن بدلجي ڪرڻ کان پوري نمبر لائن سان گڏ ڪرڻ . ايندڙ قدم ۾ اسان ان جي ابتڙ ڪنداسين.
في الحال، اسان ياد رکون ٿا ته لوگارٿم جي ضابطن جي مطابق، فنڪشن جي قيمت کي ڄاڻڻ , توهان حساب ڪري سگهو ٿا odds:
هي طريقو طئي ڪرڻ جو طريقو ايندڙ قدم ۾ اسان لاءِ ڪارآمد ثابت ٿيندو.
قدم 3. اچو ته طئي ڪرڻ لاءِ هڪ فارمولا حاصل ڪريون
تنهنڪري اسان سکيو، ڄاڻڻ ، فنڪشن ويلز ڳولھيو . بهرحال، حقيقت ۾، اسان کي بلڪل سامهون جي ضرورت آهي - قدر ڄاڻڻ ڳولڻ . هن کي ڪرڻ لاء، اچو ته هڪ اهڙي تصور ڏانهن رخ ڪريون جيئن انورس odds فنڪشن، جنهن جي مطابق:
مضمون ۾ اسان مٿي ڏنل فارمولا حاصل نه ڪنداسين، پر اسان مٿي ڏنل مثال مان انگن اکرن کي استعمال ڪندي جانچ ڪنداسين. اسان ڄاڻون ٿا ته 4 کان 1 ()، واقع ٿيڻ جو امڪان 0.8 آهي (). اچو ته متبادل بڻايون: . اهو اسان جي حساب سان ٺهڪي اچي ٿو جيڪو اڳ ڪيو ويو آهي. اچو ته اڳتي وڌون.
آخري مرحلي ۾ اسان اهو اندازو لڳايو ، جنهن جو مطلب آهي ته توهان انورس odds فنڪشن ۾ متبادل ٺاهي سگهو ٿا. اسان حاصل ڪريون ٿا:
ٻنهي عددن ۽ ڊنومينيٽر کي ورهايو ، پوءِ:
بس صورت ۾، پڪ ڪرڻ لاء ته اسان ڪٿي به غلطي نه ڪئي آهي، اسان هڪ وڌيڪ ننڍڙي چيڪ ڪنداسين. قدم 2 ۾، اسان لاء اهو طئي ڪيو . پوء، قيمت کي متبادل بڻايو منطقي جواب جي فنڪشن ۾، اسان حاصل ڪرڻ جي اميد رکون ٿا . اسان متبادل ۽ حاصل ڪريون ٿا:
مبارڪون هجن، پيارا پڙهندڙ، اسان صرف لاجسٽڪ جوابي فنڪشن حاصل ڪيو ۽ جانچيو آهي. اچو ته فنڪشن جي گراف کي ڏسو.
گراف 3 "لاجسٽڪ جوابي فنڪشن"
گراف ڊرائنگ لاءِ ڪوڊ
import math
def logit (f):
return 1/(1+math.exp(-f))
f = np.arange(-7,7,0.05)
p = []
for i in f:
p.append(logit(i))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(f, p, color = 'grey', label = '$ 1 / (1+e^{-w^Tx_i})$')
plt.xlabel('$f(w,x_i) = w^Tx_i$', size = 16)
plt.ylabel('$p_{i+}$', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
ادب ۾ توهان هن فنڪشن جو نالو پڻ ڳولي سگهو ٿا sigmoid فنڪشن. گراف واضح طور تي ڏيکاري ٿو ته هڪ طبقي سان تعلق رکندڙ اعتراض جي امڪان ۾ بنيادي تبديلي نسبتا ننڍڙي حد اندر ٿيندي آهي. ، ڪنهن هنڌ کان ڪرڻ .
مان صلاح ڏيان ٿو اسان جي ڪريڊٽ تجزيه نگار ڏانهن واپس وڃو ۽ هن کي قرض جي واپسي جي امڪاني حساب ۾ مدد ڪريو، ٻي صورت ۾ هن کي بونس کان سواء ڇڏي وڃڻ جو خطرو آهي :)
جدول 2 ”ممڪن قرض وٺندڙ“
ٽيبل ٺاهڻ لاء ڪوڊ
proba = []
for i in df['f(w,x)']:
proba.append(round(logit(i),2))
df['Probability'] = proba
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision', 'Probability']]
تنهن ڪري، اسان قرض جي واپسي جو امڪان طئي ڪيو آهي. عام طور تي، اهو سچ لڳي ٿو.
درحقيقت، امڪان اهو آهي ته Vasya، 120.000 RUR جي تنخواه سان، هر مهيني 3.000 RUR بئنڪ کي ڏئي سگهندا 100٪ جي ويجهو. رستي ۾، اسان کي اهو سمجهڻ گهرجي ته هڪ بينڪ ليشا کي قرض جاري ڪري سگهي ٿي جيڪڏهن بينڪ جي پاليسي مهيا ڪري ٿي، مثال طور، گراهڪن کي قرض ڏيڻ لاء، قرض جي واپسي جي امڪان سان، چئو، 0.3. اهو صرف اهو آهي ته هن معاملي ۾ بينڪ ممڪن نقصان لاء هڪ وڏو رزرو ٺاهيندو.
اهو پڻ نوٽ ڪيو وڃي ٿو ته گهٽ ۾ گهٽ 3 جي تنخواه کان ادائگي جو تناسب ۽ 5.000 RUR جي مارجن سان ڇت کان ورتو ويو. تنهن ڪري، اسان وزن جي ویکٹر کي ان جي اصل شڪل ۾ استعمال نٿا ڪري سگهون . اسان کي تمام گهڻي کوٽائي ڪرڻ جي ضرورت هئي، ۽ انهي صورت ۾ اسان هر هڪ کي 25.000 ذريعي ورهايو، اهو آهي، جوهر ۾، اسان نتيجو ترتيب ڏنو. پر اهو خاص طور تي ڪيو ويو ته جيئن شروعاتي مرحلي ۾ مواد جي سمجھ کي آسان بڻائي سگهجي. زندگيءَ ۾، اسان کي کوٽائي پيدا ڪرڻ ۽ ترتيب ڏيڻ جي ضرورت نه پوندي، پر انھن کي ڳولھيو. مضمون جي ايندڙ حصن ۾ اسين انهن مساواتن کي حاصل ڪنداسين جن سان پيرا ميٽرز کي چونڊيو ويو آهي .
04. گھٽ ۾ گھٽ چوڪن جو طريقو وزن جي ویکٹر کي طئي ڪرڻ لاءِ لاجسٽڪ جوابي فنڪشن ۾
اسان اڳ ۾ ئي ڄاڻون ٿا هي طريقو وزن جي ویکٹر کي چونڊڻ لاء ، جيئن گھٽ ۾ گھٽ چوڪن جو طريقو (LSM) ۽ حقيقت ۾، ڇو نه اسين ان کي استعمال ڪريون بائنري درجه بندي جي مسئلن ۾؟ درحقيقت، ڪجھ به توهان کي استعمال ڪرڻ کان روڪي ٿو MNCصرف هي طريقو درجه بندي جي مسئلن ۾ نتيجا ڏئي ٿو جيڪي گهٽ درست آهن منطقي نقصان. هن لاء هڪ نظرياتي بنياد آهي. اچو ته پهرين هڪ سادي مثال تي نظر.
اچو ته فرض ڪريون ته اسان جا ماڊل (استعمال ڪندي MSE и منطقي نقصان) اڳ ۾ ئي وزن جي ویکٹر کي چونڊڻ شروع ڪيو آهي ۽ اسان حساب کي ڪجهه قدم تي روڪي ڇڏيو. اهو فرق نٿو پوي ته وچ ۾، آخر ۾ يا شروعات ۾، بنيادي ڳالهه اها آهي ته اسان وٽ اڳ ۾ ئي وزن جي ویکٹر جا ڪجهه قدر موجود آهن ۽ اچو ته فرض ڪريون ته هن مرحلي تي، وزن جو ویکٹر. ٻنهي ماڊلز لاء ڪو به اختلاف نه آهي. ان کان پوء نتيجو وزن وٺو ۽ انهن کي متبادل بڻايو لاجسٽڪ ردعمل فنڪشن () ڪجھ اعتراض لاءِ جيڪو ڪلاس سان تعلق رکي ٿو . اسان ٻن ڪيسن جي جانچ ڪريون ٿا جڏهن، وزن جي چونڊيل ویکٹر جي مطابق، اسان جو ماڊل تمام غلط آهي ۽ ان جي برعڪس - ماڊل کي تمام گهڻو يقين آهي ته اعتراض طبقي سان تعلق رکي ٿو. . اچو ته ڏسون ته ڪهڙو ڏنڊ جاري ڪيو ويندو جڏهن استعمال ڪيو وڃي MNC и منطقي نقصان.
استعمال ٿيل نقصان جي فنڪشن جي بنياد تي ڏنڊ جي حساب سان ڪوڊ
# класс объекта
y = 1
# вероятность отнесения объекта к классу в соответствии с параметрами w
proba_1 = 0.01
MSE_1 = (y - proba_1)**2
print 'Штраф MSE при грубой ошибке =', MSE_1
# напишем функцию для вычисления f(w,x) при известной вероятности отнесения объекта к классу +1 (f(w,x)=ln(odds+))
def f_w_x(proba):
return math.log(proba/(1-proba))
LogLoss_1 = math.log(1+math.exp(-y*f_w_x(proba_1)))
print 'Штраф Log Loss при грубой ошибке =', LogLoss_1
proba_2 = 0.99
MSE_2 = (y - proba_2)**2
LogLoss_2 = math.log(1+math.exp(-y*f_w_x(proba_2)))
print '**************************************************************'
print 'Штраф MSE при сильной уверенности =', MSE_2
print 'Штраф Log Loss при сильной уверенности =', LogLoss_2
غلطي جو ڪيس - ماڊل ھڪڙو اعتراض ھڪڙي طبقي کي تفويض ڪري ٿو 0,01 جي امڪان سان
استعمال تي سزا MNC ٿيندو:
استعمال تي سزا منطقي نقصان ٿيندو:
مضبوط اعتماد جو ڪيس - ماڊل ھڪڙو اعتراض ھڪڙي طبقي کي تفويض ڪري ٿو 0,99 جي امڪان سان
استعمال تي سزا MNC ٿيندو:
استعمال تي سزا منطقي نقصان ٿيندو:
هي مثال چڱي طرح بيان ڪري ٿو ته مجموعي غلطي جي صورت ۾ نقصان جي فنڪشن لاگ نقصان ماڊل کي سزا ڏئي ٿو ان کان به وڌيڪ MSE. اچو ته ھاڻي سمجھون ته نظرياتي پس منظر ڇا آھي نقصان جي فنڪشن کي استعمال ڪرڻ لاء لاگ نقصان درجه بندي جي مسئلن ۾.
05. وڌ ۾ وڌ امڪان جو طريقو ۽ لاجسٽڪ ريگريشن
جيئن شروع ۾ واعدو ڪيو ويو آهي، مضمون سادي مثالن سان ڀريل آهي. اسٽوڊيو ۾ ھڪڙو ٻيو مثال آھي ۽ پراڻن مھمانن - بينڪ قرضدار: واسيا، فيڊيا ۽ ليشا.
صرف ان صورت ۾، مثال کي ترقي ڪرڻ کان اڳ، مان توهان کي ياد ڏيارڻ ڏيان ٿو ته زندگي ۾ اسان هزارين يا لکين شين جي تربيتي نموني سان ڏهن يا سوين خاصيتن سان ڊيل ڪري رهيا آهيون. بهرحال، هتي انگ اکر کنيا ويا آهن ته جيئن اهي آساني سان نئين ڊيٽا سائنسدان جي سر ۾ فٽ ٿي سگهن.
اچو ته مثال ڏانهن واپس وڃو. اچو ته تصور ڪريو ته بينڪ جي ڊائريڪٽر فيصلو ڪيو ته هر ڪنهن کي قرض جاري ڪرڻ جي ضرورت آهي، ان حقيقت جي باوجود ته الورورٿم تجويز ڪيو ته اهو ليشا کي جاري نه ڪيو وڃي. ۽ هاڻي ڪافي وقت گذري چڪو آهي ۽ اسان کي خبر آهي ته ٽنهي هيروز مان ڪنهن قرض واپس ڪيو ۽ ڪنهن نه ڪيو. ڇا ٿيڻ جي اميد هئي: Vasya ۽ Fedya قرض ادا ڪيو، پر Lesha نه ڪيو. هاڻي اچو ته تصور ڪريون ته اهو نتيجو اسان لاءِ هڪ نئون تربيتي نمونو هوندو ۽ ساڳئي وقت، اهو ڄڻ ته عنصرن تي سڀ ڊيٽا جيڪي قرض جي واپسي جي امڪان تي اثرانداز ٿين ٿا (قرض وٺندڙ جي تنخواه، مهيني جي ادائيگي جي ماپ) غائب ٿي ويو آهي. پوءِ، سمجهه سان، اسان اهو فرض ڪري سگهون ٿا ته هر ٽيون قرض وٺندڙ بينڪ کي قرض واپس نٿو ڪري، يا ٻين لفظن ۾، ايندڙ قرضدار جي قرض جي واپسي جو امڪان. . هن وجداني مفروضي جي نظرياتي تصديق آهي ۽ ان تي ٻڌل آهي وڌ ۾ وڌ امڪان جو طريقواڪثر ادب ۾ ان کي سڏيو ويندو آهي وڌ ۾ وڌ امڪان اصول.
پهرين، اچو ته تصوراتي سامان سان واقف ٿي وڃو.
نموني جو امڪان بلڪل اهڙي نموني حاصل ڪرڻ جو امڪان آهي، بلڪل اهڙي طرح جا مشاهدا/ نتيجا حاصل ڪرڻ، يعني. هر هڪ نموني جا نتيجا حاصل ڪرڻ جي امڪانن جي پيداوار (مثال طور، ڇا واسيا، فيڊيا ۽ ليشا جو قرض هڪ ئي وقت ۾ ادا ڪيو ويو يا نه ادا ڪيو ويو).
امڪان فنڪشن تقسيم جي پيٽرولن جي قدرن سان نموني جي امڪان سان تعلق رکي ٿو.
اسان جي حالت ۾، ٽريننگ نموني هڪ عام برنولي اسڪيم آهي، جنهن ۾ بي ترتيب متغير صرف ٻه قدر کڻندو آهي: يا . تنهن ڪري، نموني جي امڪان کي پيٽرولر جي امڪاني فنڪشن جي طور تي لکيو وڃي ٿو جيئن ته:
مٿي ڏنل داخلا کي هن ريت سمجهي سگهجي ٿو. گڏيل امڪان اهو آهي ته Vasya ۽ Fedya قرض واپس ڪندو ، امڪان اهو آهي ته ليشا قرض واپس نه ڪندو برابر آهي (ڇاڪاڻ ته اها قرض جي واپسي نه هئي جيڪا ٿي هئي)، تنهن ڪري سڀني ٽن واقعن جو گڏيل امڪان برابر آهي .
وڌ ۾ وڌ امڪان جو طريقو وڌ ۾ وڌ ڪندي اڻڄاتل پيٽرولر جو اندازو لڳائڻ جو طريقو آهي امڪاني ڪم. اسان جي حالت ۾، اسان کي اهڙي قدر ڳولڻ جي ضرورت آهي جنهن تي پنهنجي حد تائين پهچي ٿو.
اصل خيال ڪٿان اچي ٿو - اڻڄاتل پيٽرولر جي قيمت کي ڳولڻ لاء جنهن تي ممڪن ڪارڪردگي وڌ ۾ وڌ پهچي وڃي؟ ان خيال جي ابتدا ان خيال کان ٿئي ٿي ته هڪ نمونو ئي آهي علم جو واحد ذريعو جيڪو اسان وٽ آبادي بابت موجود آهي. آبادي جي باري ۾ جيڪو اسان ڄاڻون ٿا اهو سڀ ڪجهه نموني ۾ پيش ڪيو ويو آهي. تنهن ڪري، اسان صرف اهو چئي سگهون ٿا ته هڪ نمونو اسان وٽ موجود آبادي جو سڀ کان وڌيڪ صحيح عڪس آهي. تنهن ڪري، اسان کي هڪ پيٽرولر ڳولڻ جي ضرورت آهي جنهن تي دستياب نموني سڀ کان وڌيڪ ممڪن ٿي سگهي ٿو.
ظاهر آهي، اسان هڪ اصلاح جي مسئلي سان معاملو ڪري رهيا آهيون جنهن ۾ اسان کي هڪ فنڪشن جي انتهائي نقطي کي ڳولڻ جي ضرورت آهي. انتها واري نقطي کي ڳولڻ لاء، ضروري آهي ته پهرين ترتيب واري حالت تي غور ڪيو وڃي، اهو آهي، فعل جي نڪتل کي صفر جي برابر ڪريو ۽ مساوات کي گهربل پيٽرولر جي حوالي سان حل ڪريو. تنهن هوندي به، ڪيترن ئي عنصرن جي پيداوار جي حاصلات جي ڳولا هڪ ڊگهو ڪم ٿي سگهي ٿو؛ ان کان بچڻ لاء، اتي هڪ خاص ٽيڪنڪ آهي - logarithm کي تبديل ڪرڻ. امڪاني ڪم. ڇو اهڙي منتقلي ممڪن آهي؟ اچو ته ان حقيقت تي ڌيان ڏيون ته اسان فنڪشن جي انتها کي نه ڳولي رهيا آهيون، ۽ انتهائي نقطي، اهو آهي، نامعلوم پيٽرولر جو قدر جنهن تي پنهنجي حد تائين پهچي ٿو. جڏهن لاگارٿم ڏانهن منتقل ٿئي ٿي، انتها جو نقطو تبديل نه ٿيندو آهي (جيتوڻيڪ انتها پاڻ ۾ مختلف هوندي)، ڇاڪاڻ ته لوگارٿم هڪ monotonic فنڪشن آهي.
اچو ته، مٿين جي مطابق، اسان جي مثال کي واسيا، فيڊيا ۽ ليشا جي قرضن سان ترقي ڪرڻ جاري رکون. پهرين اچو ته اڳتي وڌون logarithm جو امڪان فنڪشن:
هاڻي اسان آساني سان اظهار جي ذريعي فرق ڪري سگهون ٿا :
۽ آخر ۾، پهرين آرڊر جي حالت تي غور ڪريو - اسان فعل جي نڪتل کي صفر جي برابر ڪريون ٿا:
اهڙيء طرح، قرض جي واپسي جي امڪان جو اسان جو وجداني اندازو نظرياتي طور تي صحيح ثابت ٿيو.
عظيم، پر هاڻي اسان کي هن معلومات سان ڇا ڪرڻ گهرجي؟ جيڪڏهن فرض ڪريون ته هر ٽيون قرض وٺندڙ پئسا واپس بئنڪ ڏانهن نه ٿو ڏئي، ته پوءِ اهو ناگزير طور تي ڏيوالپڻي ٿي ويندو. اهو صحيح آهي، پر صرف جڏهن قرض جي واپسي جي امڪان جو جائزو وٺڻ جي برابر آهي اسان قرض جي واپسي تي اثرانداز ٿيندڙ عنصرن کي غور ۾ نه ورتو: قرض وٺندڙ جي تنخواه ۽ مھينن جي ادائيگي جي ماپ. اچو ته ياد رکون ته اسان اڳ ۾ ئي حساب ڪيو آهي قرض جي واپسي جو امڪان هر گراهڪ طرفان، انهن ساڳين عنصرن کي مدنظر رکندي. اهو منطقي آهي ته اسان حاصل ڪيا آهن امڪانات مسلسل برابر کان مختلف .
اچو ته نموني جي امڪان جي وضاحت ڪريون:
نموني جي امڪانن جي ڳڻپ لاءِ ڪوڊ
from functools import reduce
def likelihood(y,p):
line_true_proba = []
for i in range(len(y)):
ltp_i = p[i]**y[i]*(1-p[i])**(1-y[i])
line_true_proba.append(ltp_i)
likelihood = []
return reduce(lambda a, b: a*b, line_true_proba)
y = [1.0,1.0,0.0]
p_log_response = df['Probability']
const = 2.0/3.0
p_const = [const, const, const]
print 'Правдоподобие выборки при константном значении p=2/3:', round(likelihood(y,p_const),3)
print '****************************************************************************************************'
print 'Правдоподобие выборки при расчетном значении p:', round(likelihood(y,p_log_response),3)
مستقل قيمت تي نموني جو امڪان :
نموني جو امڪان جڏهن ڳڻپيو وڃي ته قرض جي واپسي جي امڪان کي حساب ۾ ورتو وڃي :
ھڪڙي نموني جو امڪان ھڪڙي امڪاني حساب سان حساب ڪيو ويو آھي فڪر جي بنياد تي ھڪڙي مسلسل امڪاني قدر سان امڪان کان وڌيڪ آھي. هن جو مطلب ڇا آهي؟ اهو مشورو ڏئي ٿو ته فڪٽرن بابت ڄاڻ اهو ممڪن ڪيو ته هر ڪلائنٽ لاء قرض جي واپسي جي امڪان کي وڌيڪ صحيح طور تي چونڊيو. تنهن ڪري، ايندڙ قرض جاري ڪرڻ وقت، اهو وڌيڪ صحيح ٿيندو ته آرٽيڪل جي سيڪشن 3 جي آخر ۾ تجويز ڪيل ماڊل کي استعمال ڪرڻ لاءِ قرض جي واپسي جي امڪان جو اندازو لڳائڻ.
پر پوء، جيڪڏهن اسان کي وڌائڻ چاهيون ٿا نموني امڪان فنڪشنته پوءِ ڇو نه ڪجهه الورورٿم استعمال ڪيو وڃي جيڪي واسيا، فيڊيا ۽ ليشا لاءِ امڪان پيدا ڪندا، مثال طور، 0.99، 0.99 ۽ 0.01 جي برابر. ٿي سگهي ٿو ته اهڙو الگورٿم ٽريننگ جي نموني تي سٺو ڪم ڪندو، ڇو ته اهو نموني جي امڪاني قدر کي ويجهو آڻيندو. ، پر، پهرين، اهڙي الورورٿم کي عام ڪرڻ جي صلاحيت سان گهڻو ڪري مشڪلاتون هونديون، ۽ ٻيو، هي الگورتھم يقيني طور تي لڪير نه هوندو. ۽ جيڪڏهن اوور ٽريننگ کي منهن ڏيڻ جا طريقا (برابري ڪمزور عام ڪرڻ جي صلاحيت) واضح طور تي هن مضمون جي منصوبي ۾ شامل نه آهن، پوء اچو ته وڌيڪ تفصيل سان ٻئي نقطي ذريعي وڃو. هن کي ڪرڻ لاء، صرف هڪ سادي سوال جو جواب ڏيو. ڇا واسيا ۽ فديا جي قرض جي واپسي جو امڪان ساڳيو ٿي سگهي ٿو، اسان کي ڄاڻايل عوامل کي نظر ۾ رکندي؟ صوتي منطق جي نقطي نظر کان، يقينا نه، اهو نه ٿي سگهي. تنهن ڪري Vasya قرض ادا ڪرڻ لاء هر مهيني پنهنجي تنخواه جو 2.5٪ ادا ڪندو، ۽ Fedya - لڳ ڀڳ 27,8٪. گراف 2 ۾ پڻ "ڪلائنٽ جي درجه بندي" ۾ اسان ڏسون ٿا ته واسيا Fedya کان طبقن کي الڳ ڪرڻ واري لائن کان گهڻو اڳتي آهي. ۽ نيٺ، اسان ڄاڻون ٿا ته فنڪشن Vasya ۽ Fedya لاءِ مختلف قيمتون وٺن ٿيون: 4.24 Vasya لاءِ ۽ 1.0 Fedya لاءِ. هاڻي، مثال طور، فيديا، مثال طور، وڌيڪ مقدار جو آرڊر حاصل ڪيو يا هڪ ننڍو قرض طلب ڪيو، ته پوءِ واسيا ۽ فديا لاءِ قرض جي واپسي جا امڪان ساڳيا هوندا. ٻين لفظن ۾، لڪير جي انحصار کي بيوقوف نٿو ڪري سگهجي. ۽ جيڪڏهن اسان اصل ۾ ڳڻپ ڪيو آهي ، ۽ انهن کي پتلي هوا مان نه ڪڍيو، اسان محفوظ طور تي چئي سگهون ٿا ته اسان جا قدر بهترين طور تي اسان کي هر قرض وٺندڙ طرفان قرض جي واپسي جي امڪان جو اندازو لڳائڻ جي اجازت ڏيو، پر جيئن ته اسان اهو فرض ڪرڻ تي اتفاق ڪيو ته ڪوئفينٽس جو تعين سڀني قاعدن جي مطابق ڪيو ويو، پوء اسان ائين فرض ڪنداسين - اسان جي گنجائش اسان کي امڪان جو بهتر اندازو ڏيڻ جي اجازت ڏين ٿا :)
تنهن هوندي به، اسان disregard. هن حصي ۾ اسان کي سمجهڻ جي ضرورت آهي ته وزن جو ویکٹر ڪيئن طئي ڪيو ويندو آهي ، جيڪو هر قرض وٺندڙ طرفان قرض جي واپسي جي امڪان جو اندازو لڳائڻ ضروري آهي.
اچو ته مختصر طور تي بيان ڪريون ته اسان ڪهڙي هٿيارن جي ڳولا ۾ وڃون ٿا :
1. اسان فرض ڪريون ٿا ته ٽارگيٽ متغير (پيشنگ جي قيمت) جي وچ ۾ تعلق ۽ نتيجو تي اثر انداز ڪندڙ عنصر لڪير آهي. هن سبب لاء استعمال ڪيو ويندو آهي لڪير regression فعل مهربان , جنهن جي لڪير شيون (ڪلائنٽ) طبقن ۾ ورهائي ٿي и يا (گراهڪ جيڪي قرض واپس ڪرڻ جي قابل آهن ۽ جيڪي نه آهن). اسان جي صورت ۾، مساوات فارم آهي .
2. اسان استعمال ڪريون ٿا inverse logit فنڪشن مهربان هڪ طبقي سان تعلق رکندڙ اعتراض جي امڪان کي طئي ڪرڻ لاء .
3. اسان اسان جي ٽريننگ سيٽ کي عام طور تي لاڳو ڪرڻ تي غور ڪندا آهيون برنولي اسڪيمون، اهو آهي، هر شئي لاءِ هڪ random variable پيدا ٿئي ٿو، جيڪو امڪان سان (هر اعتراض لاءِ ان جو پنهنجو) قدر 1 وٺندو آهي ۽ امڪان سان - 0.
4. اسان ڄاڻون ٿا ته اسان کي وڌ کان وڌ ڪرڻ جي ضرورت آهي نموني امڪان فنڪشن قبول ٿيل عنصرن کي مدنظر رکندي ته جيئن دستياب نمونو سڀ کان وڌيڪ قابل اطمينان ٿئي. ٻين لفظن ۾، اسان کي پيٽرولر چونڊڻ جي ضرورت آهي جنهن تي نموني تمام گهڻو ممڪن هوندو. اسان جي صورت ۾، چونڊيل پيٽرولر قرض جي واپسي جو امڪان آهي ، جنهن جي نتيجي ۾ اڻڄاتل کوٽائي تي منحصر آهي . تنهنڪري اسان کي وزن جي اهڙي ویکٹر ڳولڻ جي ضرورت آهي ، جنهن تي نموني جو امڪان وڌ ۾ وڌ ٿيندو.
5. اسان ڄاڻون ٿا ته ڇا وڌ ۾ وڌ نموني جي امڪاني ڪارڪردگي توهان استعمال ڪري سگهو ٿا وڌ ۾ وڌ امڪان جو طريقو. ۽ اسان ڄاڻون ٿا ته هن طريقي سان ڪم ڪرڻ لاء تمام مشڪل چالون.
اهو ڪيئن ٻاهر ڦرندو هڪ گھڻ-قدم قدم آهي :)
ھاڻي ياد رکو ته مضمون جي شروعات ۾ اسان ٻن قسمن جي نقصان جي افعال کي حاصل ڪرڻ چاھيو ٿا منطقي نقصان ان تي منحصر آهي ته ڪيئن اعتراض ڪلاس نامزد ڪيا ويا آهن. ائين ئي ٿيو آهي ته ٻن طبقن سان گڏ درجه بندي جي مسئلن ۾، طبقن کي ظاهر ڪيو ويو آهي и يا . نوٽيفڪيشن تي مدار رکندي، ان پٽ ۾ هڪ لاڳاپيل نقصان جي فنڪشن هوندي.
ڪيس 1. شين جي درجه بندي ۾ и
ان کان اڳ، جڏهن نموني جي امڪان جو تعين ڪيو ويو، جنهن ۾ قرض وٺندڙ طرفان قرض جي واپسي جي امڪان جو حساب ڪيو ويو آهي فڪر جي بنياد تي ۽ ڏنل کوٽائي. ، اسان فارمولا لاڳو ڪيو:
حقيقت ۾ معنيٰ آهي لاجسٽڪ جوابي ڪم وزن جي ڏنل ویکٹر لاءِ
پوء ڪجھ به اسان کي نموني جي امڪاني فنڪشن کي لکڻ کان روڪيو جيئن هيٺ ڏنل:
اهو ٿئي ٿو ته ڪڏهن ڪڏهن اهو ڏکيو آهي ته ڪجهه نوان تجزيه نگارن لاء فوري طور تي سمجهڻ لاء ڪيئن هن فنڪشن ڪم. اچو ته ڏسو 4 مختصر مثال جيڪي شيون صاف ڪندا:
1. ته (يعني، تربيتي نموني جي مطابق، اعتراض ڪلاس +1 سان تعلق رکي ٿو)، ۽ اسان جو الگورتھم ڪنهن شئي کي طبقي ۾ درجه بندي ڪرڻ جي امڪان کي طئي ڪري ٿو 0.9 جي برابر، پوء نموني جي امڪان جو هي ٽڪرو هن ريت حساب ڪيو ويندو:
2. ته ۽ ، پوءِ حساب ڪتاب هن طرح ٿيندو:
3. ته ۽ ، پوءِ حساب ڪتاب هن طرح ٿيندو:
4. ته ۽ ، پوءِ حساب ڪتاب هن طرح ٿيندو:
اهو ظاهر آهي ته امڪاني ڪارڪردگي 1 ۽ 3 ڪيسن ۾ يا عام صورت ۾ وڌ ۾ وڌ ڪيو ويندو - هڪ ڪلاس کي ڪنهن شئي کي تفويض ڪرڻ جي امڪانن جي صحيح اندازن سان. .
انهي حقيقت جو سبب اهو آهي ته جڏهن ڪنهن ڪلاس کي ڪنهن شئي کي تفويض ڪرڻ جو امڪان مقرر ڪيو وڃي اسان صرف coefficients نه ڄاڻندا آھن ، پوءِ اسين انھن کي ڳولينداسون. جيئن مٿي ذڪر ڪيو ويو آهي، هي هڪ اصلاحي مسئلو آهي جنهن ۾ سڀ کان پهريان اسان کي وزن جي ویکٹر جي حوالي سان امڪاني فعل جو نڪتل ڳولڻو پوندو. . بهرحال، سڀ کان پهريان اهو سمجھ ۾ اچي ٿو ته اسان پنهنجي لاء ڪم کي آسان بڻائي سگهون ٿا: اسان لاگارٿم مان نڪتل ڳوليندا سين. امڪاني ڪم.
لاگارٿم کان پوءِ ڇو، ۾ منطقي غلطي جا ڪم، اسان کان نشان تبديل ڪيو تي . سڀ ڪجھ سادو آهي، ڇاڪاڻ ته ماڊل جي معيار کي جانچڻ جي مسئلن ۾ اهو هڪ فنڪشن جي قيمت کي گھٽائڻ جو رواج آهي، اسان اظهار جي ساڄي پاسي کي ضرب ڪيو. ۽ ان جي مطابق، وڌ کان وڌ ڪرڻ جي بدران، هاڻي اسان فنڪشن کي گھٽ ڪريون ٿا.
درحقيقت، هن وقت، توهان جي اکين اڳيان، نقصان جو ڪارڻ وڏي محنت سان نڪتل هو. منطقي نقصان ٻن طبقن سان گڏ هڪ تربيتي سيٽ لاء: и .
هاڻي، کوٽائي ڳولڻ لاء، اسان کي صرف حاصل ڪرڻ جي ضرورت آهي منطقي غلطي جا ڪم ۽ پوءِ، عددي اصلاح جا طريقا استعمال ڪندي، جھڙوڪ gradient descent يا stochastic gradient descent، سڀ کان بھترين ڪوئفيجينٽ چونڊيو . پر، مضمون جي ڪافي مقدار کي نظر ۾ رکندي، اهو تجويز ڪيو ويو آهي ته توهان پنهنجي پاڻ تي فرق کي انجام ڏيو، يا شايد اهو ايندڙ مضمون لاء هڪ موضوع هوندو، جنهن ۾ اهڙن تفصيلي مثالن کان سواء تمام گهڻو رياضي سان.
ڪيس 2. شين جي درجه بندي ۾ и
هتي جو طريقو ساڳيو هوندو جيئن ڪلاسن سان и ، پر رستو پاڻ کي نقصان جي فنڪشن جي پيداوار ڏانهن منطقي نقصان، وڌيڪ آرائشي ٿيندو. اچو ته شروع ڪريون. امڪاني فنڪشن لاءِ اسان استعمال ڪنداسين آپريٽر ”جيڪڏهن... پوءِ...“... اهو آهي، جيڪڏهن اعتراض طبقي سان تعلق رکي ٿو ، پوءِ نموني جي امڪان کي ڳڻڻ لاءِ اسان استعمال ڪريون ٿا امڪان ، جيڪڏهن اعتراض طبقي سان تعلق رکي ٿو ، پوءِ اسان کي امڪان ۾ تبديل ڪريون ٿا . اھو اھو آھي جيڪو امڪاني فنڪشن وانگر ڏسڻ ۾ اچي ٿو:
اچو ته اسان جي آڱرين تي بيان ڪريو ته اهو ڪيئن ڪم ڪري ٿو. اچو ته 4 ڪيسن تي غور ڪريون:
1. ته и ، پوءِ نموني جو امڪان ”وڃندو“
2. ته и ، پوءِ نموني جو امڪان ”وڃندو“
3. ته и ، پوءِ نموني جو امڪان ”وڃندو“
4. ته и ، پوءِ نموني جو امڪان ”وڃندو“
اهو ظاهر آهي ته ڪيسن ۾ 1 ۽ 3، جڏهن امڪان صحيح طور تي الگورتھم طرفان طئي ڪيا ويا آهن، امڪان فنڪشن وڌ ۾ وڌ ڪيو ويندو، اهو آهي، اهو ئي آهي جيڪو اسان حاصل ڪرڻ چاهيون ٿا. بهرحال، اهو طريقو ڪافي مشڪل آهي ۽ اڳتي هلي اسان هڪ وڌيڪ جامع نوٽس تي غور ڪنداسين. پر پهرين، اچو ته علامت جي تبديلي سان امڪاني ڪم کي لاگارٿم ڪريون، ڇو ته هاڻي اسان ان کي گھٽ ڪنداسين.
اچو ته ان جي بدران متبادل ڏيو اظهار :
اچو ته صحيح اصطلاح کي لاگارٿم جي تحت سادي رياضي واري ٽيڪنڪ استعمال ڪندي آسان بڻايون ۽ حاصل ڪريو:
هاڻي اهو آپريٽر کان نجات حاصل ڪرڻ جو وقت آهي ”جيڪڏهن... پوءِ...“. نوٽ ڪريو ته جڏهن هڪ اعتراض طبقي سان تعلق رکي ٿو ، پوءِ لاگرٿم جي هيٺان اظهار ۾، ڊنومنيٽر ۾، طاقت ڏانهن وڌايو ويو ، جيڪڏهن اعتراض طبقي سان تعلق رکي ٿو ، پوءِ $e$ کي طاقت ڏانهن وڌايو ويندو آهي . تنهن ڪري، درجي جي نوٽيفڪيشن کي آسان بڻائي سگهجي ٿو ٻنهي ڪيسن کي گڏ ڪندي: ... پوءِ منطقي غلطي فنڪشن فارم وٺي ويندي:
لوگارٿم جي ضابطن جي مطابق، اسان حصو ڦيرايو ۽ نشان لڳايو "" (مائنس) لوگارٿم لاء، اسان حاصل ڪريون ٿا:
هتي نقصان جي فنڪشن آهي لاجسٽڪ نقصان، جيڪو ٽريننگ سيٽ ۾ استعمال ڪيو ويندو آهي ڪلاسن کي مقرر ڪيل شيون سان: и .
خير، هن موقعي تي آئون پنهنجي موڪل وٺي ٿو ۽ اسان مضمون کي ختم ڪريون ٿا.
معاون مواد
1. ادب
1) اپلائيڊ ريگريشن analysis / N. Draper, G. Smith - 2nd ed. - ايم.: فنانس ۽ شماريات، 1986 (انگريزي مان ترجمو)
2) امڪاني نظريو ۽ رياضياتي انگ اکر / V.E. Gmurman - 9 ايڊ. - ايم.: هاءِ اسڪول، 2003
3) امڪاني نظريو / N.I. Chernova - Novosibirsk: Novosibirsk اسٽيٽ يونيورسٽي، 2007
4) ڪاروباري تجزياتي: ڊيٽا کان علم تائين / Paklin N. B. Oreshkov V. I. - 2nd ed. - سينٽ پيٽرسبرگ: پيٽر، 2013
5) ڊيٽا سائنس ڊيٽا سائنس شروع کان / جويل گراس - سينٽ پيٽرسبرگ: BHV پيٽرسبرگ، 2017
6) ڊيٽا سائنس جي ماهرن لاءِ عملي انگ اکر / P. Bruce, E. Bruce - St. Petersburg: BHV Petersburg, 2018
2. ليڪچر، ڪورس (وڊيو)
1)
2)
3)
4)
5)
3. انٽرنيٽ ذريعن
1)
2)
7)
8)
جو ذريعو: www.habr.com