اس مضمون میں، ہم تبدیلی کے نظریاتی حسابات کا تجزیہ کریں گے۔ لکیری رجعت کے افعال в الٹا لاگٹ ٹرانسفارمیشن فنکشن (بصورت دیگر لاجسٹک رسپانس فنکشن کہا جاتا ہے). پھر، ہتھیاروں کا استعمال کرتے ہوئے زیادہ سے زیادہ امکان کا طریقہلاجسٹک ریگریشن ماڈل کے مطابق، ہم نقصان کا فنکشن اخذ کرتے ہیں۔ لاجسٹک نقصان، یا دوسرے الفاظ میں، ہم ایک فنکشن کی وضاحت کریں گے جس کے ساتھ لاجسٹک ریگریشن ماڈل میں ویٹ ویکٹر کے پیرامیٹرز کو منتخب کیا جاتا ہے۔ .
مضمون کا خاکہ:
- آئیے دو متغیرات کے درمیان لکیری تعلق کو دہرائیں۔
- آئیے تبدیلی کی ضرورت کی نشاندہی کریں۔ لکیری رجعت کے افعال в لاجسٹک ردعمل کی تقریب
- آئیے تبدیلیوں اور آؤٹ پٹ کو انجام دیں۔ لاجسٹک ردعمل کی تقریب
- آئیے یہ سمجھنے کی کوشش کریں کہ پیرامیٹرز کا انتخاب کرتے وقت کم سے کم مربع کا طریقہ کیوں خراب ہے۔ افعال لاجسٹک نقصان
- ہم استعمال کرتے ہیں زیادہ سے زیادہ امکان کا طریقہ تعین کرنے کے لئے پیرامیٹر کے انتخاب کے افعال :
5.1 کیس 1: فنکشن لاجسٹک نقصان کلاس کے عہدوں والی اشیاء کے لیے 0 и 1:
5.2 کیس 2: فنکشن لاجسٹک نقصان کلاس کے عہدوں والی اشیاء کے لیے -1 и +1:
مضمون سادہ مثالوں سے بھرا ہوا ہے جس میں تمام حسابات زبانی یا کاغذ پر کرنا آسان ہیں؛ بعض صورتوں میں، کیلکولیٹر کی ضرورت پڑ سکتی ہے۔ تو تیار ہو جائیں :)
اس مضمون کا مقصد بنیادی طور پر مشین لرننگ کی بنیادی باتوں میں ابتدائی سطح کے علم کے حامل ڈیٹا سائنسدانوں کے لیے ہے۔
مضمون ڈرائنگ گراف اور حساب کتاب کے لیے کوڈ بھی فراہم کرے گا۔ تمام کوڈ زبان میں لکھا جاتا ہے۔ ازگر 2.7. مجھے استعمال شدہ ورژن کی "نوانگی" کے بارے میں پیشگی وضاحت کرنے دو - یہ معروف کورس لینے کی شرائط میں سے ایک ہے۔ Yandex اتنے ہی معروف آن لائن تعلیمی پلیٹ فارم پر Coursera، اور، جیسا کہ کوئی فرض کر سکتا ہے، مواد اس کورس کی بنیاد پر تیار کیا گیا تھا۔
01. سیدھی لائن پر انحصار
یہ سوال پوچھنا کافی معقول ہے - لکیری انحصار اور لاجسٹک ریگریشن کا اس سے کیا تعلق ہے؟
یہ آسان ہے! لاجسٹک ریگریشن ان ماڈلز میں سے ایک ہے جو لکیری درجہ بندی سے تعلق رکھتے ہیں۔ آسان الفاظ میں، لکیری درجہ بندی کرنے والے کا کام ہدف کی اقدار کی پیش گوئی کرنا ہے۔ متغیرات سے (رجعی) . یہ خیال کیا جاتا ہے کہ خصوصیات کے درمیان انحصار اور ہدف کی اقدار لکیری لہذا درجہ بندی کرنے والے کا نام - لکیری۔ اسے بہت موٹے الفاظ میں کہوں، لاجسٹک ریگریشن ماڈل اس مفروضے پر مبنی ہے کہ خصوصیات کے درمیان ایک خطی تعلق ہے۔ اور ہدف کی اقدار . یہ تعلق ہے۔
سٹوڈیو میں پہلی مثال موجود ہے، اور یہ صحیح طور پر، مطالعہ کی جا رہی مقداروں کے رییکٹلینیئر انحصار کے بارے میں ہے۔ مضمون کی تیاری کے دوران، میں نے ایک ایسی مثال دیکھی جس نے پہلے ہی بہت سے لوگوں کو کنارے پر کھڑا کر دیا ہے - وولٹیج پر کرنٹ کا انحصار ("Applied regression analysis"، N. Draper، G. Smith). ہم اسے یہاں بھی دیکھیں گے۔
کے مطابق اوہ کے قانون:
جہاں - موجودہ طاقت، - وولٹیج، --.مزاحمت
اگر ہم نہیں جانتے تھے۔ اوہ کے قانون، پھر ہم انحصار کو تجرباتی طور پر تبدیل کرکے تلاش کرسکتے ہیں۔ اور پیمائش ، حمایت کرتے ہوئے طے شدہ. پھر ہم دیکھیں گے کہ انحصار گراف سے اصل کے ذریعے کم و بیش سیدھی لکیر دیتا ہے۔ ہم "زیادہ یا کم" کہتے ہیں کیونکہ، اگرچہ تعلق درحقیقت درست ہے، ہماری پیمائش میں چھوٹی چھوٹی غلطیاں ہو سکتی ہیں، اور اس لیے گراف پر پوائنٹس بالکل لائن پر نہیں پڑ سکتے، لیکن تصادفی طور پر اس کے ارد گرد بکھرے ہوئے ہوں گے۔
گراف 1 "انحصار" سے »
چارٹ ڈرائنگ کوڈ
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import random
R = 13.75
x_line = np.arange(0,220,1)
y_line = []
for i in x_line:
y_line.append(i/R)
y_dot = []
for i in y_line:
y_dot.append(i+random.uniform(-0.9,0.9))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(x_line,y_line,color = 'purple',lw = 3, label = 'I = U/R')
plt.scatter(x_line,y_dot,color = 'red', label = 'Actual results')
plt.xlabel('I', size = 16)
plt.ylabel('U', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
02. لکیری ریگریشن مساوات کو تبدیل کرنے کی ضرورت
آئیے ایک اور مثال دیکھتے ہیں۔ آئیے تصور کریں کہ ہم ایک بینک میں کام کرتے ہیں اور ہمارا کام بعض عوامل کی بنیاد پر قرض لینے والے کے قرض کی واپسی کے امکانات کا تعین کرنا ہے۔ کام کو آسان بنانے کے لیے، ہم صرف دو عوامل پر غور کریں گے: قرض لینے والے کی ماہانہ تنخواہ اور ماہانہ قرض کی واپسی کی رقم۔
کام بہت مشروط ہے، لیکن اس مثال سے ہم سمجھ سکتے ہیں کہ اسے استعمال کرنا کافی کیوں نہیں ہے۔ لکیری رجعت کے افعال، اور یہ بھی معلوم کریں کہ فنکشن کے ساتھ کن تبدیلیوں کو انجام دینے کی ضرورت ہے۔
آئیے مثال کی طرف لوٹتے ہیں۔ یہ سمجھا جاتا ہے کہ تنخواہ جتنی زیادہ ہوگی، قرض لینے والا قرض کی ادائیگی کے لیے ماہانہ رقم مختص کر سکے گا۔ ایک ہی وقت میں، ایک مخصوص تنخواہ کی حد کے لیے یہ تعلق کافی لکیری ہو گا۔ مثال کے طور پر، آئیے تنخواہ کی حد 60.000 RUR سے 200.000 RUR تک لیتے ہیں اور فرض کریں کہ مخصوص تنخواہ کی حد میں، تنخواہ کے سائز پر ماہانہ ادائیگی کے سائز کا انحصار لکیری ہے۔ ہم کہتے ہیں کہ اجرت کی مخصوص حد کے لیے یہ انکشاف ہوا ہے کہ تنخواہ سے ادائیگی کا تناسب 3 سے نیچے نہیں آ سکتا اور قرض لینے والے کے پاس ابھی بھی 5.000 RUR ریزرو ہونا چاہیے۔ اور صرف اس صورت میں، ہم فرض کریں گے کہ قرض لینے والا بینک کو قرض ادا کرے گا۔ پھر، لکیری ریگریشن مساوات فارم لے گی:
جہاں , , , - تنخواہ -واں قرض لینے والا، - قرض کی ادائیگی -واں قرض لینے والا۔
مساوات میں مقررہ پیرامیٹرز کے ساتھ تنخواہ اور قرض کی ادائیگی کو تبدیل کرنا آپ فیصلہ کر سکتے ہیں کہ قرض جاری کرنا ہے یا انکار کرنا ہے۔
آگے دیکھتے ہوئے، ہم نوٹ کرتے ہیں کہ، دیئے گئے پیرامیٹرز کے ساتھ لکیری ریگریشن فنکشن، میں استعمال کیا جاتا لاجسٹک ردعمل کے افعال بڑی قدریں پیدا کرے گا جو قرض کی واپسی کے امکانات کا تعین کرنے کے لیے حساب کو پیچیدہ بنا دے گی۔ لہذا، یہ تجویز کیا گیا ہے کہ ہمارے گتانک کو 25.000 گنا کم کیا جائے۔ قابلیت میں یہ تبدیلی قرض جاری کرنے کے فیصلے کو تبدیل نہیں کرے گی۔ آئیے اس نکتے کو مستقبل کے لیے یاد رکھیں، لیکن اب، اس بات کو مزید واضح کرنے کے لیے کہ ہم کس کے بارے میں بات کر رہے ہیں، آئیے تین ممکنہ قرض لینے والوں کی صورت حال پر غور کریں۔
جدول 1 "ممکنہ قرض لینے والے"
ٹیبل بنانے کا کوڈ
import pandas as pd
r = 25000.0
w_0 = -5000.0/r
w_1 = 1.0/r
w_2 = -3.0/r
data = {'The borrower':np.array(['Vasya', 'Fedya', 'Lesha']),
'Salary':np.array([120000,180000,210000]),
'Payment':np.array([3000,50000,70000])}
df = pd.DataFrame(data)
df['f(w,x)'] = w_0 + df['Salary']*w_1 + df['Payment']*w_2
decision = []
for i in df['f(w,x)']:
if i > 0:
dec = 'Approved'
decision.append(dec)
else:
dec = 'Refusal'
decision.append(dec)
df['Decision'] = decision
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision']]
جدول میں موجود ڈیٹا کے مطابق، واسیا، 120.000 RUR کی تنخواہ کے ساتھ، قرض حاصل کرنا چاہتا ہے تاکہ وہ اسے ماہانہ 3.000 RUR پر ادا کر سکے۔ ہم نے طے کیا ہے کہ قرض کو منظور کرنے کے لیے، Vasya کی تنخواہ ادائیگی کی رقم سے تین گنا زیادہ ہونی چاہیے، اور ابھی بھی 5.000 RUR باقی رہنا چاہیے۔ واسیا اس ضرورت کو پورا کرتا ہے: . یہاں تک کہ 106.000 RUR باقی ہے۔ اس حقیقت کے باوجود کہ جب حساب لگانا ہم نے مشکلات کو کم کر دیا ہے 25.000 بار، نتیجہ ایک ہی تھا - قرض کی منظوری دی جا سکتی ہے. فیڈیا کو بھی قرض ملے گا، لیکن لیشا، اس حقیقت کے باوجود کہ وہ سب سے زیادہ وصول کرتا ہے، اسے اپنی بھوک کو کم کرنا پڑے گا۔
آئیے اس کیس کے لیے ایک گراف بناتے ہیں۔
چارٹ 2 "قرض لینے والوں کی درجہ بندی"
گراف ڈرائنگ کے لیے کوڈ
salary = np.arange(60000,240000,20000)
payment = (-w_0-w_1*salary)/w_2
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(salary, payment, color = 'grey', lw = 2, label = '$f(w,x_i)=w_0 + w_1x_{i1} + w_2x_{i2}$')
plt.plot(df[df['Decision'] == 'Approved']['Salary'], df[df['Decision'] == 'Approved']['Payment'],
'o', color ='green', markersize = 12, label = 'Decision - Loan approved')
plt.plot(df[df['Decision'] == 'Refusal']['Salary'], df[df['Decision'] == 'Refusal']['Payment'],
's', color = 'red', markersize = 12, label = 'Decision - Loan refusal')
plt.xlabel('Salary', size = 16)
plt.ylabel('Payment', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
لہذا، ہماری سیدھی لائن، فنکشن کے مطابق بنائی گئی ہے۔ ، "خراب" قرض لینے والوں کو "اچھے" سے الگ کرتا ہے۔ وہ قرض لینے والے جن کی خواہشات ان کی صلاحیتوں کے مطابق نہیں ہیں وہ لائن (لیشا) سے اوپر ہیں، جب کہ جو لوگ ہمارے ماڈل کے پیرامیٹرز کے مطابق قرض ادا کرنے کے قابل ہیں، وہ لائن سے نیچے ہیں (واسیا اور فیدیا)۔ دوسرے الفاظ میں، ہم یہ کہہ سکتے ہیں: ہماری براہ راست لائن قرض لینے والوں کو دو طبقات میں تقسیم کرتی ہے۔ آئیے ہم ان کو اس طرح بیان کرتے ہیں: کلاس سے ہم ان قرض دہندگان کی درجہ بندی کریں گے جن کے قرض کی ادائیگی کا زیادہ امکان ہے۔ یا ہم ان قرض دہندگان کو شامل کریں گے جو ممکنہ طور پر قرض ادا نہیں کر سکیں گے۔
آئیے اس سادہ سی مثال سے نتیجہ اخذ کرتے ہیں۔ آئیے ایک نقطہ لیتے ہیں۔ اور، نقطہ کے نقاط کو لائن کی متعلقہ مساوات میں بدلنا ، تین اختیارات پر غور کریں:
- اگر پوائنٹ لائن کے نیچے ہے اور ہم اسے کلاس کو تفویض کرتے ہیں۔ ، پھر فنکشن کی قدر سے مثبت ہو جائے گا پر . اس کا مطلب ہے کہ ہم فرض کر سکتے ہیں کہ قرض کی ادائیگی کا امکان اندر ہی اندر ہے۔ . فنکشن ویلیو جتنی بڑی ہوگی، امکان اتنا ہی زیادہ ہوگا۔
- اگر کوئی نقطہ ایک لائن سے اوپر ہے اور ہم اسے کلاس کو تفویض کرتے ہیں۔ یا ، پھر فنکشن کی قدر منفی سے ہوگی۔ پر . پھر ہم فرض کریں گے کہ قرض کی ادائیگی کا امکان اندر ہی اندر ہے۔ اور، فنکشن کی مطلق قدر جتنی زیادہ ہوگی، ہمارا اعتماد اتنا ہی زیادہ ہوگا۔
- نقطہ ایک سیدھی لکیر پر ہے، دو کلاسوں کے درمیان باؤنڈری پر۔ اس صورت میں، فنکشن کی قدر برابر ہو جائے گا اور قرض کی ادائیگی کا امکان برابر ہے۔ .
اب، آئیے تصور کریں کہ ہمارے پاس دو نہیں بلکہ درجنوں، اور تین نہیں بلکہ ہزاروں قرض لینے والے ہیں۔ پھر سیدھی لکیر کے بجائے ہمارے پاس ہو گا۔ ایم جہتی ہوائی جہاز اور گتانک ہمیں پتلی ہوا سے باہر نہیں نکالا جائے گا، لیکن تمام قواعد کے مطابق، اور قرض لینے والوں کے جمع کردہ ڈیٹا کی بنیاد پر حاصل کیا جائے گا جنہوں نے قرض ادا کیا ہے یا نہیں کیا ہے۔ اور درحقیقت، نوٹ کریں کہ اب ہم پہلے سے معلوم گتانک کا استعمال کرتے ہوئے قرض لینے والوں کا انتخاب کر رہے ہیں۔ . درحقیقت، لاجسٹک ریگریشن ماڈل کا کام قطعی طور پر پیرامیٹرز کا تعین کرنا ہے۔ ، جس پر نقصان کے فنکشن کی قدر لاجسٹک نقصان کم سے کم کی طرف رجحان ہو گا. لیکن اس بارے میں کہ ویکٹر کا حساب کیسے لگایا جاتا ہے۔ ، ہم مضمون کے 5ویں حصے میں مزید معلومات حاصل کریں گے۔ اس دوران، ہم اپنے بینکر اور اس کے تین مؤکلوں کے پاس - وعدہ شدہ زمین پر واپس آ گئے۔
فنکشن کا شکریہ ہم جانتے ہیں کہ کس کو قرض دیا جا سکتا ہے اور کسے انکار کرنے کی ضرورت ہے۔ لیکن آپ اس طرح کی معلومات کے ساتھ ڈائریکٹر کے پاس نہیں جا سکتے، کیونکہ وہ ہم سے ہر قرض لینے والے کے قرض کی واپسی کا امکان حاصل کرنا چاہتے تھے۔ کیا کرنا ہے؟ جواب آسان ہے - ہمیں کسی نہ کسی طرح فنکشن کو تبدیل کرنے کی ضرورت ہے۔ ، جس کی اقدار رینج میں ہیں۔ ایک فنکشن میں جس کی قدریں رینج میں ہوں گی۔ . اور ایسا فنکشن موجود ہے، اسے کہتے ہیں۔ لاجسٹک رسپانس فنکشن یا الٹا لاگٹ ٹرانسفارمیشن. ملو:
آئیے قدم بہ قدم دیکھتے ہیں کہ یہ کیسے کام کرتا ہے۔ لاجسٹک ردعمل کی تقریب. نوٹ کریں کہ ہم مخالف سمت میں چلیں گے، یعنی ہم فرض کریں گے کہ ہم امکانی قدر کو جانتے ہیں، جو کہ سے کی حد میں ہے۔ پر اور پھر ہم اس قدر کو نمبروں کی پوری رینج سے "کھلائیں گے" پر .
03. ہم لاجسٹک رسپانس فنکشن اخذ کرتے ہیں۔
مرحلہ 1۔ امکانی قدروں کو رینج میں تبدیل کریں۔
فنکشن کی تبدیلی کے دوران в لاجسٹک ردعمل کی تقریب ہم اپنے کریڈٹ تجزیہ کار کو اکیلا چھوڑ دیں گے اور اس کے بجائے بک میکرز کا دورہ کریں گے۔ نہیں، یقیناً، ہم شرطیں نہیں لگائیں گے، جو کچھ ہماری دلچسپی ہے وہ اظہار کا مطلب ہے، مثال کے طور پر، موقع 4 سے 1 ہے۔ تمام شرط لگانے والوں کے لیے مشکلات، "کامیابیوں" سے "کا تناسب" ہیں۔ ناکامیاں" امکانات کی شرائط میں، مشکلات واقعہ کے رونما ہونے کے امکان کو واقعہ کے نہ ہونے کے امکان سے تقسیم کیا جاتا ہے۔ آئیے کسی واقعہ کے پیش آنے کے امکانات کا فارمولا لکھتے ہیں۔ :
جہاں - واقعہ ہونے کا امکان، - واقعہ نہ ہونے کا امکان
مثال کے طور پر، اگر اس بات کا امکان ہے کہ ایک نوجوان، مضبوط اور چنچل گھوڑا جس کا عرفی نام "ویٹروک" ہے، ایک دوڑ میں "مٹیلڈا" نامی بوڑھی اور چڑچڑی بوڑھی عورت کو ہرا دے گا۔ ، پھر "Veterok" کی کامیابی کے امکانات ہوں گے۔ к اور اس کے برعکس، مشکلات کو جانتے ہوئے، ہمارے لیے امکان کا حساب لگانا مشکل نہیں ہوگا :
اس طرح، ہم نے امکانات کو امکانات میں "ترجمہ" کرنا سیکھا ہے، جس سے قدریں لی جاتی ہیں۔ پر . آئیے ایک اور قدم اٹھاتے ہیں اور امکان کو پوری نمبر لائن سے "ترجمہ" کرنا سیکھتے ہیں۔ پر .
مرحلہ 2۔ امکانی قدروں کو رینج میں تبدیل کریں۔
یہ مرحلہ بہت آسان ہے - آئیے مشکلات کے لوگارتھم کو یولر کے نمبر کی بنیاد پر لے جائیں اور ہمیں ملتا ہے:
اب ہم جانتے ہیں کہ اگر ، پھر قدر کا حساب لگائیں۔ بہت آسان ہو جائے گا اور، اس کے علاوہ، یہ مثبت ہونا چاہئے: . یہ حقیقت ہے.
تجسس سے باہر، آئیے چیک کرتے ہیں کہ کیا ہے۔ ، پھر ہم منفی قدر دیکھنے کی توقع کرتے ہیں۔ . ہم چیک کرتے ہیں: . یہ ٹھیک ہے.
اب ہم جانتے ہیں کہ امکانی قدر کو کیسے تبدیل کرنا ہے۔ پر سے پوری نمبر لائن کے ساتھ پر . اگلے مرحلے میں ہم اس کے برعکس کریں گے۔
ابھی کے لیے، ہم نوٹ کرتے ہیں کہ لوگارتھم کے اصولوں کے مطابق، فنکشن کی قدر کو جانتے ہوئے ، آپ مشکلات کا حساب لگا سکتے ہیں:
مشکلات کا تعین کرنے کا یہ طریقہ اگلے مرحلے میں ہمارے لیے مفید ہو گا۔
مرحلہ 3۔ آئیے تعین کرنے کے لیے ایک فارمولہ اخذ کرتے ہیں۔
تو ہم نے سیکھا، جان کر ، فنکشن ویلیوز تلاش کریں۔ . تاہم، حقیقت میں، ہمیں بالکل اس کے برعکس کی ضرورت ہے - قدر کو جاننا مل . ایسا کرنے کے لیے، آئیے ایک ایسے تصور کی طرف رجوع کریں جیسے الٹا اوڈس فنکشن، جس کے مطابق:
مضمون میں ہم مندرجہ بالا فارمولہ اخذ نہیں کریں گے، لیکن ہم اوپر دی گئی مثال سے اعداد کا استعمال کرتے ہوئے اسے چیک کریں گے۔ ہم جانتے ہیں کہ 4 سے 1 کی مشکلات کے ساتھ ()، واقعہ ہونے کا امکان 0.8 ہے ()۔ آئیے ایک متبادل بناتے ہیں: . یہ ہمارے پہلے کئے گئے حسابات کے موافق ہے۔ آئیے آگے بڑھیں۔
آخری مرحلے میں ہم نے اس کا اندازہ لگایا ، جس کا مطلب ہے کہ آپ الٹا odds فنکشن میں متبادل بنا سکتے ہیں۔ ہم حاصل:
ہندسوں اور ڈینومینیٹر دونوں کو بذریعہ تقسیم کریں۔ ، پھر:
صرف اس صورت میں، اس بات کو یقینی بنانے کے لیے کہ ہم نے کہیں غلطی نہیں کی ہے، ہم ایک اور چھوٹی جانچ کریں گے۔ مرحلہ 2 میں، ہم کے لئے طے کیا کہ . اس کے بعد، قدر کو تبدیل کرنا لاجسٹک ردعمل کی تقریب میں، ہم حاصل کرنے کی توقع رکھتے ہیں . ہم متبادل اور حاصل کرتے ہیں:
مبارک ہو، پیارے قارئین، ہم نے ابھی لاجسٹک رسپانس فنکشن کو اخذ کیا ہے اور تجربہ کیا ہے۔ آئیے فنکشن کے گراف کو دیکھتے ہیں۔
گراف 3 "لاجسٹک رسپانس فنکشن"
گراف ڈرائنگ کے لیے کوڈ
import math
def logit (f):
return 1/(1+math.exp(-f))
f = np.arange(-7,7,0.05)
p = []
for i in f:
p.append(logit(i))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(f, p, color = 'grey', label = '$ 1 / (1+e^{-w^Tx_i})$')
plt.xlabel('$f(w,x_i) = w^Tx_i$', size = 16)
plt.ylabel('$p_{i+}$', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
ادب میں آپ کو اس فنکشن کا نام بھی مل سکتا ہے۔ سگمائڈ فنکشن. گراف واضح طور پر ظاہر کرتا ہے کہ کسی طبقے سے تعلق رکھنے والی کسی چیز کے امکان میں بنیادی تبدیلی نسبتاً چھوٹی حد میں ہوتی ہے۔ ، کہیں سے پر .
میں اپنے کریڈٹ تجزیہ کار کے پاس واپس آنے اور قرض کی واپسی کے امکان کا حساب لگانے میں اس کی مدد کرنے کا مشورہ دیتا ہوں، ورنہ اسے بونس کے بغیر چھوڑے جانے کا خطرہ ہے :)
جدول 2 "ممکنہ قرض لینے والے"
ٹیبل بنانے کا کوڈ
proba = []
for i in df['f(w,x)']:
proba.append(round(logit(i),2))
df['Probability'] = proba
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision', 'Probability']]
لہذا، ہم نے قرض کی واپسی کے امکان کا تعین کیا ہے۔ عام طور پر، یہ سچ لگتا ہے.
درحقیقت، اس بات کا امکان کہ واسیا، 120.000 RUR کی تنخواہ کے ساتھ، ہر ماہ بینک کو 3.000 RUR دے سکے گا، 100% کے قریب ہے۔ ویسے، ہمیں یہ سمجھنا چاہیے کہ بینک لیشا کو قرض جاری کر سکتا ہے اگر بینک کی پالیسی، مثال کے طور پر، 0.3 سے زیادہ کے قرض کی واپسی کے امکان والے کلائنٹس کو قرض دینے کے لیے۔ یہ صرف اتنا ہے کہ اس معاملے میں بینک ممکنہ نقصانات کے لیے ایک بڑا ریزرو بنائے گا۔
یہ بھی واضح رہے کہ تنخواہ سے ادائیگی کا تناسب کم از کم 3 اور 5.000 RUR کے مارجن کے ساتھ چھت سے لیا گیا تھا۔ لہذا، ہم وزن کے ویکٹر کو اس کی اصل شکل میں استعمال نہیں کر سکے۔ . ہمیں گتانکوں کو بہت کم کرنے کی ضرورت تھی، اور اس صورت میں ہم نے ہر ایک کو 25.000 سے تقسیم کیا، یعنی جوہر میں، ہم نے نتیجہ کو ایڈجسٹ کیا۔ لیکن یہ خاص طور پر ابتدائی مرحلے میں مواد کی تفہیم کو آسان بنانے کے لیے کیا گیا تھا۔ زندگی میں، ہمیں گتانکوں کو ایجاد کرنے اور ایڈجسٹ کرنے کی ضرورت نہیں ہوگی، بلکہ انہیں تلاش کرنے کی ضرورت ہوگی۔ مضمون کے اگلے حصوں میں ہم ان مساواتوں کو اخذ کریں گے جن کے ساتھ پیرامیٹرز کا انتخاب کیا گیا ہے۔ .
04. وزن کے ویکٹر کا تعین کرنے کے لیے کم سے کم مربع کا طریقہ لاجسٹک رسپانس فنکشن میں
ہم وزن کے ویکٹر کو منتخب کرنے کا یہ طریقہ پہلے ہی جانتے ہیں۔ جیسا کہ کم از کم مربع طریقہ (LSM) اور درحقیقت، ہم اسے بائنری درجہ بندی کے مسائل میں استعمال کیوں نہیں کرتے؟ درحقیقت، کوئی بھی چیز آپ کو استعمال کرنے سے نہیں روکتی MNC، درجہ بندی کے مسائل میں صرف یہ طریقہ نتائج دیتا ہے جو اس سے کم درست ہیں۔ لاجسٹک نقصان. اس کی ایک نظریاتی بنیاد ہے۔ آئیے پہلے ایک سادہ سی مثال پر نظر ڈالیں۔
آئیے فرض کریں کہ ہمارے ماڈل (استعمال کرتے ہوئے MSE и لاجسٹک نقصان) نے پہلے ہی وزن کے ویکٹر کا انتخاب شروع کر دیا ہے۔ اور ہم نے کچھ قدم پر حساب روک دیا۔ اس سے کوئی فرق نہیں پڑتا کہ درمیان میں، آخر میں یا شروع میں، اہم بات یہ ہے کہ ہمارے پاس وزن کے ویکٹر کی کچھ قدریں پہلے سے ہی موجود ہیں اور آئیے مان لیتے ہیں کہ اس مرحلے پر، وزن کا ویکٹر دونوں ماڈلز میں کوئی فرق نہیں ہے۔ پھر نتیجے میں وزن لیں اور ان کی جگہ لے لیں۔ لاجسٹک ردعمل کی تقریب () کسی ایسی چیز کے لیے جو کلاس سے تعلق رکھتی ہے۔ . ہم دو صورتوں کا جائزہ لیتے ہیں جب، وزن کے منتخب ویکٹر کے مطابق، ہمارا ماڈل بہت غلط ہے اور اس کے برعکس - ماڈل کو بہت اعتماد ہے کہ شے کا تعلق کلاس سے ہے۔ . دیکھتے ہیں کہ استعمال کرنے پر کیا جرمانے جاری کیے جائیں گے۔ MNC и لاجسٹک نقصان.
استعمال شدہ نقصان کے فنکشن کے لحاظ سے جرمانے کا حساب لگانے کا کوڈ
# класс объекта
y = 1
# вероятность отнесения объекта к классу в соответствии с параметрами w
proba_1 = 0.01
MSE_1 = (y - proba_1)**2
print 'Штраф MSE при грубой ошибке =', MSE_1
# напишем функцию для вычисления f(w,x) при известной вероятности отнесения объекта к классу +1 (f(w,x)=ln(odds+))
def f_w_x(proba):
return math.log(proba/(1-proba))
LogLoss_1 = math.log(1+math.exp(-y*f_w_x(proba_1)))
print 'Штраф Log Loss при грубой ошибке =', LogLoss_1
proba_2 = 0.99
MSE_2 = (y - proba_2)**2
LogLoss_2 = math.log(1+math.exp(-y*f_w_x(proba_2)))
print '**************************************************************'
print 'Штраф MSE при сильной уверенности =', MSE_2
print 'Штраф Log Loss при сильной уверенности =', LogLoss_2
ایک غلطی کا معاملہ - ماڈل کلاس کو ایک آبجیکٹ تفویض کرتا ہے۔ 0,01 کے امکان کے ساتھ
استعمال پر جرمانہ MNC ہو جائے گا:
استعمال پر جرمانہ لاجسٹک نقصان ہو جائے گا:
مضبوط اعتماد کا معاملہ - ماڈل کلاس کو ایک آبجیکٹ تفویض کرتا ہے۔ 0,99 کے امکان کے ساتھ
استعمال پر جرمانہ MNC ہو جائے گا:
استعمال پر جرمانہ لاجسٹک نقصان ہو جائے گا:
یہ مثال اچھی طرح سے واضح کرتی ہے کہ مجموعی غلطی کی صورت میں نقصان کا فنکشن لاگ نقصان سے نمایاں طور پر زیادہ ماڈل کو سزا دیتا ہے۔ MSE. آئیے اب سمجھتے ہیں کہ نقصان کے فنکشن کو استعمال کرنے کا نظریاتی پس منظر کیا ہے۔ لاگ نقصان درجہ بندی کے مسائل میں
05. زیادہ سے زیادہ امکان کا طریقہ اور لاجسٹک ریگریشن
جیسا کہ شروع میں وعدہ کیا گیا تھا، مضمون سادہ مثالوں سے بھرا ہوا ہے۔ اسٹوڈیو میں ایک اور مثال اور پرانے مہمان ہیں - بینک قرض لینے والے: واسیا، فیدیا اور لیشا۔
صرف اس صورت میں، مثال کو تیار کرنے سے پہلے، میں آپ کو یاد دلاتا ہوں کہ زندگی میں ہم دسیوں یا سینکڑوں خصوصیات کے ساتھ ہزاروں یا لاکھوں اشیاء کے تربیتی نمونے کے ساتھ کام کر رہے ہیں۔ تاہم، یہاں نمبر اس لیے لیے گئے ہیں کہ وہ آسانی سے ایک نوآموز ڈیٹا سائنسدان کے سر میں فٹ ہو سکیں۔
آئیے مثال کی طرف لوٹتے ہیں۔ آئیے تصور کریں کہ بینک کے ڈائریکٹر نے ہر ضرورت مند کو قرض جاری کرنے کا فیصلہ کیا، اس حقیقت کے باوجود کہ الگورتھم نے اسے Lesha کو جاری نہ کرنے کو کہا۔ اور اب کافی وقت گزر چکا ہے اور ہم جانتے ہیں کہ تینوں ہیروز میں سے کس نے قرض ادا کیا اور کس نے نہیں کیا۔ کیا توقع کی جا رہی تھی: واسیا اور فیڈیا نے قرض ادا کیا، لیکن لیشا نے نہیں کیا. اب تصور کریں کہ یہ نتیجہ ہمارے لیے ایک نیا تربیتی نمونہ ہو گا اور ساتھ ہی، یہ ایسے ہی ہے جیسے قرض کی واپسی کے امکان کو متاثر کرنے والے عوامل کا تمام ڈیٹا (قرض لینے والے کی تنخواہ، ماہانہ ادائیگی کا سائز) غائب ہو گیا ہے۔ پھر، بدیہی طور پر، ہم یہ فرض کر سکتے ہیں کہ ہر تیسرا قرض لینے والا بینک کو قرض واپس نہیں کرتا، یا دوسرے لفظوں میں، اگلے قرض لینے والے کے قرض کی واپسی کا امکان۔ . اس بدیہی مفروضے کی نظریاتی تصدیق ہے اور اس پر مبنی ہے۔ زیادہ سے زیادہ امکان کا طریقہ، اکثر ادب میں اسے کہا جاتا ہے۔ زیادہ سے زیادہ امکان کا اصول.
سب سے پہلے، آئیے تصوراتی آلات سے واقف ہوں۔
نمونے لینے کا امکان بالکل ایسا نمونہ حاصل کرنے کا امکان ہے، بالکل ایسے مشاہدات/نتائج حاصل کرنا، یعنی ہر ایک نمونے کے نتائج حاصل کرنے کے امکانات کی پیداوار (مثال کے طور پر، آیا واسیا، فیدیا اور لیشا کا قرض ایک ہی وقت میں ادا کیا گیا یا نہیں)۔
امکان کی تقریب تقسیم کے پیرامیٹرز کی قدروں سے نمونے کے امکان کا تعلق ہے۔
ہمارے معاملے میں، تربیتی نمونہ ایک عمومی برنولی اسکیم ہے، جس میں بے ترتیب متغیر صرف دو قدریں لیتا ہے: یا . لہذا، نمونہ امکان کو پیرامیٹر کے امکانی فعل کے طور پر لکھا جا سکتا ہے۔ مندرجہ ذیل
مندرجہ بالا اندراج کی تشریح اس طرح کی جا سکتی ہے۔ مشترکہ امکان کہ واسیا اور فیدیا قرض کی ادائیگی کے برابر ہے۔ , امکان ہے کہ Lesha قرض ادا نہیں کرے گا کے برابر ہے (چونکہ یہ قرض کی واپسی نہیں تھی) اس لیے تینوں واقعات کا مشترکہ امکان برابر ہے۔ .
زیادہ سے زیادہ امکان کا طریقہ زیادہ سے زیادہ کر کے نامعلوم پیرامیٹر کا اندازہ لگانے کا ایک طریقہ ہے۔ امکانات کے افعال. ہمارے معاملے میں، ہمیں ایسی قدر تلاش کرنے کی ضرورت ہے۔ جس پر اس کی زیادہ سے زیادہ تک پہنچ جاتا ہے.
اصل خیال کہاں سے آتا ہے - کسی نامعلوم پیرامیٹر کی قدر تلاش کرنے کے لیے جس پر امکان کا فنکشن زیادہ سے زیادہ تک پہنچ جاتا ہے؟ خیال کی ابتدا اس خیال سے ہوئی ہے کہ آبادی کے بارے میں ہمارے لیے دستیاب معلومات کا واحد ذریعہ نمونہ ہے۔ آبادی کے بارے میں جو کچھ بھی ہم جانتے ہیں اس کی نمائندگی نمونے میں کی گئی ہے۔ لہذا، ہم صرف اتنا کہہ سکتے ہیں کہ نمونہ ہمارے لیے دستیاب آبادی کا سب سے درست عکاس ہے۔ لہذا، ہمیں ایک پیرامیٹر تلاش کرنے کی ضرورت ہے جس پر دستیاب نمونہ سب سے زیادہ ممکنہ ہو جائے۔
ظاہر ہے، ہم ایک اصلاحی مسئلہ سے نمٹ رہے ہیں جس میں ہمیں کسی فنکشن کا ایکسٹریم پوائنٹ تلاش کرنے کی ضرورت ہے۔ ایکسٹریمم پوائنٹ کو تلاش کرنے کے لیے، پہلی ترتیب کی شرط پر غور کرنا ضروری ہے، یعنی فنکشن کے مشتق کو صفر کے برابر کریں اور مطلوبہ پیرامیٹر کے حوالے سے مساوات کو حل کریں۔ تاہم، ایک بڑی تعداد کے عوامل پر مشتمل مصنوع کے مشتق کو تلاش کرنا ایک لمبا کام ہوسکتا ہے؛ اس سے بچنے کے لیے، ایک خاص تکنیک ہے - لوگارتھم پر سوئچ کرنا۔ امکانات کے افعال. ایسی منتقلی کیوں ممکن ہے؟ آئیے اس حقیقت پر توجہ دیں کہ ہم خود فنکشن کی انتہا کو تلاش نہیں کر رہے ہیں۔، اور ایکسٹریمم پوائنٹ، یعنی نامعلوم پیرامیٹر کی قدر جس پر اس کی زیادہ سے زیادہ تک پہنچ جاتا ہے. لوگارتھم کی طرف جاتے وقت، ایکسٹریمم پوائنٹ تبدیل نہیں ہوتا ہے (حالانکہ ایکسٹریم خود مختلف ہوگا)، کیونکہ لوگارتھم ایک مونوٹونک فنکشن ہے۔
آئیے، مندرجہ بالا کے مطابق، واسیا، فیدیا اور لیشا کے قرضوں کے ساتھ اپنی مثال کو تیار کرنا جاری رکھیں۔ سب سے پہلے کی طرف چلتے ہیں۔ امکان کے فنکشن کا لوگارتھم:
اب ہم آسانی سے اظہار کو مختلف کر سکتے ہیں۔ :
اور آخر میں، پہلی ترتیب کی شرط پر غور کریں - ہم فنکشن کے مشتق کو صفر کے برابر کرتے ہیں:
اس طرح، قرض کی ادائیگی کے امکان کا ہمارا بدیہی تخمینہ نظریاتی طور پر جائز تھا۔
بہت اچھا، لیکن اب ہمیں اس معلومات کا کیا کرنا چاہیے؟ اگر ہم فرض کریں کہ ہر تیسرا قرض لینے والا رقم بینک کو واپس نہیں کرتا ہے، تو مؤخر الذکر لازمی طور پر دیوالیہ ہو جائے گا۔ یہ ٹھیک ہے، لیکن صرف اس صورت میں جب قرض کی واپسی کے امکان کا جائزہ لیا جائے۔ ہم نے قرض کی واپسی کو متاثر کرنے والے عوامل کو مدنظر نہیں رکھا: قرض لینے والے کی تنخواہ اور ماہانہ ادائیگی کا سائز۔ ہمیں یاد رکھنا چاہیے کہ ہم نے پہلے انہی عوامل کو مدنظر رکھتے ہوئے ہر کلائنٹ کی طرف سے قرض کی واپسی کے امکان کا حساب لگایا تھا۔ یہ منطقی ہے کہ ہم نے مستقل برابری سے مختلف احتمالات حاصل کیے ہیں۔ .
آئیے نمونے کے امکان کی وضاحت کرتے ہیں:
نمونے کے امکانات کا حساب لگانے کے لیے کوڈ
from functools import reduce
def likelihood(y,p):
line_true_proba = []
for i in range(len(y)):
ltp_i = p[i]**y[i]*(1-p[i])**(1-y[i])
line_true_proba.append(ltp_i)
likelihood = []
return reduce(lambda a, b: a*b, line_true_proba)
y = [1.0,1.0,0.0]
p_log_response = df['Probability']
const = 2.0/3.0
p_const = [const, const, const]
print 'Правдоподобие выборки при константном значении p=2/3:', round(likelihood(y,p_const),3)
print '****************************************************************************************************'
print 'Правдоподобие выборки при расчетном значении p:', round(likelihood(y,p_log_response),3)
ایک مستقل قدر پر نمونہ کا امکان :
عوامل کو مدنظر رکھتے ہوئے قرض کی واپسی کے امکان کا حساب لگاتے وقت نمونہ امکان :
عوامل پر منحصر ایک امکان کے ساتھ نمونے کا امکان ایک مستقل امکانی قدر کے ساتھ امکان سے زیادہ نکلا۔ اس کا کیا مطلب ہے؟ اس سے پتہ چلتا ہے کہ عوامل کے بارے میں علم نے ہر کلائنٹ کے لیے قرض کی واپسی کے امکان کو زیادہ درست طریقے سے منتخب کرنا ممکن بنایا ہے۔ لہذا، اگلا قرض جاری کرتے وقت، قرض کی واپسی کے امکان کا اندازہ لگانے کے لیے آرٹیکل کے سیکشن 3 کے آخر میں تجویز کردہ ماڈل کو استعمال کرنا زیادہ درست ہوگا۔
لیکن پھر، اگر ہم زیادہ سے زیادہ کرنا چاہتے ہیں نمونہ امکان تقریبپھر کیوں نہ کچھ الگورتھم استعمال کریں جو واسیا، فیدیا اور لیشا کے لیے امکانات پیدا کرے، مثال کے طور پر، بالترتیب 0.99، 0.99 اور 0.01 کے برابر۔ شاید اس طرح کا الگورتھم تربیتی نمونے پر اچھی کارکردگی کا مظاہرہ کرے گا، کیونکہ یہ نمونے کے امکانات کی قدر کو قریب لائے گا۔ ، لیکن، سب سے پہلے، اس طرح کے الگورتھم کو عام کرنے کی صلاحیت کے ساتھ زیادہ تر مشکلات کا سامنا کرنا پڑے گا، اور دوسرا، یہ الگورتھم یقینی طور پر لکیری نہیں ہوگا۔ اور اگر اوورٹریننگ کا مقابلہ کرنے کے طریقے (مساوی طور پر کمزور عام کرنے کی صلاحیت) کو اس مضمون کے منصوبے میں واضح طور پر شامل نہیں کیا گیا ہے، تو آئیے دوسرے نکتے کو مزید تفصیل سے دیکھتے ہیں۔ ایسا کرنے کے لیے، صرف ایک سادہ سوال کا جواب دیں۔ کیا ہمیں معلوم عوامل کو مدنظر رکھتے ہوئے واسیا اور فیدیا کے قرض کی ادائیگی کا امکان یکساں ہو سکتا ہے؟ صوتی منطق کے نقطہ نظر سے، یقیناً نہیں، ایسا نہیں ہو سکتا۔ لہٰذا واسیا اپنی تنخواہ کا 2.5% ہر ماہ قرض ادا کرنے کے لیے ادا کرے گا، اور Fedya - تقریباً 27,8%۔ نیز گراف 2 "کلائنٹ کی درجہ بندی" میں ہم دیکھتے ہیں کہ واسیہ فیڈیا سے کلاسوں کو الگ کرنے والی لائن سے بہت آگے ہے۔ اور آخر میں، ہم جانتے ہیں کہ فنکشن Vasya اور Fedya کے لیے مختلف قدریں لیتی ہیں: 4.24 Vasya کے لیے اور 1.0 Fedya کے لیے۔ اب، مثال کے طور پر، اگر فیدیا نے زیادہ مقدار کا آرڈر حاصل کیا یا اس سے چھوٹا قرض طلب کیا، تو واسع اور فیدیا کے لیے قرض کی ادائیگی کے امکانات ایک جیسے ہوں گے۔ دوسرے الفاظ میں، لکیری انحصار کو بیوقوف نہیں بنایا جا سکتا۔ اور اگر ہم نے اصل میں مشکلات کا حساب لگایا ، اور انہیں پتلی ہوا سے باہر نہیں نکالا، ہم محفوظ طریقے سے کہہ سکتے ہیں کہ ہماری اقدار ہمیں ہر قرض لینے والے کی طرف سے قرض کی واپسی کے امکان کا اندازہ لگانے کی بہترین اجازت ہے، لیکن چونکہ ہم نے یہ ماننے پر اتفاق کیا کہ گتانک کا تعین تمام قواعد کے مطابق انجام دیا گیا تھا، پھر ہم ایسا فرض کریں گے - ہمارے قابلیت ہمیں امکان کا بہتر تخمینہ دینے کی اجازت دیتے ہیں :)
تاہم، ہم ہچکچاتے ہیں. اس حصے میں ہمیں یہ سمجھنے کی ضرورت ہے کہ وزن کے ویکٹر کا تعین کیسے کیا جاتا ہے۔ ، جو ہر قرض لینے والے کی طرف سے قرض کی واپسی کے امکان کا اندازہ لگانے کے لیے ضروری ہے۔
آئیے مختصراً یہ بتائیں کہ ہم کس ہتھیار کی تلاش میں جاتے ہیں۔ :
1. ہم فرض کرتے ہیں کہ ہدف کے متغیر (پیش گوئی کی قدر) اور نتیجہ کو متاثر کرنے والے عنصر کے درمیان تعلق لکیری ہے۔ اس وجہ سے استعمال کیا جاتا ہے۔ لکیری ریگریشن فنکشن پرجاتی ، جس کی لائن اشیاء (کلائنٹس) کو کلاسوں میں تقسیم کرتی ہے۔ и یا (مؤکل جو قرض ادا کرنے کے قابل ہیں اور جو نہیں ہیں)۔ ہمارے معاملے میں، مساوات کی شکل ہے۔ .
2. ہم استعمال کرتے ہیں۔ الٹا لاگٹ فنکشن پرجاتی کسی طبقے سے تعلق رکھنے والی چیز کے امکان کا تعین کرنے کے لیے .
3. ہم اپنے تربیتی سیٹ کو ایک عمومی کے نفاذ کے طور پر سمجھتے ہیں۔ برنولی اسکیمیں، یعنی، ہر چیز کے لیے ایک بے ترتیب متغیر پیدا ہوتا ہے، جو امکان کے ساتھ ہوتا ہے۔ (ہر چیز کے لیے اس کی اپنی) قدر 1 لیتا ہے اور امکان کے ساتھ - 0.
4. ہم جانتے ہیں کہ ہمیں زیادہ سے زیادہ کرنے کی کیا ضرورت ہے۔ نمونہ امکان تقریب قبول شدہ عوامل کو مدنظر رکھتے ہوئے تاکہ دستیاب نمونہ سب سے زیادہ قابل فہم بن جائے۔ دوسرے الفاظ میں، ہمیں ایسے پیرامیٹرز کو منتخب کرنے کی ضرورت ہے جن پر نمونہ سب سے زیادہ قابل فہم ہوگا۔ ہمارے معاملے میں، منتخب کردہ پیرامیٹر قرض کی ادائیگی کا امکان ہے۔ ، جو بدلے میں نامعلوم گتانکوں پر منحصر ہے۔ . لہذا ہمیں وزن کا ایسا ویکٹر تلاش کرنے کی ضرورت ہے۔ ، جس پر نمونے کا امکان زیادہ سے زیادہ ہوگا۔
5. ہم جانتے ہیں کہ کیا زیادہ سے زیادہ کرنا ہے۔ نمونے کے امکانات کے افعال استعمال کر سکتے ہیں زیادہ سے زیادہ امکان کا طریقہ. اور ہم اس طریقے کے ساتھ کام کرنے کی تمام مشکل چالوں کو جانتے ہیں۔
اس طرح یہ ایک ملٹی سٹیپ اقدام ثابت ہوتا ہے :)
اب یاد رکھیں کہ مضمون کے بالکل شروع میں ہم دو طرح کے نقصان کے افعال اخذ کرنا چاہتے تھے۔ لاجسٹک نقصان آبجیکٹ کلاسز کو کس طرح نامزد کیا جاتا ہے اس پر منحصر ہے۔ ایسا ہوا کہ دو طبقوں کے ساتھ درجہ بندی کے مسائل میں، کلاسز کو بطور اشارہ کیا جاتا ہے۔ и یا . اشارے پر منحصر ہے، آؤٹ پٹ میں اسی نقصان کا فنکشن ہوگا۔
کیس 1. میں اشیاء کی درجہ بندی и
اس سے پہلے، ایک نمونے کے امکان کا تعین کرتے وقت، جس میں قرض لینے والے کی طرف سے قرض کی واپسی کے امکان کو عوامل اور دیے گئے گتانکوں کی بنیاد پر شمار کیا جاتا تھا۔ ، ہم نے فارمولا لاگو کیا:
حقیقت میں معنی ہے لاجسٹک ردعمل کے افعال وزن کے دیے گئے ویکٹر کے لیے
پھر کچھ بھی ہمیں نمونے کے امکان کے فنکشن کو مندرجہ ذیل لکھنے سے نہیں روکتا ہے۔
ایسا ہوتا ہے کہ بعض اوقات کچھ نئے تجزیہ کاروں کے لیے فوری طور پر یہ سمجھنا مشکل ہو جاتا ہے کہ یہ فنکشن کیسے کام کرتا ہے۔ آئیے 4 مختصر مثالیں دیکھیں جو سب کچھ صاف کر دیں گی۔
1. اگر (یعنی، تربیتی نمونے کے مطابق، اعتراض کلاس +1 سے تعلق رکھتا ہے)، اور ہمارا الگورتھم کسی چیز کو کلاس میں درجہ بندی کرنے کے امکان کا تعین کرتا ہے۔ 0.9 کے برابر، پھر نمونے کے امکانات کے اس ٹکڑے کو اس طرح شمار کیا جائے گا:
2. اگر اور ، پھر حساب اس طرح ہوگا:
3. اگر اور ، پھر حساب اس طرح ہوگا:
4. اگر اور ، پھر حساب اس طرح ہوگا:
یہ ظاہر ہے کہ امکانی تقریب کو 1 اور 3 کیسز میں یا عام صورت میں زیادہ سے زیادہ کیا جائے گا - کسی کلاس کو کسی چیز کو تفویض کرنے کے امکانات کی صحیح اندازہ شدہ اقدار کے ساتھ .
اس حقیقت کی وجہ سے کہ جب کسی کلاس کو کسی چیز کو تفویض کرنے کے امکان کا تعین کیا جائے۔ ہم صرف گتانک نہیں جانتے ، پھر ہم ان کی تلاش کریں گے۔ جیسا کہ اوپر ذکر کیا گیا ہے، یہ ایک اصلاحی مسئلہ ہے جس میں پہلے ہمیں وزن کے ویکٹر کے حوالے سے امکانی فعل کا مشتق تلاش کرنا ہوگا۔ . تاہم، پہلے اپنے لیے کام کو آسان بنانا سمجھ میں آتا ہے: ہم لوگارتھم کے مشتق کو تلاش کریں گے۔ امکانات کے افعال.
لوگارتھم کے بعد کیوں، میں لاجسٹک خرابی کے افعال، ہم نے سے نشان بدل دیا۔ پر . سب کچھ آسان ہے، چونکہ ماڈل کے معیار کو جانچنے کے مسائل میں کسی فنکشن کی قدر کو کم سے کم کرنے کا رواج ہے، ہم نے اظہار کے دائیں جانب کو اس سے ضرب کیا اور اس کے مطابق، زیادہ سے زیادہ کرنے کے بجائے، اب ہم فنکشن کو کم کرتے ہیں۔
دراصل، ابھی، آپ کی آنکھوں کے سامنے، نقصان کا فنکشن بڑی محنت سے اخذ کیا گیا تھا - لاجسٹک نقصان دو کلاسوں کے ساتھ تربیتی سیٹ کے لیے: и .
اب، عدد کو تلاش کرنے کے لیے، ہمیں صرف مشتق کو تلاش کرنے کی ضرورت ہے۔ لاجسٹک خرابی کے افعال اور پھر، عددی اصلاح کے طریقوں کا استعمال کرتے ہوئے، جیسے گریڈیئنٹ ڈیسنٹ یا سٹاکاسٹک گراڈینٹ ڈیسنٹ، سب سے زیادہ بہترین گتانک کا انتخاب کریں۔ . لیکن، مضمون کے کافی حجم کو دیکھتے ہوئے، یہ تفریق کو خود ہی انجام دینے کی تجویز ہے، یا شاید یہ اگلے مضمون کا موضوع ہو گا جس میں اس طرح کی تفصیلی مثالوں کے بغیر بہت سارے ریاضی ہوں گے۔
کیس 2. میں اشیاء کی درجہ بندی и
یہاں نقطہ نظر کلاسوں کے ساتھ ہی ہوگا۔ и ، لیکن نقصان کے فنکشن کے آؤٹ پٹ کا راستہ لاجسٹک نقصان، زیادہ آرائشی ہو جائے گا. آو شروع کریں. امکانی تقریب کے لیے ہم آپریٹر کا استعمال کریں گے۔ "پھر اگر...". یعنی اگر ویں اعتراض کا تعلق کلاس سے ہے۔ ، پھر نمونے کے امکان کا حساب لگانے کے لیے ہم احتمال کا استعمال کرتے ہیں۔ ، اگر اعتراض کا تعلق کلاس سے ہے۔ ، پھر ہم امکان میں بدل دیتے ہیں۔ . امکان کا فنکشن ایسا لگتا ہے:
آئیے اپنی انگلیوں پر بیان کرتے ہیں کہ یہ کیسے کام کرتا ہے۔ آئیے 4 معاملات پر غور کریں:
1. اگر и ، پھر نمونے لینے کا امکان "جا" جائے گا
2. اگر и ، پھر نمونے لینے کا امکان "جا" جائے گا
3. اگر и ، پھر نمونے لینے کا امکان "جا" جائے گا
4. اگر и ، پھر نمونے لینے کا امکان "جا" جائے گا
یہ واضح ہے کہ 1 اور 3 صورتوں میں، جب الگورتھم کے ذریعہ امکانات کا درست تعین کیا گیا تھا، امکان کی تقریب زیادہ سے زیادہ ہو جائے گا، یعنی، بالکل وہی ہے جو ہم حاصل کرنا چاہتے تھے۔ تاہم، یہ نقطہ نظر کافی بوجھل ہے اور اس کے بعد ہم مزید کمپیکٹ اشارے پر غور کریں گے۔ لیکن پہلے، آئیے علامت کی تبدیلی کے ساتھ امکانات کے فنکشن کو لوگارتھم کرتے ہیں، کیونکہ اب ہم اسے کم سے کم کریں گے۔
آئیے اس کے بجائے متبادل کریں۔ اظہار :
آئیے سادہ ریاضی کی تکنیک کا استعمال کرتے ہوئے لوگارتھم کے تحت صحیح اصطلاح کو آسان بنائیں اور حاصل کریں:
اب آپریٹر سے جان چھڑانے کا وقت آگیا ہے۔ "پھر اگر...". نوٹ کریں کہ جب کوئی اعتراض کلاس سے تعلق رکھتا ہے۔ ، پھر لوگارتھم کے تحت اظہار میں، ڈینومینیٹر میں، اقتدار پر اٹھایا گیا ، اگر اعتراض کا تعلق کلاس سے ہے۔ ، پھر $e$ کو طاقت میں بڑھایا جاتا ہے۔ . لہذا، دونوں صورتوں کو ایک میں ملا کر ڈگری کے لیے اشارے کو آسان بنایا جا سکتا ہے: . پھر لاجسٹک غلطی کی تقریب فارم لے گا:
لوگارتھم کے اصولوں کے مطابق، ہم کسر کو پلٹ کر نشان لگا دیتے ہیں "" (مائنس) لوگارتھم کے لیے، ہمیں ملتا ہے:
یہاں نقصان کی تقریب ہے لاجسٹک نقصان، جو کلاسوں کو تفویض کردہ اشیاء کے ساتھ تربیتی سیٹ میں استعمال کیا جاتا ہے: и .
ٹھیک ہے، اس وقت میں اپنی رخصت لیتا ہوں اور ہم مضمون کو ختم کرتے ہیں۔
معاون مواد
1. ادب
1) اپلائیڈ ریگریشن تجزیہ / N. Draper, G. Smith - 2nd ed. – ایم.: فنانس اور شماریات، 1986 (انگریزی سے ترجمہ)
2) امکان نظریہ اور ریاضی کے اعدادوشمار / V.E. Gmurman - 9th ایڈیشن. - ایم: ہائیر اسکول، 2003
3) امکان نظریہ / N.I. چرنووا - نووسیبرسک: نووسیبرسک اسٹیٹ یونیورسٹی، 2007
4) کاروباری تجزیات: ڈیٹا سے علم تک / پاکلن این بی، اوریشکوف V. I. - دوسرا ایڈیشن۔ — سینٹ پیٹرزبرگ: پیٹر، 2
5) ڈیٹا سائنس ڈیٹا سائنس شروع سے / جوئل گراس - سینٹ پیٹرزبرگ: بی ایچ وی پیٹرزبرگ، 2017
6) ڈیٹا سائنس کے ماہرین کے لیے عملی اعدادوشمار / P. Bruce, E. Bruce - St. Petersburg: BHV Petersburg، 2018
2. لیکچرز، کورسز (ویڈیو)
1)
2)
3)
4)
5)
3. انٹرنیٹ کے ذرائع
1)
2)
4)
6)
7)
8)