Логистикалық регрессияны шайнау

Логистикалық регрессияны шайнау

Бұл мақалада біз түрлендірудің теориялық есептеулерін талдаймыз сызықтық регрессия функциялары в кері логистикалық түрлендіру функциясы (басқаша логистикалық жауап функциясы деп аталады). Содан кейін арсеналды пайдалану максималды ықтималдық әдісі, логистикалық регрессия үлгісіне сәйкес біз жоғалту функциясын аламыз Логистикалық шығын, немесе басқаша айтқанда, логистикалық регрессия үлгісінде салмақ векторының параметрлері таңдалатын функцияны анықтаймыз. Логистикалық регрессияны шайнау.

Мақаланың қысқаша мазмұны:

  1. Екі айнымалы арасындағы сызықтық байланысты қайталайық
  2. Трансформация қажеттілігін анықтайық сызықтық регрессия функциялары Логистикалық регрессияны шайнау в логистикалық жауап функциясы Логистикалық регрессияны шайнау
  3. Түрлендірулер мен шығыстарды орындайық логистикалық жауап функциясы
  4. Параметрлерді таңдау кезінде ең кіші квадраттар әдісі неге нашар екенін түсінуге тырысайық Логистикалық регрессияны шайнау функциялары Логистикалық шығын
  5. Біз қолданамыз максималды ықтималдық әдісі анықтау үшін параметрді таңдау функциялары Логистикалық регрессияны шайнау:

    5.1. 1-жағдай: функция Логистикалық шығын класс белгілері бар объектілер үшін 0 и 1:

    Логистикалық регрессияны шайнау

    5.2. 2-жағдай: функция Логистикалық шығын класс белгілері бар объектілер үшін -1 и +1:

    Логистикалық регрессияны шайнау


Мақала қарапайым мысалдармен толтырылған, онда барлық есептеулер ауызша немесе қағазда оңай жасалады, кейбір жағдайларда калькулятор қажет болуы мүмкін. Сондықтан дайындал :)

Бұл мақала негізінен машиналық оқыту негіздері бойынша бастапқы білім деңгейі бар деректер ғалымдарына арналған.

Мақалада графиктер мен есептеулер салу үшін код беріледі. Барлық код тілде жазылған питон 2.7. Қолданылған нұсқаның «жаңалығы» туралы алдын ала түсіндіруге рұқсат етіңіз - бұл белгілі курстан өту шарттарының бірі. Яндекс бірдей танымал онлайн білім беру платформасында Coursera, және, біреу болжауға болатындай, материал осы курс негізінде дайындалды.

01. Түзу сызықты тәуелділік

Сызықтық тәуелділік пен логистикалық регрессияның оған қандай қатысы бар деген сұрақ қою әбден орынды.

Бәрі оңай! Логистикалық регрессия сызықтық классификаторға жататын модельдердің бірі болып табылады. Қарапайым сөзбен айтқанда, сызықтық классификатордың міндеті мақсатты мәндерді болжау болып табылады Логистикалық регрессияны шайнау айнымалылардан (регрессорлар) Логистикалық регрессияны шайнау. Сипаттамалар арасындағы тәуелділік деп саналады Логистикалық регрессияны шайнау және мақсатты мәндер Логистикалық регрессияны шайнау сызықтық. Осыдан классификатордың атауы – сызықтық. Шамамен айтқанда, логистикалық регрессия моделі сипаттамалар арасында сызықтық байланыс бар деген болжамға негізделген. Логистикалық регрессияны шайнау және мақсатты мәндер Логистикалық регрессияны шайнау. Бұл байланыс.

Студияда бірінші мысал бар және ол дұрыс, зерттелетін шамалардың түзу сызықты тәуелділігі туралы. Мақаланы дайындау барысында мен көптеген адамдарды шеттеткен мысалға тап болдым - токтың кернеуге тәуелділігі («Қолданбалы регрессиялық талдау», Н. Дрейпер, Г. Смит). Оны да осы жерден қарастырамыз.

Сәйкес Ом заңы:

Логистикалық регрессияны шайнауқайда Логистикалық регрессияны шайнау - ток күші, Логистикалық регрессияны шайнау - Вольтаж, Логистикалық регрессияны шайнау - қарсылық.

Егер біз білмесек Ом заңы, онда біз тәуелділікті өзгерту арқылы эмпирикалық түрде таба аламыз Логистикалық регрессияны шайнау және өлшеу Логистикалық регрессияны шайнау, қолдау көрсету кезінде Логистикалық регрессияны шайнау тұрақты. Сонда біз тәуелділік графигін көретін едік Логистикалық регрессияны шайнау от Логистикалық регрессияны шайнау басы арқылы азды-көпті түзу береді. Біз «артық немесе аз» деп айтамыз, өйткені байланыс шын мәнінде дәл болғанымен, біздің өлшемдерімізде шағын қателер болуы мүмкін, сондықтан графиктегі нүктелер дәл сызыққа түспеуі мүмкін, бірақ оның айналасында кездейсоқ шашыраңқы болады.

1-график «Тәуелділік» Логистикалық регрессияны шайнау от Логистикалық регрессияны шайнау»

Логистикалық регрессияны шайнау

Диаграмма сызу коды

import matplotlib.pyplot as plt
%matplotlib inline

import numpy as np

import random

R = 13.75

x_line = np.arange(0,220,1)
y_line = []
for i in x_line:
    y_line.append(i/R)
    
y_dot = []
for i in y_line:
    y_dot.append(i+random.uniform(-0.9,0.9))


fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(x_line,y_line,color = 'purple',lw = 3, label = 'I = U/R')
plt.scatter(x_line,y_dot,color = 'red', label = 'Actual results')
plt.xlabel('I', size = 16)
plt.ylabel('U', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

02. Сызықтық регрессия теңдеуін түрлендіру қажеттілігі

Басқа мысалды қарастырайық. Біз банкте жұмыс істейміз деп елестетіп көрейік және біздің міндетіміз белгілі бір факторларға байланысты қарыз алушының несиені қайтару ықтималдығын анықтау. Тапсырманы жеңілдету үшін біз тек екі факторды қарастырамыз: қарыз алушының айлық жалақысы және ай сайынғы несиені өтеу сомасы.

Тапсырма өте шартты, бірақ бұл мысал арқылы біз оны неге пайдалану жеткіліксіз екенін түсінеміз сызықтық регрессия функциялары, сонымен қатар функциямен қандай түрлендірулерді орындау керектігін табыңыз.

Мысалға оралайық. Неғұрлым жалақы жоғары болса, соғұрлым қарыз алушы несиені өтеуге ай сайын көбірек қаражат бөле алатыны түсінікті. Сонымен қатар, белгілі бір жалақы диапазоны үшін бұл қатынас айтарлықтай сызықтық болады. Мысалы, 60.000 200.000 рубльден 3 5.000 рубльге дейінгі жалақы диапазонын алайық және көрсетілген жалақы диапазонында айлық төлем мөлшерінің жалақы мөлшеріне тәуелділігі сызықтық деп есептейік. Айлық жалақының көрсетілген диапазоны үшін жалақының төлемге қатынасы XNUMX-тен төмен түспейтіні және қарыз алушының резервінде әлі де XNUMX рубль болуы керек екендігі анықталды делік. Және тек осы жағдайда ғана қарыз алушы банкке несиені қайтарады деп есептейміз. Сонда сызықтық регрессия теңдеуі келесі формада болады:

Логистикалық регрессияны шайнау

қайда Логистикалық регрессияны шайнау, Логистикалық регрессияны шайнау, Логистикалық регрессияны шайнау, Логистикалық регрессияны шайнау - жалақы Логистикалық регрессияны шайнау- қарыз алушы, Логистикалық регрессияны шайнау - несие төлеу Логистикалық регрессияны шайнау- қарыз алушы.

Жалақы мен несие төлемін белгіленген параметрлермен теңдеуде ауыстыру Логистикалық регрессияны шайнау Несие беру немесе одан бас тарту туралы шешім қабылдауға болады.

Болашаққа қарап, біз берілген параметрлермен атап өтеміз Логистикалық регрессияны шайнау сызықтық регрессия функциясы, ішінде қолданылады логистикалық жауап беру функциялары несиені өтеу ықтималдығын анықтау үшін есептеулерді қиындататын үлкен мәндер шығарады. Сондықтан біздің коэффициенттерімізді, айталық, 25.000 мың есеге азайту ұсынылып отыр. Коэффициенттердегі бұл түрлендіру несие беру туралы шешімді өзгертпейді. Келешекте осы тармақты еске түсірейік, бірақ қазір не туралы айтып жатқанымызды нақтырақ ету үшін үш әлеуетті қарыз алушының жағдайын қарастырайық.

1-кесте «Әлеуетті қарыз алушылар»

Логистикалық регрессияны шайнау

Кестені құруға арналған код

import pandas as pd

r = 25000.0
w_0 = -5000.0/r
w_1 = 1.0/r
w_2 = -3.0/r

data = {'The borrower':np.array(['Vasya', 'Fedya', 'Lesha']), 
        'Salary':np.array([120000,180000,210000]),
       'Payment':np.array([3000,50000,70000])}

df = pd.DataFrame(data)

df['f(w,x)'] = w_0 + df['Salary']*w_1 + df['Payment']*w_2

decision = []
for i in df['f(w,x)']:
    if i > 0:
        dec = 'Approved'
        decision.append(dec)
    else:
        dec = 'Refusal'
        decision.append(dec)
        
df['Decision'] = decision

df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision']]

Кестедегі мәліметтерге сәйкес, жалақысы 120.000 3.000 рубль болатын Вася несиені ай сайын 5.000 XNUMX рубль төлей алатындай етіп алғысы келеді. Біз несиені мақұлдау үшін Васяның жалақысы төлем сомасынан үш есе асуы керек екенін және әлі де XNUMX XNUMX рубль қалуы керек екенін анықтадық. Вася бұл талапты қанағаттандырады: Логистикалық регрессияны шайнау. Тіпті 106.000 XNUMX рубль қалды. Есептеу кезінде бұған қарамастан Логистикалық регрессияны шайнау мүмкіндіктерді азайттық Логистикалық регрессияны шайнау 25.000 XNUMX рет, нәтиже бірдей болды - несиені мақұлдауға болады. Федя да несие алады, бірақ Леша ең көп алғанына қарамастан, тәбетін тежеуге мәжбүр болады.

Осы жағдайдың графигін салайық.

2-график «Заемшылардың жіктелуі»

Логистикалық регрессияны шайнау

Графикті салуға арналған код

salary = np.arange(60000,240000,20000)
payment = (-w_0-w_1*salary)/w_2


fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(salary, payment, color = 'grey', lw = 2, label = '$f(w,x_i)=w_0 + w_1x_{i1} + w_2x_{i2}$')
plt.plot(df[df['Decision'] == 'Approved']['Salary'], df[df['Decision'] == 'Approved']['Payment'], 
         'o', color ='green', markersize = 12, label = 'Decision - Loan approved')
plt.plot(df[df['Decision'] == 'Refusal']['Salary'], df[df['Decision'] == 'Refusal']['Payment'], 
         's', color = 'red', markersize = 12, label = 'Decision - Loan refusal')
plt.xlabel('Salary', size = 16)
plt.ylabel('Payment', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

Сонымен, функцияға сәйкес салынған түзу сызығымыз Логистикалық регрессияны шайнау, «жаман» қарыз алушыларды «жақсылардан» бөледі. Қалауы мүмкіндіктеріне сәйкес келмейтін қарыз алушылар сызықтан жоғары (Леша), ал біздің үлгінің параметрлері бойынша несиені өтей алатындар сызықтан төмен (Вася мен Федя). Басқаша айтқанда, біз мынаны айта аламыз: біздің тікелей желі қарыз алушыларды екі сыныпқа бөледі. Оларды былай белгілейік: сыныпқа Логистикалық регрессияны шайнау Несиені өтеу ықтималдығы жоғары қарыз алушыларды санатқа жатқызамыз Логистикалық регрессияны шайнау немесе Логистикалық регрессияны шайнау Біз несиені өтей алмайтын қарыз алушыларды қосамыз.

Осы қарапайым мысалдан қорытындыларды қорытындылайық. Бір нүктені алайық Логистикалық регрессияны шайнау және нүктенің координаталарын түзудің сәйкес теңдеуіне ауыстыру Логистикалық регрессияны шайнау, үш нұсқаны қарастырыңыз:

  1. Егер нүкте түзудің астында болса және оны сыныпқа тағайындаймыз Логистикалық регрессияны шайнау, содан кейін функцияның мәні Логистикалық регрессияны шайнау бастап оң болады Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау. Бұл несиені өтеу ықтималдығы шегінде деп болжауға болатынын білдіреді Логистикалық регрессияны шайнау. Функция мәні неғұрлым үлкен болса, ықтималдық соғұрлым жоғары болады.
  2. Егер нүкте сызықтан жоғары болса және оны сыныпқа тағайындаймыз Логистикалық регрессияны шайнау немесе Логистикалық регрессияны шайнау, онда функцияның мәні бастап теріс болады Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау. Сонда біз қарызды өтеу ықтималдығы шегінде деп есептейміз Логистикалық регрессияны шайнау және функцияның абсолютті мәні неғұрлым көп болса, соғұрлым біздің сенімділігіміз жоғары болады.
  3. Нүкте түзу сызықта, екі кластың шекарасында. Бұл жағдайда функцияның мәні Логистикалық регрессияны шайнау тең болады Логистикалық регрессияны шайнау және несиені қайтару ықтималдығы тең Логистикалық регрессияны шайнау.

Енді бізде екі емес, ондаған, үш емес, мыңдаған қарыз алушы бар деп елестетіп көрейік. Сонда түзу сызықтың орнына бізде болады м-өлшемді жазықтық және коэффициенттер Логистикалық регрессияны шайнау бізді ауадан шығармайды, бірақ барлық ережелерге сәйкес және несиені өтеген немесе өтемеген қарыз алушылар туралы жинақталған деректер негізінде алынған. Шынында да, біз қазірдің өзінде белгілі коэффициенттерді пайдаланып қарыз алушыларды таңдап жатқанымызды ескеріңіз Логистикалық регрессияны шайнау. Шын мәнінде, логистикалық регрессия моделінің міндеті дәл параметрлерді анықтау болып табылады Логистикалық регрессияны шайнау, онда жоғалту функциясының мәні Логистикалық шығын минимумға бейім болады. Бірақ вектор қалай есептелетіні туралы Логистикалық регрессияны шайнау, мақаланың 5-ші бөлімінде толығырақ білеміз. Осы арада біз уәде етілген жерге – банкирімізге және оның үш клиентіне ораламыз.

Функцияның арқасында Логистикалық регрессияны шайнау кімге несие беруге болатынын және кімге бас тарту керектігін білеміз. Бірақ сіз директорға мұндай ақпаратпен бара алмайсыз, өйткені олар бізден әрбір қарыз алушының несиені қайтару ықтималдығын алғысы келді. Не істеу? Жауап қарапайым - функцияны қандай да бір түрде түрлендіру керек Логистикалық регрессияны шайнау, мәндері диапазонда жатыр Логистикалық регрессияны шайнау мәндері ауқымда болатын функцияға Логистикалық регрессияны шайнау. Және мұндай функция бар, ол аталады логистикалық жауап функциясы немесе кері логиттік түрлендіру. Танысу:

Логистикалық регрессияны шайнау

Оның қалай жұмыс істейтінін кезең-кезеңімен көрейік логистикалық жауап функциясы. Біз қарама-қарсы бағытта жүретінімізді ескеріңіз, яғни. аралығында болатын ықтималдық мәнін білеміз деп есептейміз Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау содан кейін біз бұл мәнді бастап барлық сандар диапазонына «босатамыз». Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау.

03. Логистикалық жауап функциясын шығарамыз

1-қадам. Ықтималдық мәндерін ауқымға түрлендіру Логистикалық регрессияны шайнау

Функцияны түрлендіру кезінде Логистикалық регрессияны шайнау в логистикалық жауап функциясы Логистикалық регрессияны шайнау Біз несие талдаушымызды жалғыз қалдырамыз және оның орнына букмекерлік кеңселерді аралаймыз. Жоқ, әрине, біз бәс тікпейміз, бізді қызықтыратын нәрсе өрнектің мағынасы, мысалы, 4-тен 1-ге мүмкіндік. сәтсіздіктер». Ықтималдық терминдерінде коэффициенттер - бұл оқиғаның орын алу ықтималдығының болмайтын оқиғаның ықтималдылығына бөлінуі. Оқиғаның болу мүмкіндігінің формуласын жазайық Логистикалық регрессияны шайнау:

Логистикалық регрессияны шайнау

қайда Логистикалық регрессияны шайнау - оқиғаның болу ықтималдығы; Логистикалық регрессияны шайнау — оқиғаның орын алмау ықтималдығы

Мысалы, «Ветерок» лақап аты бар жас, күшті және ойнақы жылқының «Матильда» есімді кәрі және әлжуаз кемпірді бәйгеде ұру ықтималдығы тең болса, Логистикалық регрессияны шайнау, содан кейін «Ветероктың» табысқа жету мүмкіндігі болады Логистикалық регрессияны шайнау к Логистикалық регрессияны шайнау Логистикалық регрессияны шайнау және керісінше, коэффициенттерді біле отырып, ықтималдықты есептеу бізге қиын болмайды Логистикалық регрессияны шайнау:

Логистикалық регрессияны шайнау

Осылайша, біз ықтималдықты мәндерді алатын мүмкіндіктерге «аударуды» үйрендік Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау. Тағы бір қадам жасап, ықтималдықты бүкіл сан жолына «аударуды» үйренейік Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау.

2-қадам. Ықтималдық мәндерін ауқымға түрлендіру Логистикалық регрессияны шайнау

Бұл қадам өте қарапайым - Эйлер санының негізіне коэффициенттердің логарифмін алайық. Логистикалық регрессияны шайнау және біз аламыз:

Логистикалық регрессияны шайнау

Енді біз білеміз, егер Логистикалық регрессияны шайнау, содан кейін мәнді есептеңіз Логистикалық регрессияны шайнау өте қарапайым болады, сонымен қатар ол оң болуы керек: Логистикалық регрессияны шайнау. Дәл солай.

Қызық болғандықтан, егер болса, тексерейік Логистикалық регрессияны шайнау, содан кейін біз теріс мәнді көреміз деп күтеміз Логистикалық регрессияны шайнау. Біз тексереміз: Логистикалық регрессияны шайнау. Барлығы дұрыс.

Енді біз ықтималдық мәнін қалай түрлендіру керектігін білеміз Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау бастап бүкіл сан түзуінің бойымен Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау. Келесі қадамда біз керісінше жасаймыз.

Әзірге біз логарифм ережелеріне сәйкес функцияның мәнін біле отырып Логистикалық регрессияны шайнау, сіз коэффициенттерді есептей аласыз:

Логистикалық регрессияны шайнау

Бұл коэффициенттерді анықтау әдісі келесі қадамда бізге пайдалы болады.

3-қадам. Анықтау үшін формуланы шығарайық Логистикалық регрессияны шайнау

Осылайша біз үйрендік, білдік Логистикалық регрессияны шайнау, функция мәндерін табыңыз Логистикалық регрессияны шайнау. Дегенмен, шын мәнінде, бізге дәл керісінше қажет - құнды білу Логистикалық регрессияны шайнау табу Логистикалық регрессияны шайнау. Ол үшін кері коэффициенттер функциясы сияқты тұжырымдамаға жүгінейік, оған сәйкес:

Логистикалық регрессияны шайнау

Мақалада біз жоғарыдағы формуланы шығармаймыз, бірақ оны жоғарыдағы мысалдағы сандар арқылы тексереміз. Біз 4-ке 1 коэффициентімен (Логистикалық регрессияны шайнау), оқиғаның орын алу ықтималдығы 0.8 (Логистикалық регрессияны шайнау). Ауыстыруды жасайық: Логистикалық регрессияны шайнау. Бұл біздің бұрын жүргізген есептеулерімізбен сәйкес келеді. Әрі қарай жүрейік.

Соңғы қадамда біз мұны анықтадық Логистикалық регрессияны шайнау, яғни кері коэффициенттер функциясында ауыстыруды жасауға болады. Біз алып жатырмыз:

Логистикалық регрессияны шайнау

Алым мен бөлгіштің екеуін де бөл Логистикалық регрессияны шайнау, Содан кейін:

Логистикалық регрессияны шайнау

Кез келген жерде қателеспегенімізге көз жеткізу үшін тағы бір шағын тексеру жасайық. 2-қадамда біз үшін Логистикалық регрессияны шайнау екенін анықтады Логистикалық регрессияны шайнау. Содан кейін мәнді ауыстырыңыз Логистикалық регрессияны шайнау логистикалық жауап функциясына, біз аламыз деп күтеміз Логистикалық регрессияны шайнау. Біз ауыстырамыз және аламыз: Логистикалық регрессияны шайнау

Құттықтаймыз, құрметті оқырман, біз жаңа ғана логистикалық жауап беру функциясын шығарып, сынадық. Функцияның графигін қарастырайық.

3-график «Логистикалық жауап беру функциясы»

Логистикалық регрессияны шайнау

Графикті салуға арналған код

import math

def logit (f):
    return 1/(1+math.exp(-f))

f = np.arange(-7,7,0.05)
p = []

for i in f:
    p.append(logit(i))

fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(f, p, color = 'grey', label = '$ 1 / (1+e^{-w^Tx_i})$')
plt.xlabel('$f(w,x_i) = w^Tx_i$', size = 16)
plt.ylabel('$p_{i+}$', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

Әдебиетте бұл функцияның атын ретінде де табуға болады сигма тәрізді функция. График сыныпқа жататын объектінің ықтималдығының негізгі өзгерісі салыстырмалы түрде шағын диапазонда болатынын анық көрсетеді. Логистикалық регрессияны шайнау, бір жерден Логистикалық регрессияны шайнау қарай Логистикалық регрессияны шайнау.

Мен несиелік талдаушыға оралуды және оған несиені қайтару ықтималдығын есептеуге көмектесуді ұсынамын, әйтпесе ол бонуссыз қалу қаупі бар :)

2-кесте «Әлеуетті қарыз алушылар»

Логистикалық регрессияны шайнау

Кестені құруға арналған код

proba = []
for i in df['f(w,x)']:
    proba.append(round(logit(i),2))
    
df['Probability'] = proba

df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision', 'Probability']]

Сонымен, біз несиені қайтару ықтималдығын анықтадық. Жалпы, бұл рас сияқты.

Шынында да, жалақысы 120.000 3.000 рубль болатын Васяның банкке ай сайын 100 0.3 рубль беру ықтималдығы XNUMX% -ға жақын. Айтпақшы, егер банк саясаты, мысалы, несиені қайтару ықтималдығы, айталық, XNUMX-тен асатын клиенттерге несие беруді қарастырса, банк Лешаға несие бере алатынын түсінуіміз керек. Тек бұл жағдайда банк ықтимал шығындар үшін көбірек резерв жасайды.

Сондай-ақ, жалақының төлемге қатынасы кем дегенде 3 және 5.000 XNUMX рубль маржамен төбеден алынғанын атап өткен жөн. Сондықтан салмақтар векторын бастапқы түрінде пайдалана алмадық Логистикалық регрессияны шайнау. Бізге коэффициенттерді айтарлықтай азайту керек болды және бұл жағдайда біз әрбір коэффициентті 25.000 XNUMX-ға бөлдік, яғни мәні бойынша нәтижені түзеттік. Бірақ бұл бастапқы кезеңде материалды түсінуді жеңілдету үшін арнайы жасалды. Өмірде бізге коэффициенттерді ойлап табудың және түзетудің қажеті жоқ, бірақ оларды табу керек. Мақаланың келесі бөлімдерінде біз параметрлер таңдалатын теңдеулерді шығарамыз Логистикалық регрессияны шайнау.

04. Салмақтардың векторын анықтаудың ең кіші квадраттар әдісі Логистикалық регрессияны шайнау логистикалық жауап функциясында

Біз салмақтар векторын таңдаудың бұл әдісін бұрыннан білеміз Логистикалық регрессияны шайнау, сияқты Ең кіші квадраттар әдісі (LSM) және шын мәнінде, неге біз оны екілік жіктеу мәселелерінде қолданбаймыз? Шынында да, пайдалануға ештеңе кедергі болмайды MNC, классификациялық есептердегі осы әдіс қана дәлдігі төмен нәтижелер береді Логистикалық шығын. Мұның теориялық негізі бар. Алдымен бір қарапайым мысалды қарастырайық.

Біздің үлгілеріміз (пайдалану КМК и Логистикалық шығын) салмақтар векторын таңдай бастады Логистикалық регрессияны шайнау және біз бір қадамда есептеуді тоқтаттық. Ортасында, соңында немесе басында маңызды емес, ең бастысы, бізде салмақтар векторының кейбір мәндері бар және осы қадамда салмақ векторы деп есептейік. Логистикалық регрессияны шайнау екі модель үшін де айырмашылықтар жоқ. Содан кейін алынған салмақтарды алыңыз және оларды ауыстырыңыз логистикалық жауап функциясы (Логистикалық регрессияны шайнау) сыныпқа жататын кейбір нысан үшін Логистикалық регрессияны шайнау. Таңдалған салмақ векторына сәйкес біздің модель өте қателескен және керісінше екі жағдайды қарастырамыз - модель объектінің классқа жататынына өте сенімді. Логистикалық регрессияны шайнау. Қолданған кезде қандай айыппұлдар салынатынын көрейік MNC и Логистикалық шығын.

Пайдаланылған жоғалту функциясына байланысты айыппұлдарды есептеу үшін код

# класс объекта
y = 1
# вероятность отнесения объекта к классу в соответствии с параметрами w
proba_1 = 0.01

MSE_1 = (y - proba_1)**2
print 'Штраф MSE при грубой ошибке =', MSE_1

# напишем функцию для вычисления f(w,x) при известной вероятности отнесения объекта к классу +1 (f(w,x)=ln(odds+))
def f_w_x(proba):
    return math.log(proba/(1-proba)) 

LogLoss_1 = math.log(1+math.exp(-y*f_w_x(proba_1)))
print 'Штраф Log Loss при грубой ошибке =', LogLoss_1

proba_2 = 0.99

MSE_2 = (y - proba_2)**2
LogLoss_2 = math.log(1+math.exp(-y*f_w_x(proba_2)))

print '**************************************************************'
print 'Штраф MSE при сильной уверенности =', MSE_2
print 'Штраф Log Loss при сильной уверенности =', LogLoss_2

Қателік оқиғасы — модель сыныпқа объект тағайындайды Логистикалық регрессияны шайнау ықтималдығы 0,01

Қолдану үшін айыппұл MNC болады:
Логистикалық регрессияны шайнау

Қолдану үшін айыппұл Логистикалық шығын болады:
Логистикалық регрессияны шайнау

Мықты сенімділік оқиғасы — модель сыныпқа объект тағайындайды Логистикалық регрессияны шайнау ықтималдығы 0,99

Қолдану үшін айыппұл MNC болады:
Логистикалық регрессияны шайнау

Қолдану үшін айыппұл Логистикалық шығын болады:
Логистикалық регрессияны шайнау

Бұл мысал өрескел қате болған жағдайда жоғалту функциясын жақсы көрсетеді Log Los қарағанда модельді айтарлықтай көп жазалайды КМК. Енді жоғалту функциясын қолданудың теориялық негізі не екенін түсінейік Log Los жіктеу мәселелерінде.

05. Максималды ықтималдық әдісі және логистикалық регрессия

Басында уәде еткендей, мақала қарапайым мысалдарға толы. Студияда тағы бір мысал және ескі қонақтар бар - банк қарызгерлері: Вася, Федя және Леша.

Мысалды әзірлемес бұрын, өмірде біз ондаған немесе жүздеген ерекшеліктері бар мыңдаған немесе миллиондаған нысандардың жаттығу үлгісімен айналысатынымызды еске сала кетейін. Дегенмен, мұнда сандар жаңадан келген деректанушының басына оңай сыйып кетуі үшін алынған.

Мысалға оралайық. Алгоритм оны Лешаға бермеу керектігін айтқанына қарамастан, банк директоры мұқтаждардың бәріне несие беруге шешім қабылдады деп елестетіп көрейік. Енді міне, жеткілікті уақыт өтіп, үш батырдың қайсысы несиені қайтарып, қайсысы төлемегенін білеміз. Не күтуге болатын еді: Вася мен Федя несиені қайтарды, бірақ Леша төлеген жоқ. Енді бұл нәтиже біз үшін оқытудың жаңа үлгісі болады деп елестетіп көрейік және сонымен бірге несиені өтеу ықтималдығына әсер ететін факторлар (қарыз алушының жалақысы, ай сайынғы төлем мөлшері) туралы барлық деректер жойылып кеткендей. Сонда, интуитивті түрде, әрбір үшінші қарыз алушы банкке несиені қайтармайды деп болжауға болады, немесе басқаша айтқанда, келесі қарыз алушының несиені қайтару ықтималдығы. Логистикалық регрессияны шайнау. Бұл интуитивті болжам теориялық растауға ие және оған негізделген максималды ықтималдық әдісі, әдебиетте жиі аталады максималды ықтималдық принципі.

Алдымен концептуалды аппаратпен танысайық.

Іріктеу ықтималдығы дәл осындай үлгіні алу ықтималдығы, дәл осындай бақылауларды/нәтижелерді алу, яғни. таңдау нәтижелерінің әрқайсысын алу ықтималдығының көбейтіндісі (мысалы, Васяның, Федяның және Лешаның несиесі бір уақытта өтелді ме, әлде қайтарылмаған ба).

Ықтималдық функциясы үлгінің ықтималдығын таралу параметрлерінің мәндерімен байланыстырады.

Біздің жағдайда оқыту үлгісі жалпыланған Бернулли схемасы болып табылады, онда кездейсоқ шама тек екі мәнді қабылдайды: Логистикалық регрессияны шайнау немесе Логистикалық регрессияны шайнау. Сондықтан үлгі ықтималдығын параметрдің ықтималдық функциясы ретінде жазуға болады Логистикалық регрессияны шайнау келесідей:

Логистикалық регрессияны шайнау
Логистикалық регрессияны шайнау

Жоғарыдағы жазбаны келесідей түсіндіруге болады. Вася мен Федяның несиені қайтаруының бірлескен ықтималдығы тең Логистикалық регрессияны шайнау, Лешаның несиені ТӨЛЕМЕЙТІН ықтималдығы тең Логистикалық регрессияны шайнау (несиені өтеу орын алмағандықтан), сондықтан барлық үш оқиғаның бірлескен ықтималдығы тең Логистикалық регрессияны шайнау.

Максималды ықтималдық әдісі максимизациялау арқылы белгісіз параметрді бағалау әдісі болып табылады ықтималдық функциялары. Біздің жағдайда мұндай құндылықты табу керек Логистикалық регрессияны шайнауол кезде Логистикалық регрессияны шайнау максимумға жетеді.

Нақты идея қайдан пайда болды - ықтималдық функциясы максимумға жететін белгісіз параметрдің мәнін іздеу? Идеяның бастаулары үлгі популяция туралы бізге қолжетімді білімнің жалғыз көзі деген идеядан туындайды. Популяция туралы біз білетіндердің бәрі үлгіде ұсынылған. Сондықтан біз айта аламыз, бұл үлгі бізге қол жетімді популяцияның ең дәл көрінісі. Сондықтан қол жетімді үлгі ең ықтимал болатын параметрді табу керек.

Әлбетте, біз функцияның экстремум нүктесін табу керек болатын оңтайландыру мәселесімен айналысамыз. Экстремум нүктесін табу үшін бірінші ретті шартты қарастыру керек, яғни функцияның туындысын нөлге теңеп, қажетті параметрге қатысты теңдеуді шешу керек. Дегенмен, көптеген факторлардың туындысының туындысын іздеу ұзақ жұмыс болуы мүмкін, мұны болдырмау үшін арнайы әдіс бар - логарифмге көшу ықтималдық функциялары. Неліктен мұндай ауысу мүмкін? Біз функцияның экстремумын іздемейтінімізге назар аударайықЛогистикалық регрессияны шайнау, және экстремум нүктесі, яғни белгісіз параметрдің мәні Логистикалық регрессияны шайнауол кезде Логистикалық регрессияны шайнау максимумға жетеді. Логарифмге көшкен кезде экстремум нүктесі өзгермейді (бірақ экстремумның өзі әр түрлі болады), өйткені логарифм монотонды функция болып табылады.

Келіңіздер, жоғарыда айтылғандарға сәйкес, Вася, Федя және Лешаның несиелерімен мысалды дамытуды жалғастырайық. Алдымен келесіге көшейік ықтималдық функциясының логарифмі:

Логистикалық регрессияны шайнау

Енді біз өрнекті арқылы оңай ажырата аламыз Логистикалық регрессияны шайнау:

Логистикалық регрессияны шайнау

Соңында бірінші ретті шартты қарастырайық – функцияның туындысын нөлге теңейміз:

Логистикалық регрессияны шайнау

Осылайша, несиені өтеу ықтималдығы туралы біздің интуитивті бағалауымыз Логистикалық регрессияны шайнау теориялық тұрғыдан ақталды.

Керемет, бірақ қазір бұл ақпаратпен не істеуіміз керек? Әрбір үшінші қарыз алушы банкке ақшасын қайтармайды деп есептесек, онда соңғысы сөзсіз банкротқа ұшырайды. Бұл дұрыс, бірақ тең несиені өтеу ықтималдығын бағалау кезінде ғана Логистикалық регрессияны шайнау Біз несиені өтеуге әсер ететін факторларды ескермедік: қарыз алушының жалақысы және ай сайынғы төлем мөлшері. Осы факторларды ескере отырып, біз бұрын әрбір клиенттің несиені қайтару ықтималдығын есептегенімізді еске түсірейік. Тұрақты теңнен өзгеше ықтималдықтарды алғанымыз қисынды Логистикалық регрессияны шайнау.

Үлгілердің ықтималдығын анықтайық:

Үлгі ықтималдығын есептеу коды

from functools import reduce

def likelihood(y,p):
    line_true_proba = []
    for i in range(len(y)):
        ltp_i = p[i]**y[i]*(1-p[i])**(1-y[i])
        line_true_proba.append(ltp_i)
    likelihood = []
    return reduce(lambda a, b: a*b, line_true_proba)
        
    
y = [1.0,1.0,0.0]
p_log_response = df['Probability']
const = 2.0/3.0
p_const = [const, const, const]


print 'Правдоподобие выборки при константном значении p=2/3:', round(likelihood(y,p_const),3)

print '****************************************************************************************************'

print 'Правдоподобие выборки при расчетном значении p:', round(likelihood(y,p_log_response),3)

Тұрақты мәндегі үлгі ықтималдығы Логистикалық регрессияны шайнау:

Логистикалық регрессияны шайнау

Факторларды ескере отырып, несиені өтеу ықтималдығын есептеу кезінде ықтималдық үлгісі Логистикалық регрессияны шайнау:

Логистикалық регрессияны шайнау
Логистикалық регрессияны шайнау

Факторларға байланысты есептелген ықтималдығы бар үлгінің ықтималдығы тұрақты ықтималдық мәні бар ықтималдықтан жоғары болып шықты. Бұл нені білдіреді? Бұл факторлар туралы білім әрбір клиент үшін несиені өтеу ықтималдығын дәлірек таңдауға мүмкіндік бергенін көрсетеді. Сондықтан келесі несиені беру кезінде қарызды өтеу ықтималдығын бағалау үшін баптың 3-бөлімінің соңында ұсынылған үлгіні қолданған дұрысырақ болар еді.

Бірақ содан кейін, егер біз барынша арттырғымыз келсе үлгі ықтималдық функциясы, онда неге Вася, Федя және Леша үшін ықтималдықтарды шығаратын кейбір алгоритмді пайдаланбасқа, мысалы, сәйкесінше 0.99, 0.99 және 0.01-ге тең. Мүмкін мұндай алгоритм жаттығу үлгісінде жақсы жұмыс істейді, өйткені ол үлгі ықтималдық мәнін келесіге жақындатады. Логистикалық регрессияны шайнау, бірақ, біріншіден, мұндай алгоритмде жалпылау қабілетімен қиындықтар туындауы мүмкін, ал екіншіден, бұл алгоритм сөзсіз сызықтық болмайды. Егер осы мақаланың жоспарында шамадан тыс жаттығулармен күресу әдістері (бірдей әлсіз жалпылау қабілеті) анық болмаса, онда екінші тармақты толығырақ қарастырайық. Ол үшін қарапайым сұраққа жауап беру жеткілікті. Бізге белгілі факторларды ескере отырып, Вася мен Федяның несиені қайтару ықтималдығы бірдей болуы мүмкін бе? Дыбыстық логика тұрғысынан, әрине, жоқ, мүмкін емес. Сондықтан Вася несиені өтеу үшін айына жалақысының 2.5%, ал Федя 27,8% дерлік төлейді. Сондай-ақ «Клиенттердің классификациясы» 2-графасында біз Васяның Федяға қарағанда сыныптарды бөлетін сызықтан әлдеқайда алыс екенін көреміз. Ақырында, біз бұл функцияны білеміз Логистикалық регрессияны шайнау Вася мен Федя үшін әртүрлі мәндерді қабылдайды: Вася үшін 4.24 және Федя үшін 1.0. Енді, егер Федя, мысалы, үлкен тапсырыс алса немесе азырақ несие сұраса, Вася мен Федя үшін несиені қайтару ықтималдығы ұқсас болар еді. Басқаша айтқанда, сызықтық тәуелділікті алдауға болмайды. Ал егер біз нақты коэффициенттерді есептесек Логистикалық регрессияны шайнау, және оларды жұқа ауадан шығармасақ, біз құндылықтарымыз деп сенімді түрде айта аламыз Логистикалық регрессияны шайнау ең жақсысы әрбір қарыз алушының несиені өтеу ықтималдығын бағалауға мүмкіндік береді, бірақ біз коэффициенттерді анықтау деп болжауға келіскендіктен Логистикалық регрессияны шайнау барлық ережелерге сәйкес жүзеге асырылды, содан кейін біз солай боламыз - біздің коэффициенттер ықтималдықты жақсырақ бағалауға мүмкіндік береді :)

Дегенмен, біз шегініс жасаймыз. Бұл бөлімде салмақтар векторы қалай анықталатынын түсінуіміз керек Логистикалық регрессияны шайнау, бұл әрбір қарыз алушының несиені өтеу ықтималдығын бағалау үшін қажет.

Біз қай арсеналмен қайшылықтарды іздейтінімізді қысқаша қорытындылайық Логистикалық регрессияны шайнау:

1. Мақсатты айнымалы (болжау мәні) мен нәтижеге әсер ететін фактор арасындағы байланыс сызықтық деп есептейміз. Осы себепті ол пайдаланылады сызықтық регрессия функциясы түрлері Логистикалық регрессияны шайнау, оның сызығы объектілерді (клиенттерді) сыныптарға бөледі Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау немесе Логистикалық регрессияны шайнау (несие төлеуге мүмкіндігі бар және төлей алмайтын клиенттер). Біздің жағдайда теңдеудің формасы бар Логистикалық регрессияны шайнау.

2. Біз қолданамыз кері логит функциясы түрлері Логистикалық регрессияны шайнау сыныпқа жататын объектінің ықтималдығын анықтау Логистикалық регрессияны шайнау.

3. Біз өзіміздің оқу-жаттығу жиынымызды жалпыламаны жүзеге асыру ретінде қарастырамыз Бернулли схемалары, яғни әрбір объект үшін ықтималдығы бар кездейсоқ шама жасалады Логистикалық регрессияны шайнау (әрбір нысан үшін өзіндік) 1 мәнін және ықтималдықпен қабылдайды Логистикалық регрессияны шайнау - 0.

4. Біз нені барынша арттыру керектігін білеміз үлгі ықтималдық функциясы қабылданған факторларды ескере отырып, қол жетімді үлгі ең сенімді болуы үшін. Басқаша айтқанда, біз үлгі ең сенімді болатын параметрлерді таңдауымыз керек. Біздің жағдайда таңдалған параметр несиені өтеу ықтималдығы болып табылады Логистикалық регрессияны шайнау, бұл өз кезегінде белгісіз коэффициенттерге байланысты Логистикалық регрессияны шайнау. Сондықтан салмақтардың осындай векторын табу керек Логистикалық регрессияны шайнау, бұл кезде үлгінің ықтималдығы максималды болады.

5. Біз нені барынша арттыру керектігін білеміз үлгі ықтималдық функциялары пайдалана аласыз максималды ықтималдық әдісі. Және біз бұл әдіспен жұмыс істеудің барлық күрделі амалдарын білеміз.

Бұл көп сатылы қозғалыс болып шығады :)

Есіңізде болсын, мақаланың басында біз жоғалту функцияларының екі түрін алғымыз келді Логистикалық шығын объект кластарының қалай тағайындалғанына байланысты. Екі класты жіктеу есептерінде сыныптар ретінде белгіленетін болды Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау немесе Логистикалық регрессияны шайнау. Белгілеуге байланысты шығыс сәйкес жоғалту функциясына ие болады.

Жағдай 1. Объектілердің жіктелуі Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау

Бұрын қарыз алушының қарызды өтеу ықтималдығы факторлар мен берілген коэффициенттер негізінде есептелетін үлгінің ықтималдығын анықтау кезінде Логистикалық регрессияны шайнау, біз формуланы қолдандық:

Логистикалық регрессияны шайнау

Шындығында Логистикалық регрессияны шайнау мағынасы болып табылады логистикалық жауап беру функциялары Логистикалық регрессияны шайнау берілген салмақ векторы үшін Логистикалық регрессияны шайнау

Сонда бізге үлгі ықтималдық функциясын келесідей жазуға ештеңе кедергі келтірмейді:

Логистикалық регрессияны шайнау

Кейде кейбір жаңадан келген талдаушыларға бұл функцияның қалай жұмыс істейтінін бірден түсіну қиынға соғады. Барлығын түсіндіретін 4 қысқа мысалды қарастырайық:

1. егер Логистикалық регрессияны шайнау (яғни, оқу үлгісіне сәйкес объект +1 класына жатады) және біздің алгоритм Логистикалық регрессияны шайнау объектіні классқа жатқызу ықтималдығын анықтайды Логистикалық регрессияны шайнау 0.9 тең болса, онда үлгі ықтималдығының бұл бөлігі келесідей есептеледі:

Логистикалық регрессияны шайнау

2. егер Логистикалық регрессияны шайнаумен Логистикалық регрессияны шайнау, онда есептеу келесідей болады:

Логистикалық регрессияны шайнау

3. егер Логистикалық регрессияны шайнаумен Логистикалық регрессияны шайнау, онда есептеу келесідей болады:

Логистикалық регрессияны шайнау

4. егер Логистикалық регрессияны шайнаумен Логистикалық регрессияны шайнау, онда есептеу келесідей болады:

Логистикалық регрессияны шайнау

Ықтималдық функциясы 1 және 3 жағдайларда немесе жалпы жағдайда - объектіні сыныпқа тағайындау ықтималдығының дұрыс болжанған мәндерімен максималды болатыны анық. Логистикалық регрессияны шайнау.

Объектіні сыныпқа жатқызу ықтималдығын анықтау кезінде Логистикалық регрессияны шайнау Біз тек коэффициенттерді білмейміз Логистикалық регрессияны шайнау, содан кейін біз оларды іздейміз. Жоғарыда айтылғандай, бұл оңтайландыру мәселесі, онда алдымен салмақтар векторына қатысты ықтималдық функциясының туындысын табу керек. Логистикалық регрессияны шайнау. Дегенмен, алдымен өзімізге тапсырманы жеңілдету мағынасы бар: біз логарифмнің туындысын іздейміз. ықтималдық функциялары.

Логистикалық регрессияны шайнау

Неліктен логарифмнен кейін, в логистикалық қате функциялары, белгісін өзгерттік Логистикалық регрессияны шайнау туралы Логистикалық регрессияны шайнау. Барлығы қарапайым, өйткені модельдің сапасын бағалау мәселелерінде функцияның мәнін азайту әдеттегідей, біз өрнектің оң жағын көбейттік Логистикалық регрессияны шайнау және сәйкесінше, максимизациялаудың орнына, енді функцияны кішірейтеміз.

Шындығында, дәл қазір, сіздің көз алдыңызда жоғалту функциясы өте қиын болды - Логистикалық шығын екі класы бар жаттығулар жиынтығы үшін: Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау.

Енді коэффициенттерді табу үшін туындыны табу керек логистикалық қате функциялары содан кейін градиенттің төмендеуі немесе стохастикалық градиенттің төмендеуі сияқты сандық оңтайландыру әдістерін пайдаланып, ең оңтайлы коэффициенттерді таңдаңыз. Логистикалық регрессияны шайнау. Бірақ, мақаланың айтарлықтай көлемін ескере отырып, саралауды өз бетіңізше жүргізу ұсынылады, немесе бұл егжей-тегжейлі мысалдарсыз көптеген арифметикамен келесі мақаланың тақырыбы болуы мүмкін.

Жағдай 2. Объектілердің жіктелуі Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау

Мұндағы тәсіл сабақтармен бірдей болады Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау, бірақ жоғалту функциясының шығысына апаратын жолдың өзі Логистикалық шығын, одан да сәнді болады. Бастайық. Ықтималдық функциясы үшін біз операторды қолданамыз «Егер... онда...». Яғни, егер Логистикалық регрессияны шайнауНысан сыныпқа жатады Логистикалық регрессияны шайнау, содан кейін үлгінің ықтималдығын есептеу үшін ықтималдықты қолданамыз Логистикалық регрессияны шайнау, егер нысан сыныпқа жататын болса Логистикалық регрессияны шайнау, содан кейін ықтималдықты ауыстырамыз Логистикалық регрессияны шайнау. Ықтималдық функциясы келесідей көрінеді:

Логистикалық регрессияны шайнау

Оның қалай жұмыс істейтінін саусақтарымызбен сипаттап көрейік. 4 жағдайды қарастырайық:

1. егер Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау, содан кейін іріктеу ықтималдығы «өтеді» Логистикалық регрессияны шайнау

2. егер Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау, содан кейін іріктеу ықтималдығы «өтеді» Логистикалық регрессияны шайнау

3. егер Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау, содан кейін іріктеу ықтималдығы «өтеді» Логистикалық регрессияны шайнау

4. егер Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау, содан кейін іріктеу ықтималдығы «өтеді» Логистикалық регрессияны шайнау

1 және 3 жағдайларда ықтималдықтар алгоритммен дұрыс анықталған кезде, ықтималдық функциясы максималды болады, яғни дәл осы біздің алғымыз келген нәрсе. Дегенмен, бұл тәсіл өте қиын және келесіде біз ықшам белгілерді қарастырамыз. Бірақ алдымен таңбаның өзгеруімен ықтималдық функциясын логарифмдейміз, өйткені енді оны минимизациялаймыз.

Логистикалық регрессияны шайнау

Оның орнына ауыстырайық Логистикалық регрессияны шайнау өрнек Логистикалық регрессияны шайнау:

Логистикалық регрессияны шайнау

Қарапайым арифметикалық әдістерді қолдана отырып, логарифм астындағы дұрыс терминді жеңілдетейік және мынаны алайық:

Логистикалық регрессияны шайнау

Енді оператордан құтылатын кез келді «Егер... онда...». Назар аударыңыз, қашан объект Логистикалық регрессияны шайнау сыныпқа жатады Логистикалық регрессияны шайнау, содан кейін логарифм астындағы өрнекте, бөлгіште, Логистикалық регрессияны шайнау билікке көтерілді Логистикалық регрессияны шайнау, егер нысан сыныпқа жататын болса Логистикалық регрессияны шайнау, содан кейін $e$ қуатқа көтеріледі Логистикалық регрессияны шайнау. Сондықтан, екі жағдайды біріктіру арқылы дәреженің белгісін жеңілдетуге болады: Логистикалық регрессияны шайнау. Содан кейін логистикалық қате функциясы нысанда болады:

Логистикалық регрессияны шайнау

Логарифм ережелеріне сәйкес бөлшекті аударып, белгісін қоямыз.Логистикалық регрессияны шайнау" (минус) логарифм үшін мынаны аламыз:

Логистикалық регрессияны шайнау

Міне, жоғалту функциясы логистикалық шығын, ол сыныптарға тағайындалған объектілермен оқу жинағында қолданылады: Логистикалық регрессияны шайнау и Логистикалық регрессияны шайнау.

Міне, мен демалысымды алып, мақаланы аяқтаймыз.

Логистикалық регрессияны шайнау Автордың алдыңғы жұмысы «Сызықтық регрессия теңдеуін матрицалық түрге келтіру»

Көмекші материалдар

1. Әдебиет

1) Қолданбалы регрессиялық талдау / Н.Дрейпер, Г.Смит – 2-бас. – М.: Қаржы және статистика, 1986 (ағылшын тілінен аудармасы)

2) Ықтималдықтар теориясы және математикалық статистика / В.Е. Гмурман - 9-шы басылым. - М.: Жоғары мектеп, 2003 ж

3) Ықтималдық теориясы / Н.И. Чернова - Новосибирск: Новосибирск мемлекеттік университеті, 2007 ж

4) Бизнес-аналитика: деректерден білімге дейін / Паклин Н.Б., Орешков В.И. - 2-ші басылым. — Санкт-Петербург: Петр, 2013 ж

5) Деректер туралы ғылым нөлден бастап деректер ғылымы / Джоэль Грас - Санкт-Петербург: BHV Санкт-Петербург, 2017 ж.

6) Деректер ғылымының мамандарына арналған практикалық статистика / П. Брюс, Э. Брюс – Санкт-Петербург: BHV Petersburg, 2018 ж.

2. Дәрістер, курстар (бейне)

1) Максималды ықтималдық әдісінің мәні, Борис Демешев

2) Үздіксіз жағдайда максималды ықтималдық әдісі, Борис Демешев

3) Логистикалық регрессия. Ашық ODS курсы, Юрий Кашницкий

4) 4-дәріс, Евгений Соколов (47 минуттық бейнеден)

5) Логистикалық регрессия, Вячеслав Воронцов

3. Интернет көздері

1) Сызықтық классификация және регрессия модельдері

2) Логистикалық регрессияны қалай оңай түсінуге болады

3) Логистикалық қателік функциясы

4) Тәуелсіз сынақтар және Бернулли формуласы

5) MMP туралы баллада

6) Максималды ықтималдық әдісі

7) Логарифмдердің формулалары мен қасиеттері

8) Неліктен сан Логистикалық регрессияны шайнау?

9) Сызықтық классификатор

Ақпарат көзі: www.habr.com

пікір қалдыру