Cunista dib u noqoshada saadka

Cunista dib u noqoshada saadka

Maqaalkan, waxaan ku falanqeyn doonaa xisaabinta aragtida isbeddelka hawlaha dib u celinta toosan Π² Shaqada beddelka saadka ee rogan (haddii kale loo yaqaan shaqada jawaabta saadka). Kadibna, isticmaal arsenal habka ugu badan ee suurtogalka ah, iyada oo la raacayo qaabka dib-u-celinta saadka, waxaanu ka soo saareynaa shaqada luminta Khasaaraha Lojistikada, ama si kale haddii loo dhigo, waxaan ku qeexi doonaa shaqo taas oo xudunta vector miisaanka lagu doortay qaabka dib u noqoshada saadka. Cunista dib u noqoshada saadka.

dulmar maqaalka:

  1. Aynu ku celino xidhiidhka tooska ah ee ka dhexeeya laba doorsoome
  2. Aynu ogaano baahida isbeddelka hawlaha dib u celinta toosan Cunista dib u noqoshada saadka Π² shaqada jawaabta saadka Cunista dib u noqoshada saadka
  3. Aynu fulino isbeddelka iyo wax-soo-saarka shaqada jawaabta saadka
  4. Aan isku dayno inaan fahanno sababta habka labajibbaaran ee ugu yar u xun yahay marka la dooranayo cabbirrada Cunista dib u noqoshada saadka hawlaha Khasaaraha Lojistikada
  5. Waxaan isticmaalnaa habka ugu badan ee suurtogalka ah si loo go'aamiyo hawlaha doorashada parameter Cunista dib u noqoshada saadka:

    5.1. Kiiska 1: shaqada Khasaaraha Lojistikada walxaha leh magacyo fasal 0 ΠΈ 1:

    Cunista dib u noqoshada saadka

    5.2. Kiiska 2: shaqada Khasaaraha Lojistikada walxaha leh magacyo fasal -1 ΠΈ +1:

    Cunista dib u noqoshada saadka


Maqaalka waxaa ka buuxa tusaalooyin fudud oo dhammaan xisaabinta ay fududahay in afka laga sameeyo ama warqad; xaaladaha qaarkood, xisaabiyaha ayaa laga yaabaa in loo baahdo. Markaa is diyaari :)

Maqaalkani waxa ugu horayn loogu talagalay saynisyahano xogta leh heerka hore ee aqoonta aasaasiga ah ee barashada mashiinka.

Maqaalku wuxuu kaloo bixin doonaa koodka sawiridda garaafyada iyo xisaabinta. Dhammaan koodka waxay ku qoran yihiin luqadda Python 2.7. Aan horay u sii sharaxo "cusub" ee nooca la isticmaalay - tani waa mid ka mid ah shuruudaha qaadashada koorsada caanka ah Yandex madal waxbarashada onlaynka ah oo si siman loo yaqaan Coursera, iyo, sida laga yaabo in loo qaato, agabka waxaa la diyaariyey iyadoo lagu salaynayo koorsadan.

01. Ku tiirsanaanta toosan

Waa macquul in la is weydiiyo su'aasha - waa maxay ku-tiirsanaanta tooska ah iyo dib-u-celinta saadka?

Way fududahay! Dib-u-celinta Logistic waa mid ka mid ah moodooyinka ka tirsan kala-soocida toosan. Erayada fudud, hawsha kala soocida toosan waa in la saadaaliyo qiyamka la beegsanayo Cunista dib u noqoshada saadka ka doorsoomayaasha (regressors) Cunista dib u noqoshada saadka. Waxaa la rumeysan yahay in ku-tiirsanaanta u dhexeeya sifooyinka Cunista dib u noqoshada saadka iyo qiyamka la beegsanayo Cunista dib u noqoshada saadka toosan. Sidaa darteed magaca kala-soocida - toosan. Si aad u qiyaasan, qaabka dib-u-celinta saadka wuxuu ku salaysan yahay malo in uu jiro xiriir toosan oo ka dhexeeya sifooyinka Cunista dib u noqoshada saadka iyo qiyamka la beegsanayo Cunista dib u noqoshada saadka. Tani waa isku xirnaanta.

Tusaalaha ugu horreeya ayaa ku jira istuudiyaha, waana, si sax ah, oo ku saabsan ku-tiirsanaanta toosan ee qiyaasaha la baranayo. Geedi socodka diyaarinta maqaalka, waxaan la kulmay tusaale in dad badan oo hore u dhigay gees - ku tiirsanaanta hadda on danab. ("Falanqaynta dib u celinta la dabaqay", N. Draper, G. Smith). Waxaan sidoo kale eegi doonaa halkan.

Iyadoo la raacayo Sharciga Ohm:

Cunista dib u noqoshada saadkahalkaas oo Cunista dib u noqoshada saadka - xoogga hadda, Cunista dib u noqoshada saadka - danab, Cunista dib u noqoshada saadka - iska caabin.

Haddaan ogayn Sharciga Ohm, ka dib waxaan ku heli karnaa ku tiirsanaanta si macquul ah annagoo isbeddelayna Cunista dib u noqoshada saadka iyo cabbiridda Cunista dib u noqoshada saadka, iyadoo la taageerayo Cunista dib u noqoshada saadka go'an. Markaas waxaan arki lahaa in garaafka ku tiirsanaanta Cunista dib u noqoshada saadka ka Cunista dib u noqoshada saadka wuxuu bixiyaa xariiq toosan oo badan ama ka yar iyada oo loo marayo asalka. Waxaan dhahnaa "wax ka badan ama ka yar" sababtoo ah, inkastoo xiriirku dhab ahaantii sax yahay, cabbiradeena waxaa laga yaabaa inay ku jiraan khaladaad yaryar, sidaas darteed dhibcaha garaafka waxaa laga yaabaa inaysan si sax ah ugu dhicin xariiqda, laakiin waxay u kala firdhi doonaan hareeraha si aan kala sooc lahayn.

Sawirka 1 "Ku-tiirsanaanta" Cunista dib u noqoshada saadka ka Cunista dib u noqoshada saadkaΒ»

Cunista dib u noqoshada saadka

Koodhka sawir shaxeedka

import matplotlib.pyplot as plt
%matplotlib inline

import numpy as np

import random

R = 13.75

x_line = np.arange(0,220,1)
y_line = []
for i in x_line:
    y_line.append(i/R)
    
y_dot = []
for i in y_line:
    y_dot.append(i+random.uniform(-0.9,0.9))


fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(x_line,y_line,color = 'purple',lw = 3, label = 'I = U/R')
plt.scatter(x_line,y_dot,color = 'red', label = 'Actual results')
plt.xlabel('I', size = 16)
plt.ylabel('U', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

02. Baahida loo qabo in la beddelo isla'egta regression line

Bal aan eegno tusaale kale. Aynu qiyaasno in aan ka shaqayno bangi shaqadeenu waa in aan go'aamino suurtagalnimada in deyn-bixiyuhu dib u bixiyo deynta iyadoo ku xiran arrimo gaar ah. Si loo fududeeyo hawsha, waxaanu tixgelin doonaa laba arrimood oo keliya: mushaharka bilaha ee amaahiyaha iyo qaddarka dib u bixinta deynta bishiiba.

Hawshu waa shuruudo, laakiin tusaalahan waxaan ku fahmi karnaa sababta aysan ugu filneyn isticmaalka hawlaha dib u celinta toosaniyo sidoo kale ogow isbeddelada loo baahan yahay in lagu fuliyo shaqada.

Aan u soo noqono tusaalaha. Waxaa la fahamsan yahay in mushaharka sareeyo, deyn-bixiyuhu uu awoodi doono inuu u qoondeeyo bishiiba si uu u bixiyo deynta. Isla mar ahaantaana, mushahaar gaar ah oo kala duwan ayuu xidhiidhkani noqon doonaa mid toosan. Tusaale ahaan, aynu soo qaadanno mushahar u dhexeeya 60.000 RUR ilaa 200.000 RUR oo aan u qaadanno in mushaharka la cayimay, ku tiirsanaanta cabbirka bixinta bilaha ah ee cabbirka mushaharku waa toosan. Aynu sheegno in tirada mushaharka ee la cayimay ay daaha ka qaaday in saamiga mushaharka-bixinta uusan hoos uga dhici karin 3 iyo deyn-bixiyuhu waa inuu weli haysto 5.000 RUR kayd ah. Kaliya kiiskan, waxaan u qaadan doonaa in deyn bixiyuhu uu dib u bixin doono deynta bangiga. Kadibna, isla'egta regression linear ayaa qaadan doonta foomka:

Cunista dib u noqoshada saadka

halkaas oo Cunista dib u noqoshada saadka, Cunista dib u noqoshada saadka, Cunista dib u noqoshada saadka, Cunista dib u noqoshada saadka - mushahar Cunista dib u noqoshada saadkaAmaahiyaha, Cunista dib u noqoshada saadka - deyn bixinta Cunista dib u noqoshada saadkaAmaahiyaha.

Ku beddelashada mushaharka iyo bixinta amaahda oo leh cabbir go'an oo lagu beddelayo isla'egta Cunista dib u noqoshada saadka Adiga ayaa go'aansan kara inaad bixisid ama diidi lahayd deyn.

Horay u eegis, waxaan ogaanay taas, oo leh xuduudaha la bixiyay Cunista dib u noqoshada saadka shaqada dib u celinta toosan, loo isticmaalo hawlaha jawaab celinta saadka waxay soo saari doontaa qiyam weyn oo adkeyn doona xisaabinta si loo go'aamiyo suurtogalnimada dib u bixinta deynta. Sidaa darteed, waxaa la soo jeediyay in la yareeyo isku-dhafkayaga, aynu nidhaahno, 25.000 jeer. Isbeddelkan ku yimaadda isu-dheellitirka ma beddeli doono go'aanka deyn-bixinta. Aynu xusuusanno qodobkan mustaqbalka, laakiin hadda, si aan u caddayno waxa aan ka hadlayno, aan tixgelinno xaaladda saddex qof oo deyn ah.

Shaxda 1 "Dayn-qaadayaasha suurtagalka ah"

Cunista dib u noqoshada saadka

Koodhka soo saarista miiska

import pandas as pd

r = 25000.0
w_0 = -5000.0/r
w_1 = 1.0/r
w_2 = -3.0/r

data = {'The borrower':np.array(['Vasya', 'Fedya', 'Lesha']), 
        'Salary':np.array([120000,180000,210000]),
       'Payment':np.array([3000,50000,70000])}

df = pd.DataFrame(data)

df['f(w,x)'] = w_0 + df['Salary']*w_1 + df['Payment']*w_2

decision = []
for i in df['f(w,x)']:
    if i > 0:
        dec = 'Approved'
        decision.append(dec)
    else:
        dec = 'Refusal'
        decision.append(dec)
        
df['Decision'] = decision

df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision']]

Sida ku cad xogta shaxda, Vasya, oo leh mushahar 120.000 RUR, wuxuu rabaa inuu helo deyn si uu u bixiyo bishiiba 3.000 RUR. Waxaan go'aansanay in si loo ansixiyo deynta, mushaharka Vasya waa in uu ka badan yahay saddex jeer qaddarka lacag bixinta, welina waa in ay harsan tahay 5.000 RUR. Vasya ayaa buuxisay shuruudahan: Cunista dib u noqoshada saadka. Xitaa 106.000 RUR ayaa hadhay. Inkastoo xaqiiqda ah in marka la xisaabinayo Cunista dib u noqoshada saadka waanu yareynay mansabkii Cunista dib u noqoshada saadka 25.000 jeer, natiijadu waxay ahayd isku mid - deynta waa la ansixin karaa. Fedya sidoo kale wuxuu heli doonaa deyn, laakiin Lesha, inkastoo xaqiiqda ah inuu helo inta badan, waa inuu xakameeyaa rabitaankiisa.

Aan sawiro garaaf kiiskan.

Shaxda 2 "Qaybta amaah-bixiyeyaasha"

Cunista dib u noqoshada saadka

Koodhka sawirka garaafyada

salary = np.arange(60000,240000,20000)
payment = (-w_0-w_1*salary)/w_2


fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(salary, payment, color = 'grey', lw = 2, label = '$f(w,x_i)=w_0 + w_1x_{i1} + w_2x_{i2}$')
plt.plot(df[df['Decision'] == 'Approved']['Salary'], df[df['Decision'] == 'Approved']['Payment'], 
         'o', color ='green', markersize = 12, label = 'Decision - Loan approved')
plt.plot(df[df['Decision'] == 'Refusal']['Salary'], df[df['Decision'] == 'Refusal']['Payment'], 
         's', color = 'red', markersize = 12, label = 'Decision - Loan refusal')
plt.xlabel('Salary', size = 16)
plt.ylabel('Payment', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

Markaa, xariiqeena toosan, oo loo dhisay si waafaqsan shaqada Cunista dib u noqoshada saadka, ka sooca amaahyaasha "xun" iyo kuwa "wanaagsan". Deyn-bixiyeyaasha kuwaas oo rabitaankoodu aysan ku habboonayn awooddooda waxay ka sarreeyaan xariiqda (Lesha), halka kuwa, marka loo eego xuduudaha qaabkayaga, ay awoodaan inay dib u bixiyaan deynta waxay ka hooseeyaan khadka (Vasya iyo Fedya). Si kale haddii loo dhigo, waxaan dhihi karnaa sidan: xariiqayada tooska ah waxay u qaybisaa deyn-qaadayaasha laba qaybood. Aynu u tilmaamno sida soo socota: fasalka Cunista dib u noqoshada saadka Waxaan u kala saari doonaa amaah-bixiyeyaasha ee ay u badan tahay inay dib u bixiyaan deynta Cunista dib u noqoshada saadka ama Cunista dib u noqoshada saadka Waxaan ku dari doonaa amaah-bixiyeyaasha kuwaas oo ay u badan tahay inaysan awoodin inay dib u bixiyaan deynta.

Aan ku soo koobno ​​gabagabada tusaalahan fudud. Aan soo qaadano qodob Cunista dib u noqoshada saadka iyo, ku beddelashada isku-duwayaasha barta oo loo beddelo isla'egta xariiqda Cunista dib u noqoshada saadka, tixgeli saddex doorasho:

  1. Haddii barta ay ku hoos jirto xariiqda oo aan ku meeleyno fasalka Cunista dib u noqoshada saadka, ka dibna qiimaha shaqada Cunista dib u noqoshada saadka noqon doonaa mid togan ka Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka. Tani waxay ka dhigan tahay inaan u qaadan karno in suurtogalnimada dib u bixinta deynta ay ku jirto gudaha Cunista dib u noqoshada saadka. Inta uu sii weynaado qiimaha shaqadu, waa ay saraysaa suurtogalnimada.
  2. Haddii dhibic ay ka sarreyso xariiq oo aan ku meeleyno fasalka Cunista dib u noqoshada saadka ama Cunista dib u noqoshada saadka, markaa qiimaha shaqadu waxay noqon doontaa mid taban Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka. Markaa waxaan u qaadan doonaa in ixtimaalka dib u bixinta deynta ay ku jirto gudaha Cunista dib u noqoshada saadka iyo, marka ay sii weynaato qiimaha saxda ah ee shaqadu, waxay kordhinaysaa kalsoonidayada.
  3. Bartu waxay ku taal xariiq toosan, oo ku taal xadka u dhexeeya laba fasal. Xaaladdan oo kale, qiimaha shaqada Cunista dib u noqoshada saadka waa loo siman yahay Cunista dib u noqoshada saadka iyo suurtogalnimada dib u bixinta deynta waxay la mid tahay Cunista dib u noqoshada saadka.

Hadda, aynu qiyaasno in aynaan haysan laba arrimood, laakiin daraasiin, oo aan ahayn saddex, laakiin kumannaan amaah-qaadayaal ah. Markaa halkii xariiq toosan ayaan yeelan doonnaa m-cabbir diyaarad iyo isku-xirnaan Cunista dib u noqoshada saadka nalagama qaadi doono hawada khafiifka ah, laakiin waxaa laga soo qaatay dhammaan xeerarka, iyo iyadoo lagu salaynayo xogta la ururiyay ee deyn-bixiyeyaasha kuwaas oo haysta ama aan dib u bixin deynta. Run ahaantiina, ogow in aanu hadda dooranayno amaah-qaatayaasha anagoo adeegsanayna koffififyada hore loo yaqaan Cunista dib u noqoshada saadka. Dhab ahaantii, hawsha qaabka dib-u-celinta saadka ayaa si sax ah u go'aaminaya xuduudaha Cunista dib u noqoshada saadka, kaas oo qiimaha khasaaruhu ku shaqeeyo Khasaaraha Lojistikada waxay u eegi doontaa ugu yaraan. Laakiin ku saabsan sida loo xisaabiyo vector Cunista dib u noqoshada saadka, wax badan ayaan ku ogaan doonaa qaybta 5-aad ee maqaalka. Dhanka kale, waxaan ku laabaneynaa dhulkii ballanta - bangigeena iyo seddexdiisa macaamiil.

Waad ku mahadsan tahay shaqada Cunista dib u noqoshada saadka waanu ognahay cidda daynta la siin karo iyo cidda u baahan in la diido. Laakiin ma aadi kartid agaasimaha macluumaadkaas oo kale, sababtoo ah waxay rabeen inay naga helaan suurtogalnimada bixinta deynta deyn kasta. Maxaa la sameeyaa? Jawaabtu waa sahlan tahay - waxaan u baahanahay inaan si uun u bedelno shaqada Cunista dib u noqoshada saadka, kuwaas oo qiyamkoodu ay ku jiraan xadka Cunista dib u noqoshada saadka si ay u shaqeyso qiyamkiisu ay ku jiri doonaan xadka Cunista dib u noqoshada saadka. Oo shaqo noocan oo kale ah ayaa jirta, waxaa loo yaqaan Shaqada jawaabta saadka ama beddelka-logit-ka roga. La kulan:

Cunista dib u noqoshada saadka

Aynu eegno tallaabo-tallaabo sida ay u shaqeyso shaqada jawaabta saadka. Ogow in aan u socon doono dhanka ka soo horjeeda, i.e. waxaan u qaadan doonaa in aan ognahay qiimaha itimaalka, kaas oo ku yaala inta u dhaxaysa Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka ka dibna waxaanu ka "furaynaa" qiimahan oo dhan tirada kala duwan ee tirada laga bilaabo Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka.

03. Waxaan soo saarnay shaqada jawaabta saadka

Tallaabada 1. U beddel qiyamka itimaalka ilaa xad Cunista dib u noqoshada saadka

Inta lagu jiro isbeddelka shaqada Cunista dib u noqoshada saadka Π² shaqada jawaabta saadka Cunista dib u noqoshada saadka Waanu ka tagi doonaa falanqayntayada amaahda oo keliya oo aan u dalxiis ku tagno kuwa buug-sameeyaha ah. Maya, dabcan, ma dhigi doono khamaar, dhammaan waxa na xiiseynaya waxaa jira macnaha ereyga, tusaale ahaan, fursada waa 4 ilaa 1. Khatarta, oo ay yaqaanaan dhammaan betors, waa saamiga "guulaha" ilaa " guuldarrooyinka”. Marka la eego ixtimaalnimada, khayaaligu waa suurtogalnimada dhacdo dhacdo oo loo qaybiyo suurtogalnimada in aanay dhacdadani dhicin. Aynu qorno qaacidada fursadda ay dhacdo dhacdo Cunista dib u noqoshada saadka:

Cunista dib u noqoshada saadka

halkaas oo Cunista dib u noqoshada saadka - suurtogalnimada inay dhacdo dhacdo, Cunista dib u noqoshada saadka - itimaalka dhacdo AAN dhicin

Tusaale ahaan, haddii suurtogalnimada in faras yar, xoog leh oo cayaaraya oo lagu naaneeso "Veterok" uu ku garaaco haweeney da' ah oo jilicsan oo magaceeda la yiraahdo "Matilda" tartanka waxay la mid tahay. Cunista dib u noqoshada saadka, markaa fursadaha guusha "Veterok" waxay noqon doontaa Cunista dib u noqoshada saadka ΠΊ Cunista dib u noqoshada saadka Cunista dib u noqoshada saadka iyo lidka ku ah, ogaanshaha khayaaliga, ma adkaan doonto inaan xisaabino itimaalka Cunista dib u noqoshada saadka:

Cunista dib u noqoshada saadka

Sidaa darteed, waxaan baranay inaan "tarjumo" itimaalka fursadaha, taas oo ka soo qaada qiimaha Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka. Aan qaadno hal talaabo oo kale oo aan barano inaan β€œtarjumno” itimaalka xariiqda nambarka oo dhan Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka.

Tallaabada 2. U beddel qiyamka itimaalka ilaa xad Cunista dib u noqoshada saadka

Talaabadani waa mid aad u fudud - aynu u qaadano logarithm ee nasiibka saldhigga lambarka Euler Cunista dib u noqoshada saadka waxaana helnaa:

Cunista dib u noqoshada saadka

Hadda waxaan ognahay in haddii Cunista dib u noqoshada saadka, kadibna xisaabi qiimaha Cunista dib u noqoshada saadka waxay noqon doontaa mid aad u fudud, sidoo kale, waa inay noqotaa mid togan: Cunista dib u noqoshada saadka. Tani waa run.

Xiiseyn darteed, aan hubinno haddii Cunista dib u noqoshada saadka, markaas waxaan fileynaa inaan aragno qiimo xun Cunista dib u noqoshada saadka. Waxaan hubineynaa: Cunista dib u noqoshada saadka. Waa sax.

Hadda waxaan ognahay sida looga beddelo qiimaha ixtimaalka Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka dhanka khadka nambarka oo dhan laga bilaabo Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka. Talaabada xigta waxaan sameyn doonaa lidkeeda.

Hadda, waxaan ogaanay in si waafaqsan xeerarka logarithm, ogaanshaha qiimaha shaqada Cunista dib u noqoshada saadka, waxaad xisaabin kartaa kharajyada:

Cunista dib u noqoshada saadka

Habkan lagu go'aaminayo nasiibku wuxuu noo noqon doonaa mid faa'iido leh tallaabada xigta.

Tallaabada 3. Aan soo saarno qaacido si aan u go'aamino Cunista dib u noqoshada saadka

Markaa waanu baranay anagoo og Cunista dib u noqoshada saadka, Hel qiimaha shaqada Cunista dib u noqoshada saadka. Si kastaba ha ahaatee, dhab ahaantii, waxaan u baahanahay si sax ah lid ku ah - ogaanshaha qiimaha Cunista dib u noqoshada saadka hel Cunista dib u noqoshada saadka. Si taas loo sameeyo, aan u leexanno fikradda sida shaqada qallafsanaanta, sida waafaqsan:

Cunista dib u noqoshada saadka

Maqaalka kama soo saari doono qaacidada sare, laakiin waxaan ku hubin doonaa annaga oo isticmaalaya tirooyinka tusaalaha sare. Waxaynu ognahay in 4 ilaa 1Cunista dib u noqoshada saadka), itimaalka in ay dhacdo dhacdo waa 0.8 (Cunista dib u noqoshada saadka). Aynu samayno beddel: Cunista dib u noqoshada saadka. Tani waxay ku beegan tahay xisaabintayada la sameeyay hore. Aan hore u socono.

Talaabadii u danbaysay waxaynu ku soo qaadanay Cunista dib u noqoshada saadka, taas oo macnaheedu yahay waxaad samayn kartaa beddelka shaqada odd ee rogan. Waxaan helnaa:

Cunista dib u noqoshada saadka

U qaybi tirada iyo kala qaybinta labadaba Cunista dib u noqoshada saadka, Kadib:

Cunista dib u noqoshada saadka

Haddii ay dhacdo, si loo hubiyo in aynaan meelna qalad ka samayn, waxaanu samayn doonaa hal jeeg oo yar oo kale. In tallaabada 2, waxaan for Cunista dib u noqoshada saadka go'aamiyay in Cunista dib u noqoshada saadka. Kadib, beddelka qiimaha Cunista dib u noqoshada saadka galay shaqada jawaabta saadka, waxaan fileynaa inaan helno Cunista dib u noqoshada saadka. Waxaan bedelnaa oo helnaa: Cunista dib u noqoshada saadka

Hambalyo, akhristaha qaaliga ah, waxaan hadda ka soo saarnay oo tijaabinay shaqada jawaabta saadka. Aynu eegno garaafka shaqada.

Jaantuska 3 "Shaqada jawaabta saadka"

Cunista dib u noqoshada saadka

Koodhka sawirka garaafyada

import math

def logit (f):
    return 1/(1+math.exp(-f))

f = np.arange(-7,7,0.05)
p = []

for i in f:
    p.append(logit(i))

fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(f, p, color = 'grey', label = '$ 1 / (1+e^{-w^Tx_i})$')
plt.xlabel('$f(w,x_i) = w^Tx_i$', size = 16)
plt.ylabel('$p_{i+}$', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

Suugaanta waxaad sidoo kale ka heli kartaa magaca shaqadan sida shaqada sigmoid. Jaantusku wuxuu si cad u muujinayaa in isbeddelka ugu weyn ee suurtogalnimada shay ka tirsan fasalka uu ku dhaco meel aad u yar. Cunista dib u noqoshada saadka, meel ka timid Cunista dib u noqoshada saadka si ay u Cunista dib u noqoshada saadka.

Waxaan soo jeedinayaa in aan ku soo laabto falanqeeyahayaga deynta oo aan ka caawinno inuu xisaabiyo suurtogalnimada dib u bixinta deynta, haddii kale wuxuu halis u yahay in laga tago gunno la'aan :)

Shaxda 2 "Dayn-qaadayaasha suurtagalka ah"

Cunista dib u noqoshada saadka

Koodhka soo saarista miiska

proba = []
for i in df['f(w,x)']:
    proba.append(round(logit(i),2))
    
df['Probability'] = proba

df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision', 'Probability']]

Markaa, waxaanu go'aaminay suurtogalnimada dib-u-bixinta amaahda. Guud ahaan, tani waxay u muuqataa inay run tahay.

Runtii, suurtogalnimada in Vasya, oo leh mushahar 120.000 RUR, ay awoodi doonto inay siiso 3.000 RUR bangiga bishiiba waxay ku dhowdahay 100%. Jid ahaan, waa inaan fahamnaa in bangigu uu deyn karo Lesha haddii siyaasadda bangigu ay bixiso, tusaale ahaan, amaahinta macaamiisha leh suurtagalnimada dib-u-bixinta amaahda wax ka badan, dheh, 0.3. Kaliya waa in kiiskan bangigu uu abuuri doono kayd weyn oo loogu talagalay khasaaraha suurtagalka ah.

Sidoo kale waa in la ogaadaa in saamiga mushaharka-bixinta ee ugu yaraan 3 iyo margin 5.000 RUR laga soo qaaday saqafka. Sidaa darteed, waxa aan u isticmaali kari waynay vector of miisaanka qaabkeedii asalka ahaa Cunista dib u noqoshada saadka. Waxa aanu u baahnay in aanu si weyn hoos ugu dhigno isu-dheellitirka, xaaladdan waxa aanu u qaybinay mid kasta 25.000, taas oo ah, nuxur ahaan, waxaanu hagaajinay natiijada. Laakiin tan waxaa si gaar ah loo sameeyay si loo fududeeyo fahamka walxaha marxaladda hore. Nolosha, uma baahnid inaan abuurno oo hagaajino isku-xirnaanta, laakiin hel iyaga. Qaybaha soo socda ee maqaalka waxaynu ka soo qaadan doonaa isla'egyada lagu xushay halbeegyada Cunista dib u noqoshada saadka.

04. Habka ugu yar afar geesoodka ee lagu go'aamiyo vector of miisaanka Cunista dib u noqoshada saadka ee shaqada jawaabta saadka

Waxaan horeyba u naqaanay habkan xulashada vector ee miisaanka Cunista dib u noqoshada saadka, Sidee Habka afar geesoodka ugu yar (LSM) iyo dhab ahaantii, maxaynaan markaa u isticmaalin dhibaatooyinka kala-soocidda binary? Runtii, ma jiraan wax kaa diidaya inaad isticmaasho MNC, kaliya habkan ee dhibaatooyinka kala soocida ayaa bixiya natiijooyin aan sax ahayn Khasaaraha Lojistikada. Waxaa jira aasaas aragtiyeed tan. Aan marka hore eegno hal tusaale oo fudud.

Aynu ka soo qaadno in moodooyinkayada (adeegsiga MSE ΠΈ Khasaaraha Lojistikada) waxay mar hore bilaabeen xulashada vector of miisaanka Cunista dib u noqoshada saadka xisaabtiina tallaabo ayaan joojinay. Wax dhib ah ma aha in dhexda, dhamaadka ama bilowga, waxa ugu muhiimsan waa in aan hore u leenahay qaar ka mid ah qiyamka vector ee miisaanka iyo aynu u qaadan in tallaabadan, vector ee miisaanka. Cunista dib u noqoshada saadka Labada noocba ma jiraan wax farqi ah. Ka dibna qaado miisaanka ka dhashay oo ku beddel shaqada jawaabta saadka (Cunista dib u noqoshada saadka) shay gaar ah oo ka tirsan fasalka Cunista dib u noqoshada saadka. Waxaan baarnaa laba kiis marka, iyadoo la raacayo vector-ka la doortay ee miisaanka, qaabkeenu aad ayuu u qaldan yahay iyo lidka ku ah - moodelku wuxuu aad ugu kalsoon yahay in shaygu uu ka tirsan yahay fasalka. Cunista dib u noqoshada saadka. Aynu aragno ganaaxyada la soo saari doono marka la isticmaalayo MNC ΠΈ Khasaaraha Lojistikada.

Xeer si loo xisaabiyo ganaaxyada iyadoo ku xiran shaqada khasaaraha la isticmaalay

# класс ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°
y = 1
# Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ отнСсСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊ классу Π² соотвСтствии с ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ w
proba_1 = 0.01

MSE_1 = (y - proba_1)**2
print 'Π¨Ρ‚Ρ€Π°Ρ„ MSE ΠΏΡ€ΠΈ Π³Ρ€ΡƒΠ±ΠΎΠΉ ошибкС =', MSE_1

# напишСм Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ для вычислСния f(w,x) ΠΏΡ€ΠΈ извСстной вСроятности отнСсСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊ классу +1 (f(w,x)=ln(odds+))
def f_w_x(proba):
    return math.log(proba/(1-proba)) 

LogLoss_1 = math.log(1+math.exp(-y*f_w_x(proba_1)))
print 'Π¨Ρ‚Ρ€Π°Ρ„ Log Loss ΠΏΡ€ΠΈ Π³Ρ€ΡƒΠ±ΠΎΠΉ ошибкС =', LogLoss_1

proba_2 = 0.99

MSE_2 = (y - proba_2)**2
LogLoss_2 = math.log(1+math.exp(-y*f_w_x(proba_2)))

print '**************************************************************'
print 'Π¨Ρ‚Ρ€Π°Ρ„ MSE ΠΏΡ€ΠΈ сильной увСрСнности =', MSE_2
print 'Π¨Ρ‚Ρ€Π°Ρ„ Log Loss ΠΏΡ€ΠΈ сильной увСрСнности =', LogLoss_2

Kiis khalad ah - moodeelku wuxuu shay ku meeleeyaa fasalka Cunista dib u noqoshada saadka oo leh ixtimaalka 0,01

Ciqaabta isticmaalka MNC waxay noqon doontaa:
Cunista dib u noqoshada saadka

Ciqaabta isticmaalka Khasaaraha Lojistikada waxay noqon doontaa:
Cunista dib u noqoshada saadka

Xaalad kalsooni xoog leh - moodeelku wuxuu shay ku meeleeyaa fasalka Cunista dib u noqoshada saadka oo leh ixtimaalka 0,99

Ciqaabta isticmaalka MNC waxay noqon doontaa:
Cunista dib u noqoshada saadka

Ciqaabta isticmaalka Khasaaraha Lojistikada waxay noqon doontaa:
Cunista dib u noqoshada saadka

Tusaalahani waxa uu si fiican u muujinayaa in haddii uu dhaco khalad weyn ay shaqaynayso Log Loss wuxuu ciqaabayaa qaabka si ka badan MSE. Aynu hadda fahamno waxa asalka aragtida ah ee isticmaalka shaqada luminta Log Loss dhibaatooyinka kala saarista.

05. Habka ugu badan ee suurtogalka ah iyo dib u noqoshada saadka

Sidii hore loogu ballan qaaday, maqaalku wuxuu ka buuxsamay tusaalooyin fudud. Istuudiyaha waxaa ku jira tusaale kale iyo marti hore - deyn-bixiyeyaasha bangiga: Vasya, Fedya iyo Lesha.

Haddii ay dhacdo, ka hor intaanan kobcin tusaalaha, aan ku xasuusiyo in nolosha aan la tacaaleyno muunad tababar oo kumanaan ama malaayiin shay ah oo leh tobanaan ama boqolaal sifooyin. Si kastaba ha ahaatee, halkan tirooyinka ayaa la qaadayaa si ay si fudud ugu habboonaan karaan madaxa saynisyahanka xogta cusub.

Aan u soo noqono tusaalaha. Aynu qiyaasno in agaasimaha bangiga uu go'aansaday in uu bixiyo deyn qof kasta oo u baahan, inkastoo xaqiiqda ah in algorithm u sheegay in uusan u soo saarin Lesha. Haddana wakhti ku filan baa naga soo maray oo waynu ognahay saddexda halyey ee daynta bixiyey iyo kii aan bixin. Waxa la filayo: Vasya iyo Fedya ayaa dib u bixiyay amaahda, laakiin Lesha ma aysan bixin. Hadda aynu qiyaasno in natiijadani ay noqon doonto muunad tababar oo cusub oo noo ah, isla mar ahaantaana, waxay u egtahay in dhammaan xogta ku saabsan arrimaha saameynaya suurtogalnimada dib u bixinta deynta (mushaharka amaahda, cabbirka bixinta bilaha) ayaa la waayay. Kadib, si macquul ah, waxaan u qaadan karnaa in deyn bixiye kasta oo saddexaad uusan dib u bixin deynta bangiga, ama si kale haddii loo dhigo, suurtogalnimada deyn bixiyaha soo socda inuu dib u bixiyo deynta. Cunista dib u noqoshada saadka. Malahan dareen leh ayaa leh xaqiijinta aragtiyeed oo ku salaysan habka ugu badan ee suurtogalka ah, inta badan suugaanta waxaa loogu yeeraa mabda'a suurtagalnimada ugu badan.

Marka hore, aynu barano qalabka fikradeed.

Suurtagalnimada muunad waa suurtogalnimada in la helo muunad sax ah, helidda indha-indhaynta/natiijooyinka sida saxda ah, ie. badeecada suurtogalka ah ee helitaanka mid kasta oo ka mid ah natiijooyinka muunada (tusaale ahaan, haddii amaahda Vasya, Fedya iyo Lesha la bixiyay ama aan la bixin isla waqti isku mid ah).

Shaqeynta suurtagalka ah waxay la xiriirtaa suurtogalnimada muunad iyo qiyamka xuduudaha qaybinta.

Xaaladeena, muunadda tababarku waa nidaam guud oo Bernoulli ah, kaas oo doorsoomayaasha random-ku uu qaato laba qiime oo keliya: Cunista dib u noqoshada saadka ama Cunista dib u noqoshada saadka. Sidaa darteed, suurtogalnimada muunadda waxa loo qori karaa hawl suurtogal ah ee cabbirka Cunista dib u noqoshada saadka sida soo socota:

Cunista dib u noqoshada saadka
Cunista dib u noqoshada saadka

Galitaanka sare waxaa loo fasiran karaa sida soo socota. Itimaalka wadajirka ah ee Vasya iyo Fedya ay dib u bixinayaan amaahda waxay la mid tahay Cunista dib u noqoshada saadka, itimaalka in Lesha aysan dib u bixin amaahda waxay la mid tahay Cunista dib u noqoshada saadka (maaddaama aysan ahayn dib-u-bixinta deynta), sidaa darteed itimaalka wadajirka ah ee dhammaan saddexda dhacdo waa siman yihiin. Cunista dib u noqoshada saadka.

Habka suurtogalka ah ee ugu badan waa hab lagu qiyaaso halbeeg aan la garanayn iyadoo la kordhinayo hawlaha suurtagalka ah. Xaaladeena, waxaan u baahanahay inaan helno qiimahaas oo kale Cunista dib u noqoshada saadka, kaas oo Cunista dib u noqoshada saadka gaaro heerkii ugu badnaa.

Halkee ayay fikradda dhabta ahi ka timi - in la raadiyo qiimaha halbeeg aan la garanayn oo shaqada suurtagalka ahi ay gaadho ugu badnaan? Asal ahaan fikraddu waxay ka timid fikradda ah in muunadku yahay isha keliya ee aqoonta laga heli karo dadweynaha. Wax kasta oo aan ka naqaano dadweynaha waxay ku jiraan muunada. Sidaa darteed, waxa kaliya ee aan odhan karnaa waa muunadku waa ka tarjumaya ugu saxsan ee dadweynaha la heli karo. Sidaa darteed, waxaan u baahannahay inaan helno halbeeg kaas oo muunadda la heli karo ay noqoto tan ugu macquulsan.

Sida iska cad, waxaan la tacaaleynaa dhibaatada hagaajinta taas oo aan u baahanahay inaan helno meesha ugu sarreysa ee shaqada. Si aad u hesho barta ugu sarreysa, waxaa lagama maarmaan ah in la tixgeliyo shuruudaha ugu horreeya, taas oo ah, barbardhig ka-soo-saarka shaqada ilaa eber oo xalliyo isla'egta iyada oo la tixgelinayo cabbirka la rabo. Si kastaba ha noqotee, raadinta soo-saarka badeecada tiro badan oo arrimood waxay noqon kartaa hawl dheer; si taas looga fogaado, waxaa jira farsamo gaar ah - u beddelashada logarithm hawlaha suurtagalka ah. Waa maxay sababta kala-guurka noocaas ah uu suurtogal u yahay? Aynu fiiro gaar ah u yeelanno xaqiiqda ah in aynaan raadineynin xag-jirnimada shaqada lafteedaCunista dib u noqoshada saadka, iyo barta ugu weyn, taas oo ah, qiimaha qiyaasta aan la garanayn Cunista dib u noqoshada saadka, kaas oo Cunista dib u noqoshada saadka gaadho ugu badnaan Markaad u guurto logarithm, barta xag-jirku isma beddesho (inkasta oo xag-jirku laftiisu kala duwanaan doono), maadaama logarithmku yahay shaqo keli keli ah.

Aynu, si waafaqsan kuwa kor ku xusan, aan sii wadno horumarinta tusaalahayaga amaahda Vasya, Fedya iyo Lesha. Marka hore aan u gudubno logarithm ee shaqada suurtagalnimada:

Cunista dib u noqoshada saadka

Hadda waxaan si fudud u kala saari karnaa tibaaxaha Cunista dib u noqoshada saadka:

Cunista dib u noqoshada saadka

Ugu dambeyntiina, tixgeli shuruudda-dalabka koowaad - waxaan barbar dhignay soo-saarkii shaqada eber:

Cunista dib u noqoshada saadka

Markaa, qiyaastayada dareenka leh ee suurtogalnimada dib-u-bixinta deynta Cunista dib u noqoshada saadka aragti ahaan qiil ayuu ahaa.

Way fiicantahay, laakiin maxaan ku samaynaa macluumaadkan hadda? Haddii aan ka qaadno in deyn-qaade kasta oo saddexaad uusan ku soo celin lacagta bangiga, ka dibna kan dambe ayaa si lama filaan ah u kici doona. Taasi waa sax, laakiin kaliya marka la qiimeeyo suurtagalnimada dib u bixinta deynta oo la mid ah Cunista dib u noqoshada saadka Ma aanan tixgelinin arrimaha saameynaya dib u bixinta deynta: mushaharka amaahiyaha iyo xajmiga lacag bixinta bishiiba. Aynu xasuusanno in aan hore u xisaabinay suurtogalnimada dib u bixinta deynta macmiil kasta, iyada oo la tixgelinayo isla arrimahan. Waa macquul in aan helnay ixtimaalka ka duwan simanaanshaha joogtada ah Cunista dib u noqoshada saadka.

Aynu qeexno suurtagalnimada shaybaarada:

Xeerka xisaabinta suurtagalnimada muunadda

from functools import reduce

def likelihood(y,p):
    line_true_proba = []
    for i in range(len(y)):
        ltp_i = p[i]**y[i]*(1-p[i])**(1-y[i])
        line_true_proba.append(ltp_i)
    likelihood = []
    return reduce(lambda a, b: a*b, line_true_proba)
        
    
y = [1.0,1.0,0.0]
p_log_response = df['Probability']
const = 2.0/3.0
p_const = [const, const, const]


print 'ΠŸΡ€Π°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΏΡ€ΠΈ константном Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΈ p=2/3:', round(likelihood(y,p_const),3)

print '****************************************************************************************************'

print 'ΠŸΡ€Π°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΏΡ€ΠΈ расчСтном Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΈ p:', round(likelihood(y,p_log_response),3)

Tusaalaha suurtogalka ah ee qiimaha joogtada ah Cunista dib u noqoshada saadka:

Cunista dib u noqoshada saadka

Tusaalaha suurtogalka ah marka la xisaabinayo ixtimaalka dib-u-bixinta deynta iyadoo la tixgelinayo arrimaha Cunista dib u noqoshada saadka:

Cunista dib u noqoshada saadka
Cunista dib u noqoshada saadka

Suurtagalnimada muunad leh itimaalka la xisaabiyay iyadoo ku xiran arrimuhu noqdeen inay ka sarreeyaan suurtogalnimada leh qiime joogta ah. Maxay tani ka dhigan tahay? Tani waxay soo jeedinaysaa in aqoonta ku saabsan arrimaha ay suurtogalisay in si sax ah loo doorto suurtogalnimada dib u bixinta deynta macmiil kasta. Sidaa darteed, marka la bixinayo deynta soo socota, waxay noqon doontaa mid sax ah in la isticmaalo qaabka la soo jeediyay dhammaadka qaybta 3 ee qodobka si loo qiimeeyo suurtogalnimada bixinta deynta.

Laakiin markaa, haddii aan rabno in aan sare u qaadno shaqada suurtagalnimada muunad, markaa maxaad u isticmaali weyday qaar ka mid ah algorithm kuwaas oo soo saari doona itimaalka Vasya, Fedya iyo Lesha, tusaale ahaan, oo le'eg 0.99, 0.99 iyo 0.01, siday u kala horreeyaan. Waxaa laga yaabaa in algorithm-ka noocan oo kale ah uu si fiican u shaqeyn doono muunadda tababarka, maadaama ay keeni doonto qiimaha muunada ee ku dhow Cunista dib u noqoshada saadka, laakiin, marka hore, algorithm-ka noocan oo kale ah waxay u badan tahay inay ku adkaato awoodda guud, iyo marka labaad, algorithmkani hubaal ma noqon doono mid toosan. Oo haddii hababka lagula dagaallamo tabobarrada dheeraadka ah (awoodda guud ee daciifka ah) si cad looguma darin qorshaha qodobkan, ka dibna aan u gudubno qodobka labaad si faahfaahsan. Si tan loo sameeyo, kaliya ka jawaab su'aal fudud. Ma laga yaabaa in suurtogalnimada Vasya iyo Fedya ay dib u bixinayaan deynta ay isku mid noqon karaan, iyada oo la tixgelinayo arrimaha aan naqaanno? Marka laga eego aragtida macquulka ah ee dhawaaqa, dabcan ma aha, ma awoodi karto. Markaa Vasya wuxuu bixin doonaa 2.5% mushaharkiisa bishii si uu u bixiyo deynta, iyo Fedya - ku dhawaad ​​​​27,8%. Sidoo kale garaafka 2 "Client classification" waxaan aragnaa in Vasya uu aad uga fog yahay khadka kala soocaya fasallada marka loo eego Fedya. Ugu dambeyntiina, waxaan ognahay in shaqada Cunista dib u noqoshada saadka Waayo, Vasya iyo Fedya waxay qaataan qiimeyo kala duwan: 4.24 Vasya iyo 1.0 Fedya. Hadda, haddii Fedya, tusaale ahaan, uu kasbaday amar ka badan ama uu weydiistay deyn yar, markaa suurtogalnimada dib u bixinta deynta Vasya iyo Fedya waxay la mid tahay. Si kale haddii loo dhigo, ku tiirsanaanta toosan lama khiyaami karo. Oo haddaynu dhab ahaantii xisaabinay nasiibka Cunista dib u noqoshada saadka, oo kama soo bixin hawada khafiifka ah, waxaan si badbaado leh u dhihi karnaa qiyamkayaga Cunista dib u noqoshada saadka sida ugu fiican noo ogolaato in aan qiyaasno ixtimaalka dib u bixinta amaahda ee deyn bixiye kasta, laakiin tan iyo markii aan ku heshiinnay in ay u qaadan in go'aaminta coefficients. Cunista dib u noqoshada saadka waxaa loo fuliyay si waafaqsan xeerarka oo dhan, ka dibna waxaan u qaadan doonaa sidaas - coefficients our ayaa noo ogolaanaya inaan siino qiyaas wanaagsan ee itimaalka :)

Si kastaba ha ahaatee, waanu dib u dhigi karnaa. Qaybtan waxaan u baahanahay inaan fahamno sida loo go'aamiyo vector of miisaanka Cunista dib u noqoshada saadka, taas oo lagama maarmaan u ah in la qiimeeyo suurtogalnimada dib u bixinta deynta ee deyn kasta.

Aan si kooban u soo koobno ​​arsenal-ka aan raadinayno nasiibka Cunista dib u noqoshada saadka:

1. Waxaan u qaadaneynaa in xiriirka ka dhexeeya doorsoomaha bartilmaameedka (qiimaha saadaalinta) iyo qodobka saameynaya natiijada uu yahay toosan. Sababtan awgeed ayaa loo isticmaalaa shaqada dib u celinta toosan nooc Cunista dib u noqoshada saadka, khadka kaas oo u qaybiya walxaha (macaamiisha) fasallo Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka ama Cunista dib u noqoshada saadka (macmiisha awood u leh inay dib u bixiyaan deynta iyo kuwa aan haysan). Xaaladeena, isla'egta ayaa qaab leh Cunista dib u noqoshada saadka.

2. Waan isticmaalnaa shaqada logit rogan nooc Cunista dib u noqoshada saadka si loo go'aamiyo suurtogalnimada shay ka tirsan fasalka Cunista dib u noqoshada saadka.

3. Waxaan u aragnaa in tababarkayaga uu yahay dhaqan-gelin guud Nidaamyada Bernoulli, taas oo ah, shay kasta waxaa loo sameeyaa doorsoome aan toos ahayn, kaas oo leh ixtimaalka Cunista dib u noqoshada saadka (wax u gaar ah shay kasta) waxay qaadataa qiimaha 1 oo leh ixtimaalka Cunista dib u noqoshada saadka - 0.

4. Waan ognahay waxa aan u baahanahay si aan u kordhino shaqada suurtagalnimada muunad iyadoo la tixgelinayo arrimaha la aqbalay si muunadda la heli karo ay u noqoto tan ugu macquulsan. Si kale haddii loo dhigo, waxaan u baahannahay inaan dooranno cabbirrada ay muunadku noqon doonto mid macquul ah. Xaaladeena, qiyaasta la doortay ayaa ah suurtogalnimada dib u bixinta deynta Cunista dib u noqoshada saadka, taas oo iyana ku xidhan isugeyn aan la garanayn Cunista dib u noqoshada saadka. Markaa waxaan u baahanahay in aan helno vector miisaanka oo kale ah Cunista dib u noqoshada saadka, taas oo suurtogalnimada muunada ay noqon doonto ugu badnaan.

5. Waan ognahay waxa la kordhiyo shaqooyinka suurtagalka ah ee muunad waad isticmaali kartaa habka ugu badan ee suurtogalka ah. Oo waxaan ognahay dhammaan tabaha khiyaanada leh ee lagu shaqeynayo habkan.

Tani waa sida ay u noqoto dhaqdhaqaaq dhowr tallaabo ah :)

Hadda xasuuso in bilawgii maqaalka aan rabnay inaan ka soo saarno laba nooc oo shaqo lumis ah Khasaaraha Lojistikada iyadoo ku xiran sida loo qoondeeyay fasallada shayga. Waxaa dhacday in dhibaatooyinka kala-soocidda ee laba fasal, fasallada lagu tilmaamo sida Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka ama Cunista dib u noqoshada saadka. Iyada oo ku xidhan qoraalka, soo-saarku wuxuu yeelan doonaa shaqo khasaare ah oo u dhiganta.

Kiiska 1. Kala soocida walxaha Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka

Horaantii, marka la go'aaminayo suurtogalnimada muunad, taas oo suurtogalnimada dib-u-bixinta deynta ee amaahiyaha ayaa lagu xisaabiyay iyada oo lagu saleynayo arrimo iyo la siiyay iskudhafyo. Cunista dib u noqoshada saadka, waxaanu adeegsanay qaacidada:

Cunista dib u noqoshada saadka

Dhab ahaantii Cunista dib u noqoshada saadka waa macnaha hawlaha jawaab celinta saadka Cunista dib u noqoshada saadka loogu talagalay vector miisaannada la siiyay Cunista dib u noqoshada saadka

Markaa ma jiraan wax naga hor istaagaya inaan u qorno hawsha suurtagalnimada muunadda sida soo socota:

Cunista dib u noqoshada saadka

Waxay dhacdaa in mararka qaarkood ay ku adkaato qaar ka mid ah falanqeeyayaasha cusub inay isla markiiba fahmaan sida shaqadani u shaqeyso. Aynu eegno 4 tusaale oo gaagaaban oo wax walba nadiifin doona:

1. haddii Cunista dib u noqoshada saadka (tusaale ahaan, marka loo eego muunadda tababarka, shayga waxa iska leh fasalka +1), iyo algorithm-kayada Cunista dib u noqoshada saadka waxay go'aamisaa suurtogalnimada in shay loo kala saaro fasalka Cunista dib u noqoshada saadka oo le'eg 0.9, ka dibna qayb ka mid ah suurtagalnimada muunada waxaa loo xisaabin doonaa sida soo socota:

Cunista dib u noqoshada saadka

2. haddii Cunista dib u noqoshada saadkaiyo Cunista dib u noqoshada saadka, markaas xisaabtu waxay noqon doontaa sidan:

Cunista dib u noqoshada saadka

3. haddii Cunista dib u noqoshada saadkaiyo Cunista dib u noqoshada saadka, markaas xisaabtu waxay noqon doontaa sidan:

Cunista dib u noqoshada saadka

4. haddii Cunista dib u noqoshada saadkaiyo Cunista dib u noqoshada saadka, markaas xisaabtu waxay noqon doontaa sidan:

Cunista dib u noqoshada saadka

Waa wax iska cad in shaqada suurtagalka ah la kordhin doono kiisaska 1 iyo 3 ama guud ahaan - iyadoo si sax ah loo qiyaaso qiyamka suurtagalka ah in shay lagu meeleeyo fasalka. Cunista dib u noqoshada saadka.

Sababo la xiriira xaqiiqda ah in marka la go'aaminayo itimaalka u qoondaynta shay fasalka Cunista dib u noqoshada saadka Kaliya ma naqaano isku-xirnaanta Cunista dib u noqoshada saadka, markaas waanu raadin doonnaa. Sida kor ku xusan, tani waa dhibaatada hagaajinta taas oo marka hore aan u baahannahay inaan helno asalka shaqada suurtagalka ah ee ku saabsan vector ee miisaanka. Cunista dib u noqoshada saadka. Si kastaba ha ahaatee, marka hore waxay macno samaynaysaa in la fududeeyo hawsha nafteena: waxaan raadin doonaa derivative ee logarithm. hawlaha suurtagalka ah.

Cunista dib u noqoshada saadka

Waa maxay sababta logarithm ka dib, in hawlaha qalad saadka, waxaan ka bedelnay calaamadda Cunista dib u noqoshada saadka on Cunista dib u noqoshada saadka. Wax walba waa sahlan yihiin, maadaama dhibaatooyinka qiimeynta tayada model ay caado u tahay in la yareeyo qiimaha shaqada, waxaan ku dhufannay dhinaca midig ee muujinta Cunista dib u noqoshada saadka iyo si waafaqsan, halkii la kordhin lahaa, hadda waxaan yareynaa shaqada.

Dhab ahaantii, hadda, indhahaaga hortooda, shaqada lumisku waxay ahayd mid si xamaasad leh looga soo qaatay - Khasaaraha Lojistikada Tababarka oo ka kooban laba fasal: Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka.

Hadda, si loo helo isku-xireyaasha, waxaan u baahanahay oo kaliya inaan helno kala-soocida hawlaha qalad saadka ka dibna, iyadoo la adeegsanayo hababka hagaajinta nambarada, sida soo degista gradient ama stochastic gradient deescent, dooro iskubeegyada ugu wanaagsan Cunista dib u noqoshada saadka. Laakiin, marka la eego mugga weyn ee maqaalka, waxaa la soo jeediyay in la sameeyo kala duwanaansho adiga kuu gaar ah, ama laga yaabee in tani ay noqon doonto mawduuc maqaalka soo socda oo leh xisaab badan oo aan lahayn tusaalooyin faahfaahsan.

Kiiska 2. Kala soocida walxaha Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka

Habka halkan u socdaa wuxuu la mid noqon doonaa sida fasallada Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka, laakiin dariiqa laftiisa si loo soo saaro shaqada khasaaraha Khasaaraha Lojistikada, waxay noqon doontaa mid qurux badan. Aan bilowno. Shaqada suurtogalka ah waxaan u isticmaali doonaa hawlwadeenka "haddii... ka dibna...". Taasi waa, haddii Cunista dib u noqoshada saadkaShayga th waxaa iska leh fasalka Cunista dib u noqoshada saadka, ka dib si loo xisaabiyo suurtogalnimada muunada waxaan isticmaalnaa suurtogalnimada Cunista dib u noqoshada saadka, haddii shaygu uu ka tirsan yahay fasalka Cunista dib u noqoshada saadka, ka dibna waxaan ku beddeleynaa suurtagalnimada Cunista dib u noqoshada saadka. Tani waa waxa ay u egtahay shaqada suurtagalka ah:

Cunista dib u noqoshada saadka

Aan ku qeexno faraheena sida ay u shaqeyso. Aynu tixgelinno 4 xaaladood:

1. haddii Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka, markaas suurtagalnimada muunadku "tagi" Cunista dib u noqoshada saadka

2. haddii Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka, markaas suurtagalnimada muunadku "tagi" Cunista dib u noqoshada saadka

3. haddii Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka, markaas suurtagalnimada muunadku "tagi" Cunista dib u noqoshada saadka

4. haddii Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka, markaas suurtagalnimada muunadku "tagi" Cunista dib u noqoshada saadka

Way iska caddahay in kiisaska 1 iyo 3, marka suurtogalnimada si sax ah loo go'aamiyay algorithm, shaqada suurtagalka ah waa la kordhin doonaa, taasi waa, tani waa dhab ahaan waxa aan rabnay inaan helno. Si kastaba ha ahaatee, habkani waa mid aad u dhib badan, marka xigta waxaan tixgelin doonaa qoraal kooban. Laakiin marka hore, aynu ku dhejinno shaqada suurtogalka ah oo leh isbeddel calaamad, maadaama hadda aynu yaraynno.

Cunista dib u noqoshada saadka

Aan beddelno Cunista dib u noqoshada saadka muujinta Cunista dib u noqoshada saadka:

Cunista dib u noqoshada saadka

Aynu fududeyno ereyga saxda ah ee logarithm-ka iyadoo la adeegsanayo farsamooyin xisaabeed fudud oo hel:

Cunista dib u noqoshada saadka

Hadda waa waqtigii laga takhalusi lahaa hawlwadeenka "haddii... ka dibna...". Ogow marka shay Cunista dib u noqoshada saadka fasalka ayaa iska leh Cunista dib u noqoshada saadka, ka dibna odhaahda hoos timaada logarithm, ee hooseeyo, Cunista dib u noqoshada saadka kor loogu qaaday awoodda Cunista dib u noqoshada saadka, haddii shaygu uu ka tirsan yahay fasalka Cunista dib u noqoshada saadka, dabadeed $e$ ayaa kor loogu qaadayaa awoodda Cunista dib u noqoshada saadka. Sidaa darteed, tilmaanta shahaadada waxa lagu fududayn karaa in la isku geeyo labada xaaladood mid: Cunista dib u noqoshada saadka. Kadibna shaqada qalad saadka wuxuu qaadan doonaa foomka:

Cunista dib u noqoshada saadka

Sida waafaqsan xeerarka logarithm-ka, waxaan u rogi jajabka oo aan dhignaa calaamadda "Cunista dib u noqoshada saadka" (laga jaray) logarithm-ka, waxaan helnaa:

Cunista dib u noqoshada saadka

Waa kan shaqada khasaaraha luminta saadka, kaas oo loo isticmaalo habka tababarka ee walxaha loo qoondeeyey fasallada: Cunista dib u noqoshada saadka ΠΈ Cunista dib u noqoshada saadka.

Hagaag, meeshan waan ka baxay oo waxaan ku soo gabagabeynayaa maqaalkii.

Cunista dib u noqoshada saadka Shaqadii hore ee qoraagu waa "Keenida isla'egta regression toos ah qaabka matrixka"

Qalabka caawimada

1. Suugaanta

1) Falanqaynta dib u celinta la dabaqay / N. Draper, G. Smith - 2nd. – M.: Maaliyadda iyo Tirakoobka, 1986 (oo laga turjumay Ingiriis)

2) Aragtida itimaalka iyo xisaabaadka xisaabta / V.E. Gmurman - meeriska 9aad. - M.: Dugsiga Sare, 2003

3) Aragtida itimaalka / N.I. Chernova - Novosibirsk: Jaamacadda Gobolka Novosibirsk, 2007

4) Falanqaynta ganacsiga: laga bilaabo xogta ilaa aqoonta / Paklin N. B., Oreshkov V. I. - 2nd ed. - St. Petersburg: Peter, 2013

5) Xogta Sayniska Sayniska ee xoqan / Joel Gras - St. Petersburg: BHV Petersburg, 2017

6) Tirakoobka la taaban karo ee khubarada Sayniska Xogta / P. Bruce, E. Bruce - St. Petersburg: BHV Petersburg, 2018

2. Muxaadarooyin, koorsooyin (video)

1) Nuxurka habka ugu badan ee suurtogalka ah, Boris Demeshev

2) Habka ugu badan ee suurtogalka ah ee kiiska joogtada ah, Boris Demeshev

3) Dib-u-noqoshada saadka. Furo koorsada ODS, Yury Kashnitsky

4) Muxaadarada 4, Evgeny Sokolov (laga bilaabo 47 daqiiqo oo fiidiyow ah)

5) Dib-u-celinta saadka, Vyacheslav Vorontsov

3. Ilaha internetka

1) Kala soocida toosan iyo moodooyinka dib u noqoshada

2) Sida Fudud Loo Fahmi karo Dib-u-celinta Logistic

3) Shaqada khaladka saadka

4) Tijaabooyin madax-bannaan iyo caanaha Bernoulli

5) Ballad ee MMP

6) Habka suurtogalka ah ee ugu badan

7) Foomamka iyo sifooyinka logarithms

8) Waa maxay sababta tirada Cunista dib u noqoshada saadka?

9) Kalasaar toosan

Source: www.habr.com

Add a comment