Mitsako amin'ny regression logistique

Mitsako amin'ny regression logistique

Ato amin'ity lahatsoratra ity, isika dia handinika ny teorika kajy ny fiovana asa fihemorana linear Π² Inverse logit transformation function (antsoina koa hoe fonction rΓ©ponse logistique). Avy eo, mampiasa ny arsenal fomba mety indrindra, mifanaraka amin'ny modelin'ny regression logistic, dia mahazo ny asa fatiantoka isika Fatiantoka Logistika, ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ словами, ΠΌΡ‹ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠΌ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ, с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ логистичСской рСгрСссии ΠΏΠΎΠ΄Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° вСсов Mitsako amin'ny regression logistique.

Fitsipika lahatsoratra:

  1. Andeha isika hamerina ny fifandraisana linear eo amin'ny variables roa
  2. Andeha hojerentsika ny filana fanovana asa fihemorana linear Mitsako amin'ny regression logistique Π² fiasan'ny valin'ny logistika Mitsako amin'ny regression logistique
  3. Andao hanatanteraka ny fanovana sy ny vokatra fiasan'ny valin'ny logistika
  4. Andeha hojerentsika hoe nahoana no ratsy ny fomba efamira kely indrindra rehefa mifidy paramètre Mitsako amin'ny regression logistique asa Fatiantoka Logistika
  5. Ampiasainay fomba mety indrindra mba hamaritana asa fifantenana paramètre Mitsako amin'ny regression logistique:

    5.1. Tranga 1: asa Fatiantoka Logistika ho an'ny zavatra misy fanendrena kilasy 0 ΠΈ 1:

    Mitsako amin'ny regression logistique

    5.2. Tranga 2: asa Fatiantoka Logistika ho an'ny zavatra misy fanendrena kilasy -1 ΠΈ +1:

    Mitsako amin'ny regression logistique


Ny lahatsoratra dia feno ohatra tsotra izay mora atao am-bava na an-taratasy ny kajy rehetra; amin'ny toe-javatra sasany dia mety ilaina ny kajy. Koa miomΓ na :)

Ity lahatsoratra ity dia natao indrindra ho an'ny mpahay siansa momba ny data manana fahalalana voalohany momba ny fototry ny fianarana milina.

Hanome kaody ho an'ny fanaovana sary sy kajy koa ilay lahatsoratra. Ny kaody rehetra dia voasoratra amin'ny fiteny python-2.7. MamelΓ  ahy hanazava mialoha momba ny "vaovao" amin'ny dikan-teny ampiasaina - iray amin'ireo fepetra handraisana ny taranja fanta-daza avy amin'ny Yandex amin'ny sehatra fanabeazana an-tserasera malaza ihany koa Coursera, ary, araka ny mety hiheverana azy, dia nomanina nifototra tamin’ity taranja ity ny fitaovana.

01. Fiankinan-doha mahitsy

Tena mitombina ny mametraka ny fanontaniana - inona no idiran'ny fiankinan-doha amin'ny tsipika sy ny fihemorana ara-logistika amin'izany?

Tsotra izany! Ny regression logistique dia iray amin'ireo modely izay an'ny mpanasokajy linear. Raha lazaina amin'ny teny tsotra, ny asan'ny mpanasokajy linear dia ny maminavina ny soatoavina kendrena Mitsako amin'ny regression logistique avy amin'ny variables (regressors) Mitsako amin'ny regression logistique. Misy mihevitra fa ny fiankinan-doha eo amin`ny toetra Mitsako amin'ny regression logistique ary ny soatoavina kendrena Mitsako amin'ny regression logistique linear. Noho izany ny anaran 'ny classifier - linear. Raha lazaina amin'ny teny henjana, ny maodely regression logistic dia mifototra amin'ny fiheverana fa misy fifandraisana tsipika eo amin'ireo toetra. Mitsako amin'ny regression logistique ary ny soatoavina kendrena Mitsako amin'ny regression logistique. Ity ny fifandraisana.

Misy ny ohatra voalohany ao amin'ny studio, ary izany dia, raha ny marina, momba ny fiankinan-doha amin'ny rectilinear ny habetsaky ny fianarana. Teo am-panomanana ny lahatsoratra dia nahita ohatra iray izay efa nametraka olona maro aho - ny fiankinan-doha amin'ny voltase. (β€œFamakafakana mihemotra ampiharina”, N. Draper, G. Smith). Hojerentsika eto koa.

Araka ny LalΓ na Ohm:

Mitsako amin'ny regression logistiqueizay Mitsako amin'ny regression logistique - hery ankehitriny, Mitsako amin'ny regression logistique - Zintin'aratra, Mitsako amin'ny regression logistique - fanoherana.

Raha tsy fantatsika LalΓ n'i Ohm, dia afaka mahita ny fiankinan-doha amin'ny alΓ lan'ny fanovana isika Mitsako amin'ny regression logistique ary fandrefesana Mitsako amin'ny regression logistique, raha manohana Mitsako amin'ny regression logistique raikitra. Dia ho hitantsika fa ny graph dependance Mitsako amin'ny regression logistique ΠΎΡ‚ Mitsako amin'ny regression logistique manome tsipika mahitsy kokoa na latsaka amin'ny fiaviana. Miteny izahay hoe "mihoatra na latsaka" satria, na dia marina aza ny fifandraisana, dia mety misy lesoka kely ny fandrefesanay, ary noho izany dia mety tsy hianjera amin'ny tsipika marina ny teboka eo amin'ny grafika, fa hiparitaka manodidina azy kisendrasendra.

Grapika 1 β€œFiankinan-doha” Mitsako amin'ny regression logistique ΠΎΡ‚ Mitsako amin'ny regression logistiqueΒ»

Mitsako amin'ny regression logistique

Kaody fanaovana tabilao

import matplotlib.pyplot as plt
%matplotlib inline

import numpy as np

import random

R = 13.75

x_line = np.arange(0,220,1)
y_line = []
for i in x_line:
    y_line.append(i/R)
    
y_dot = []
for i in y_line:
    y_dot.append(i+random.uniform(-0.9,0.9))


fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(x_line,y_line,color = 'purple',lw = 3, label = 'I = U/R')
plt.scatter(x_line,y_dot,color = 'red', label = 'Actual results')
plt.xlabel('I', size = 16)
plt.ylabel('U', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

02. Ny filΓ na hanovana ny equation linear regression

Andeha isika hijery ohatra iray hafa. Alao sary an-tsaina hoe miasa any amin'ny banky isika ary ny andraikitray dia ny mamaritra ny mety ho an'ny mpindram-bola handoavana ny fampindramam-bola miankina amin'ny lafin-javatra sasany. Mba hanatsorana ny asa, dia tsy hojerentsika afa-tsy lafin-javatra roa: ny karaman'ny mpindram-bola isam-bolana sy ny vola aloa isam-bolana.

Ny asa dia tena misy fepetra, saingy amin'ity ohatra ity dia azontsika atao ny mahatakatra ny antony tsy ampy ny fampiasana azy asa fihemorana linear, ary fantaro ihany koa ny fanovana tokony hatao amin'ny asa.

Andao hiverina amin'ny ohatra. Araka ny fantatra dia arakaraky ny avoakan’ny karama no ahafahan’ny mpindram-bola hanokana isam-bolana hamerenana ny trosa. Amin'izay fotoana izay ihany koa, ho an'ny karama sasany, ity fifandraisana ity dia ho tsipika. Ohatra, andeha isika haka ny karama isan-karazany avy amin'ny 60.000 RUR ka hatramin'ny 200.000 RUR ary heverina fa amin'ny karama voafaritra, ny fiankinan-doha amin'ny haben'ny fandoavam-bola isam-bolana amin'ny haben'ny karama dia linear. Andeha hatao hoe ho an'ny karama voafaritra dia nambara fa ny tahan'ny karama amin'ny fandoavam-bola dia tsy azo latsaka ambanin'ny 3 ary ny mpindram-bola dia tsy maintsy manana tahiry 5.000 RUR. Ary amin'ity tranga ity ihany, dia hihevitra isika fa ny mpampindram-bola dia hamerina ny trosa amin'ny banky. Avy eo, ny equation linear regression dia haka ny endrika:

Mitsako amin'ny regression logistique

izay Mitsako amin'ny regression logistique, Mitsako amin'ny regression logistique, Mitsako amin'ny regression logistique, Mitsako amin'ny regression logistique - karama Mitsako amin'ny regression logistique- ny mpampindram-bola, Mitsako amin'ny regression logistique - fandoavam-bola Mitsako amin'ny regression logistique- ny mpindram-bola.

Fanoloana ny karama sy ny fandoavana ny fampindramam-bola miaraka amin'ny masontsivana raikitra ao amin'ny equation Mitsako amin'ny regression logistique Afaka manapa-kevitra ianao na hamoaka na handΓ  fampindramam-bola.

Raha mijery ny ho avy isika dia manamarika fa, miaraka amin'ireo masontsivana nomena Mitsako amin'ny regression logistique asa fihemorana linear, ampiasaina amin'ny asa famaliana logistika dia hamokatra sanda lehibe izay hanasarotra ny kajy mba hamaritana ny mety hisian'ny famerenam-bola. Noho izany, soso-kevitra ny hampihenana ny coefficient antsika, andao atao hoe, in-25.000. Tsy hanova ny fanapahan-kevitra hamoaka findramam-bola izany fiovana eo amin’ny coefficient izany. Andeha hotsaroantsika amin'ny ho avy io teboka io, fa ankehitriny, mba hampahazava kokoa ny zavatra resahina, andeha hodinihintsika ny toe-javatra misy mpindram-bola telo.

Tabilao 1 β€œNy mety ho mpampindram-bola”

Mitsako amin'ny regression logistique

Code amin'ny famoronana latabatra

import pandas as pd

r = 25000.0
w_0 = -5000.0/r
w_1 = 1.0/r
w_2 = -3.0/r

data = {'The borrower':np.array(['Vasya', 'Fedya', 'Lesha']), 
        'Salary':np.array([120000,180000,210000]),
       'Payment':np.array([3000,50000,70000])}

df = pd.DataFrame(data)

df['f(w,x)'] = w_0 + df['Salary']*w_1 + df['Payment']*w_2

decision = []
for i in df['f(w,x)']:
    if i > 0:
        dec = 'Approved'
        decision.append(dec)
    else:
        dec = 'Refusal'
        decision.append(dec)
        
df['Decision'] = decision

df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision']]

Araka ny angon-drakitra ao amin'ny latabatra, Vasya, manana karama 120.000 RUR, dia te-hahazo fampindramam-bola mba hahafahany mamerina izany isam-bolana amin'ny 3.000 RUR. Nanapa-kevitra izahay fa mba hankatoavana ny fampindramam-bola, ny karaman'i Vasya dia tsy maintsy mihoatra ny avo telo heny noho ny vola aloa, ary tsy maintsy misy RUR 5.000 sisa. Mahafeno ity fepetra ity i Vasya: Mitsako amin'ny regression logistique. Na dia 106.000 RUR aza no tavela. Na dia eo aza ny zava-misy fa rehefa manao kajy Mitsako amin'ny regression logistique nahenanay ny mety Mitsako amin'ny regression logistique In-25.000, mitovy ny vokatra - azo ekena ny fampindramam-bola. Hahazo fampindramam-bola ihany koa i Fedya, fa i Lesha, na dia mahazo betsaka aza, dia tsy maintsy manetry tena ny filany.

Andao hanao sary ho an'ity tranga ity.

Tabilao 2 β€œ Fanasokajiana ny mpindram-bola”

Mitsako amin'ny regression logistique

Kaody ho an'ny fanaovana ny grafika

salary = np.arange(60000,240000,20000)
payment = (-w_0-w_1*salary)/w_2


fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(salary, payment, color = 'grey', lw = 2, label = '$f(w,x_i)=w_0 + w_1x_{i1} + w_2x_{i2}$')
plt.plot(df[df['Decision'] == 'Approved']['Salary'], df[df['Decision'] == 'Approved']['Payment'], 
         'o', color ='green', markersize = 12, label = 'Decision - Loan approved')
plt.plot(df[df['Decision'] == 'Refusal']['Salary'], df[df['Decision'] == 'Refusal']['Payment'], 
         's', color = 'red', markersize = 12, label = 'Decision - Loan refusal')
plt.xlabel('Salary', size = 16)
plt.ylabel('Payment', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

Noho izany, ny tsipika mahitsy, naorina araka ny asa Mitsako amin'ny regression logistique, manasaraka ny mpindrana β€œratsy” sy ny β€œtsara”. Ireo mpindram-bola izay tsy mifanaraka amin'ny fahaizany dia mihoatra ny tsipika (Lesha), fa ireo izay, araka ny mari-pamantarana amin'ny modely, dia afaka mamerina ny trosa dia eo ambanin'ny tsipika (Vasya sy Fedya). Raha lazaina amin'ny teny hafa dia izao no azontsika lazaina: ny tsipika mivantana dia mizara roa ny mpindram-bola. Andeha hojerentsika toy izao manaraka izao izy ireo: any am-pianarana Mitsako amin'ny regression logistique Hosokajinay ireo mpindram-bola izay mety hamerina ny findramam-bola ho Mitsako amin'ny regression logistique na Mitsako amin'ny regression logistique Ampidirinay ireo mpindram-bola izay azo inoana fa tsy afaka mamerina ny trosa.

Andeha isika hamintina ny fanatsoahan-kevitra avy amin’io ohatra tsotra io. Andeha isika haka hevitra Mitsako amin'ny regression logistique ary, manolo ny fandrindrana ny teboka amin'ny fampitoviana mifanaraka amin'ny tsipika Mitsako amin'ny regression logistique, diniho ny safidy telo:

  1. Raha eo ambanin'ny tsipika ilay teboka ary omenay ny kilasy Mitsako amin'ny regression logistique, avy eo ny sandan'ny asa Mitsako amin'ny regression logistique dia ho tsara avy amin'ny Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique. Midika izany fa afaka mihevitra isika fa ny mety ho famerenana ny trosa dia ao anatiny Mitsako amin'ny regression logistique. Arakaraky ny lehibe kokoa ny sandan'ny asa no ambony kokoa ny mety.
  2. Raha misy teboka eo ambonin'ny tsipika iray ary omenay ny kilasy Mitsako amin'ny regression logistique na Mitsako amin'ny regression logistique, dia ho ratsy ny sandan'ny asa Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique. Avy eo dia hoheverintsika fa ao anatin'izany ny mety hisian'ny famerenam-bola Mitsako amin'ny regression logistique ary, arakaraky ny lehibe kokoa ny hasarobidin'ny asa no ambony kokoa ny fahatokisantsika.
  3. Ny teboka dia eo amin'ny tsipika mahitsy, eo amin'ny sisin-tany eo anelanelan'ny kilasy roa. Amin'ity tranga ity, ny sandan'ny asa Mitsako amin'ny regression logistique dia hitovy Mitsako amin'ny regression logistique ary ny mety handoavana ny trosa dia mitovy amin'ny Mitsako amin'ny regression logistique.

Ankehitriny, andeha hojerentsika fa tsy manana antony roa isika, fa am-polony, ary tsy telo, fa mpindram-bola an'arivony. Dia ho solon'ny tsipika mahitsy no hananantsika m-dimensional fiaramanidina sy coefficients Mitsako amin'ny regression logistique tsy hoesorina amin'ny rivotra manify izahay, fa azo avy amin'ny fitsipika rehetra, ary mifototra amin'ny angon-drakitra voaangona amin'ny mpindram-bola izay manana na tsy namerina ny trosa. Eny tokoa, mariho fa mifidy mpindram-bola mampiasa coefficient efa fantatra isika izao Mitsako amin'ny regression logistique. Raha ny marina, ny andraikitry ny modelim-pandrefesana lozisialy dia ny mamaritra ny mari-pamantarana Mitsako amin'ny regression logistique, izay ny sandan'ny asa fatiantoka Fatiantoka Logistika dia hirona amin'ny kely indrindra. Fa ny fomba kajy ny vector Mitsako amin'ny regression logistique, ho hitantsika bebe kokoa ao amin’ny fizarana faha-5 amin’ilay lahatsoratra. Mandra-pahatongan'izany dia miverina any amin'ny tany nampanantenaina isika - amin'ny banky sy ny mpanjifany telo.

Misaotra ny asa Mitsako amin'ny regression logistique fantatray hoe iza no azo omena findramam-bola ary iza no mila lavina. Saingy tsy afaka mankany amin'ny tale miaraka amin'ny fampahalalana toy izany ianao, satria te-hahazo avy aminay ny mety ho famerenan'ny mpampindram-bola tsirairay. Ny hatao? Tsotra ny valiny - mila manova ny fiasa isika Mitsako amin'ny regression logistique, izay misy ny sandany eo amin'ny salan'isa Mitsako amin'ny regression logistique amin'ny asa iray izay ny sandany dia mitoetra ao anatin'ny salan'isa Mitsako amin'ny regression logistique. Ary misy ny asa toy izany, antsoina hoe fiasan'ny valim-panontaniana ara-logistika na fanovana inverse-logit. Mivory:

Mitsako amin'ny regression logistique

Andeha hojerentsika ny fomba fiasa fiasan'ny valin'ny logistika. Mariho fa handeha amin'ny lalana mifanohitra isika, i.e. isika dia hihevitra fa fantatsika ny sanda mety, izay mitoetra ao amin'ny isan-karazany avy Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique ary avy eo dia "hanala" io sanda io amin'ny isa manontolo avy amin'ny Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique.

03. Nahazo ny asa valin'ny logistika izahay

Dingana 1. Hanova ny sanda mety ho isan-karazany Mitsako amin'ny regression logistique

Nandritra ny fanovana ny asa Mitsako amin'ny regression logistique Π² fiasan'ny valin'ny logistika Mitsako amin'ny regression logistique Avelantsika irery ny mpanadihady momba ny crΓ©dit fa handeha hitsidika ireo mpikirakira boky. Tsia, mazava ho azy, tsy hametraka filokana isika, izay rehetra mahaliana antsika dia ny dikan'ny teny, ohatra, ny vintana dia 4 noho 1. Ny vintana, mahazatra ny mpiloka rehetra, dia ny tahan'ny "fahombiazana" amin'ny " tsy fahombiazana”. Amin'ny teny mety, ny odds dia ny mety hitrangan'ny hetsika iray mizarazara amin'ny mety ho tsy hitranga. Andeha hosoratana ny raikipohy momba ny mety hisian'ny hetsika iray Mitsako amin'ny regression logistique:

Mitsako amin'ny regression logistique

izay Mitsako amin'ny regression logistique - ny mety hisian'ny hetsika iray, Mitsako amin'ny regression logistique - ny mety hisian'ny hetsika TSY nitranga

Ohatra, raha mitovy amin'ny hazakazaka ny mety hisian'ny soavaly tanora sy matanjaka ary milalao miaraka amin'ny anaram-bositra hoe "Veterok" handresy vehivavy antitra sy manjavozavo antsoina hoe "Matilda". Mitsako amin'ny regression logistique, dia ny mety ho fahombiazana ho an'ny "Veterok". Mitsako amin'ny regression logistique ΠΊ Mitsako amin'ny regression logistique Mitsako amin'ny regression logistique ary ny mifamadika amin'izany, ny fahafantarana ny mety, dia tsy ho sarotra amintsika ny kajy ny mety Mitsako amin'ny regression logistique:

Mitsako amin'ny regression logistique

Noho izany, nianatra ny "nandika" ny mety ho vintana isika, izay maka ny soatoavina Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique. Andeha isika hanao dingana iray indray ary hianatra ny "mandika" ny mety ho amin'ny tsipika isa manontolo avy Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique.

Dingana 2. Hanova ny sanda mety ho isan-karazany Mitsako amin'ny regression logistique

Tena tsotra ity dingana ity - andao horaisina ny logaritma amin'ny fifanoherana mankany amin'ny fototry ny laharan'i Euler Mitsako amin'ny regression logistique ary mahazo izahay:

Mitsako amin'ny regression logistique

Fantatsika izao fa raha Mitsako amin'ny regression logistique, dia kajy ny sandany Mitsako amin'ny regression logistique dia ho tena tsotra ary, ankoatra izany, dia tokony ho tsara: Mitsako amin'ny regression logistique. Marina izany.

Noho ny fahalianana dia andeha hojerentsika hoe ahoana raha Mitsako amin'ny regression logistique, dia manantena ny hahita sanda ratsy isika Mitsako amin'ny regression logistique. Manamarina izahay: Mitsako amin'ny regression logistique. Marina izany.

Ankehitriny dia fantatsika ny fomba hamadihana ny sanda mety ho avy Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique miaraka amin'ny tsipika isa manontolo avy amin'ny Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique. Amin'ny dingana manaraka dia hanao ny mifanohitra amin'izany isika.

Amin'izao fotoana izao, dia manamarika fa mifanaraka amin'ny fitsipiky ny logarithm, mahafantatra ny lanjan'ny asa Mitsako amin'ny regression logistique, azonao atao ny manao kajy ny vintana:

Mitsako amin'ny regression logistique

Ity fomba hamaritana ny vintana ity dia hahasoa antsika amin'ny dingana manaraka.

Dingana 3. Andeha isika haka ny formula mba hamaritana Mitsako amin'ny regression logistique

Noho izany dia nianatra izahay, nahafantatra Mitsako amin'ny regression logistique, tadiavo ny sandan'ny asa Mitsako amin'ny regression logistique. Na izany aza, raha ny marina, mila ny mifanohitra amin'izany - ny fahafantarana ny sandany Mitsako amin'ny regression logistique mahita Mitsako amin'ny regression logistique. Mba hanaovana izany, andeha isika hitodika any amin'ny foto-kevitra toy ny inverse odds miasa, araka izay:

Mitsako amin'ny regression logistique

Ao amin'ny lahatsoratra dia tsy haka ny formula ambony isika, fa hojerentsika izany amin'ny fampiasana ny isa avy amin'ny ohatra etsy ambony. Fantatsika fa miaraka amin'ny odds 4 noho 1 (Mitsako amin'ny regression logistique), ny mety hisian'ny hetsika dia 0.8 (Mitsako amin'ny regression logistique). Andao hanao fanoloana: Mitsako amin'ny regression logistique. Mifanojo amin’ny kajikajy nataontsika teo aloha izany. Andao handroso.

Tamin'ny dingana farany dia nanatsoaka hevitra izahay Mitsako amin'ny regression logistique, izay midika fa afaka manao fanoloana ianao amin'ny fiasa inverse odds. Mahazo izahay:

Mitsako amin'ny regression logistique

Zarao amin'ny Mitsako amin'ny regression logistique, Avy eo:

Mitsako amin'ny regression logistique

Raha sanatria, mba hahazoana antoka fa tsy nanao fahadisoana na taiza na taiza izahay, dia hanao fisavana kely indray izahay. Amin'ny dingana 2, izahay ho an'ny Mitsako amin'ny regression logistique nanapa-kevitra izany Mitsako amin'ny regression logistique. Avy eo, manolo ny sandany Mitsako amin'ny regression logistique ao amin'ny asa famaliana logistika, manantena izahay fa hahazo Mitsako amin'ny regression logistique. Manolo ary mahazo: Mitsako amin'ny regression logistique

Arahabaina, ry mpamaky malala, vao avy nahazo sy nanandrana ny fiasan'ny valin'ny logistika izahay. Andeha hojerentsika ny sarin'ny asa.

Grapika 3 "Fantom-pamaliana logistika"

Mitsako amin'ny regression logistique

Kaody ho an'ny fanaovana ny grafika

import math

def logit (f):
    return 1/(1+math.exp(-f))

f = np.arange(-7,7,0.05)
p = []

for i in f:
    p.append(logit(i))

fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(f, p, color = 'grey', label = '$ 1 / (1+e^{-w^Tx_i})$')
plt.xlabel('$f(w,x_i) = w^Tx_i$', size = 16)
plt.ylabel('$p_{i+}$', size = 16)
plt.legend(prop = {'size': 14})
plt.show()

Ao amin'ny literatiora dia azonao atao koa ny mahita ny anaran'ity asa ity ho сигмоид-функция. Ny grafika dia mampiseho mazava tsara fa ny fiovana lehibe amin'ny mety ho zavatra iray ao anatin'ny kilasy dia miseho ao anatin'ny elanelana kely. Mitsako amin'ny regression logistique, avy any Mitsako amin'ny regression logistique Π΄ΠΎ Mitsako amin'ny regression logistique.

Manoro hevitra aho ny hiverina any amin'ny mpandinika ny crΓ©dit ary hanampy azy hanao kajy ny mety ho famerenan'ny findramam-bola, raha tsy izany dia mety ho tavela tsy misy bonus izy :)

Tabilao 2 β€œNy mety ho mpampindram-bola”

Mitsako amin'ny regression logistique

Code amin'ny famoronana latabatra

proba = []
for i in df['f(w,x)']:
    proba.append(round(logit(i),2))
    
df['Probability'] = proba

df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision', 'Probability']]

Noho izany, nofaritanay ny mety hisian'ny famerenam-bola. Amin'ny ankapobeny dia toa marina izany.

Eny tokoa, ny mety hisian'ny Vasya, miaraka amin'ny karama 120.000 RUR, dia afaka manome 3.000 RUR ho an'ny banky isam-bolana dia manakaiky ny 100%. Amin'ny lafiny iray, tsy maintsy takatsika fa ny banky dia afaka manome fampindramam-bola ho an'i Lesha raha toa ny politikan'ny banky dia manome, ohatra, amin'ny fampindramam-bola amin'ny mpanjifa amin'ny mety hisian'ny famerenam-bola mihoatra ny, lazao, 0.3. Amin'ity tranga ity, ny banky dia hamorona tahiry lehibe kokoa amin'ny mety ho fatiantoka.

Tsara homarihina koa fa ny tahan'ny karama amin'ny fandoavam-bola farafahakeliny 3 ary miaraka amin'ny margin 5.000 RUR dia nalaina avy amin'ny valindrihana. Noho izany, tsy afaka mampiasa ny vector ny lanja amin'ny endriny voalohany isika Mitsako amin'ny regression logistique. Nila nahena be ny coefficients, ary tamin'ity tranga ity dia nozarainay tamin'ny 25.000 ny coefficient tsirairay, izany hoe, raha ny marina, dia nanitsy ny vokatra. Saingy natao manokana izany mba hanatsorana ny fahatakarana ny fitaovana tamin'ny dingana voalohany. Eo amin'ny fiainana dia tsy mila mamorona sy manitsy ny coefficient isika, fa hahita azy ireo. Ao amin'ny fizarana manaraka amin'ny lahatsoratra dia haka ny equations izay nofantenana ny masontsivana Mitsako amin'ny regression logistique.

04. Fomba efamira faran'izay kely indrindra hamaritana ny vektoran'ny lanja Mitsako amin'ny regression logistique ao amin'ny asa famaliana logistika

Efa fantatsika ity fomba ity amin'ny fifantenana vΓ©ctor amin'ny lanja Mitsako amin'ny regression logistique, as fomba efamira kely indrindra (LSM) ary raha ny marina, nahoana isika no tsy mampiasa izany amin'ny olana fanasokajiana binary? Eny tokoa, tsy misy manakana anao tsy hampiasa MNC, ity fomba ity amin'ny olana fanasokajiana ihany no manome valiny tsy dia marina loatra Fatiantoka Logistika. Misy fototra ara-teorika momba izany. Andeha hojerentsika aloha ny ohatra tsotra iray.

Andao atao hoe modely (mampiasa MSE ΠΈ Fatiantoka Logistika) dia efa nanomboka nisafidy ny vector ny lanja Mitsako amin'ny regression logistique ary natsahatray ny kajy tamin'ny dingana sasany. Tsy maninona na eo afovoany, na amin'ny farany na any am-piandohana, ny zava-dehibe dia ny hoe efa manana soatoavina vitsivitsy amin'ny veteran'ny lanja isika ary andeha horaisintsika fa amin'ity dingana ity, ny vector ny lanja. Mitsako amin'ny regression logistique ho an'ny modely roa dia tsy misy fahasamihafana. Avy eo dia raiso ireo lanja vokatr'izany ary asolo azy ireo fiasan'ny valin'ny logistika (Mitsako amin'ny regression logistique) ho an'ny zavatra sasany an'ny kilasy Mitsako amin'ny regression logistique. Mandinika tranga roa isika rehefa, mifanaraka amin'ny vector voafantina lanja, ny modely misy antsika dia tena diso ary ny mifamadika amin'izany - ny modely dia tena matoky fa an'ny kilasy ilay zavatra. Mitsako amin'ny regression logistique. Andeha hojerentsika hoe inona ny lamandy havoaka rehefa mampiasa MNC ΠΈ Fatiantoka Logistika.

Kaody kajy sazy miankina amin'ny asa fatiantoka ampiasaina

# класс ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°
y = 1
# Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ отнСсСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊ классу Π² соотвСтствии с ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ w
proba_1 = 0.01

MSE_1 = (y - proba_1)**2
print 'Π¨Ρ‚Ρ€Π°Ρ„ MSE ΠΏΡ€ΠΈ Π³Ρ€ΡƒΠ±ΠΎΠΉ ошибкС =', MSE_1

# напишСм Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ для вычислСния f(w,x) ΠΏΡ€ΠΈ извСстной вСроятности отнСсСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊ классу +1 (f(w,x)=ln(odds+))
def f_w_x(proba):
    return math.log(proba/(1-proba)) 

LogLoss_1 = math.log(1+math.exp(-y*f_w_x(proba_1)))
print 'Π¨Ρ‚Ρ€Π°Ρ„ Log Loss ΠΏΡ€ΠΈ Π³Ρ€ΡƒΠ±ΠΎΠΉ ошибкС =', LogLoss_1

proba_2 = 0.99

MSE_2 = (y - proba_2)**2
LogLoss_2 = math.log(1+math.exp(-y*f_w_x(proba_2)))

print '**************************************************************'
print 'Π¨Ρ‚Ρ€Π°Ρ„ MSE ΠΏΡ€ΠΈ сильной увСрСнности =', MSE_2
print 'Π¨Ρ‚Ρ€Π°Ρ„ Log Loss ΠΏΡ€ΠΈ сильной увСрСнности =', LogLoss_2

Raharaha misy diso - ny modely dia manome zavatra ho an'ny kilasy Mitsako amin'ny regression logistique miaraka amin'ny mety ho 0,01

Sazy amin'ny fampiasana MNC dia ho:
Mitsako amin'ny regression logistique

Sazy amin'ny fampiasana Fatiantoka Logistika dia ho:
Mitsako amin'ny regression logistique

Raharaha matoky tena - ny modely dia manome zavatra ho an'ny kilasy Mitsako amin'ny regression logistique miaraka amin'ny mety ho 0,99

Sazy amin'ny fampiasana MNC dia ho:
Mitsako amin'ny regression logistique

Sazy amin'ny fampiasana Fatiantoka Logistika dia ho:
Mitsako amin'ny regression logistique

Ity ohatra ity dia mampiseho tsara fa raha misy hadisoana lehibe ny asa very Very Log manasazy ny modely be lavitra noho ny MSE. Andeha hojerentsika izao ny fototra teorika amin'ny fampiasana ny asa fatiantoka Very Log amin'ny olana fanasokajiana.

05. Fomba mety indrindra sy ny fihemorana ara-pitaovana

Araka ny nampanantenaina tany am-piandohana, dia feno ohatra tsotra ilay lahatsoratra. Ao amin'ny studio dia misy ohatra iray hafa sy vahiny taloha - mpampindram-bola amin'ny banky: Vasya, Fedya ary Lesha.

Raha sanatria, alohan'ny hamolavolana ny ohatra, avelao aho hampahatsiahy anao fa eo amin'ny fiainana dia miatrika santionany fanofanana zavatra an'arivony na an-tapitrisany misy endri-javatra am-polony na an-jatony isika. Na izany aza, eto dia raisina ny isa mba ho mora amin'ny lohan'ny mpahay siansa momba ny data.

Andao hiverina amin'ny ohatra. Andeha hojerentsika fa nanapa-kevitra ny talen'ny banky ny hanome fampindramam-bola ho an'ny olona rehetra sahirana, na dia eo aza ny zava-misy fa ny algorithm dia nilaza taminy mba tsy hamoaka izany ho an'i Lesha. Ary ankehitriny dia ampy ny fotoana ary fantatsika hoe iza amin'ireo mahery fo telo no nanefa ny trosa ary iza no tsy nandoa. Inona no andrasana: Naverin'i Vasya sy Fedya ilay fampindramam-bola, fa i Lesha kosa tsy nanao izany. Andeha hojerentsika izao fa ho santionany fanofanana vaovao ho antsika io vokatra io ary, miaraka amin'izay koa, dia toy ny hoe nanjavona avokoa ny angon-drakitra rehetra momba ireo anton-javatra misy fiantraikany amin'ny mety handoavana ny trosa (karaman'ny mpindram-bola, ny haben'ny fandoavam-bola isam-bolana). Avy eo, intuitively, dia afaka mihevitra fa ny mpindram-bola fahatelo rehetra dia tsy mamerina ny findramam-bola amin'ny banky, na amin'ny teny hafa, ny mety hisian'ny mpampindram-bola manaraka hamerina ny trosa. Mitsako amin'ny regression logistique. Ity eritreritra intuitive ity dia manana fanamafisana ara-teorika ary mifototra amin'ny fomba mety indrindra, matetika ao amin’ny literatiora no iantsoana azy io fitsipika ambony indrindra mety.

Voalohany, andeha hofantarintsika ny fitaovana ara-kevitra.

Sampling mety dia ny mety hisian'ny santionany toy izany, ny fahazoana fandinihana/vokatra toy izany, i.e. ny vokatry ny mety hahazoana tsirairay ny santionany vokatra (ohatra, na ny fampindramam-bola Vasya, Fedya sy Lesha naverina na tsy naverina tamin'ny fotoana iray ihany).

Asa mety связываСт ΠΏΡ€Π°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ со значСниями ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² распрСдСлСния.

Amin'ny tranga misy antsika, ny santionany fanofanana dia rafitra Bernoulli ankapobeny, izay tsy misy afa-tsy sanda roa ny fari-piadidiana kisendrasendra: Mitsako amin'ny regression logistique na Mitsako amin'ny regression logistique. Noho izany, ny mety ho santionany dia azo soratana ho toy ny asa mety ho an'ny parameter Mitsako amin'ny regression logistique toy izao manaraka izao:

Mitsako amin'ny regression logistique
Mitsako amin'ny regression logistique

Ny fidirana etsy ambony dia azo adika toy izao manaraka izao. Mitovy amin'ny mety ho fiaraha-mientan'i Vasya sy Fedya ny findramam-bola Mitsako amin'ny regression logistique, ny mety ho TSY handoavana ny trosa i Lesha dia mitovy amin'ny Mitsako amin'ny regression logistique (satria TSY ny famerenam-bola no nitranga), noho izany dia mitovy ny mety hitrangan'ny hetsika telo. Mitsako amin'ny regression logistique.

Fomba mety indrindra dia fomba fanombanana paramètre tsy fantatra amin'ny alàlan'ny fampitomboana asa mety. Amin'ny toe-javatra misy antsika dia mila mahita lanja toy izany isika Mitsako amin'ny regression logistiqueamin izay Mitsako amin'ny regression logistique mahatratra ny faratampony.

Avy aiza ny tena hevitra - mba hitady ny sandan'ny paramètre tsy fantatra izay mahatratra ny fara-tampony ny asa mety hitranga? Ny niandohan'ny hevitra dia avy amin'ny hevitra fa ny santionany no hany loharanom-pahalalana azontsika momba ny mponina. Ny zavatra rehetra fantatsika momba ny mponina dia aseho amin'ny santionany. Noho izany, ny hany azontsika lazaina dia ny santionany no taratry ny tena marina momba ny mponina misy antsika. Noho izany, mila mitady paramètre izay mety ho azo inoana indrindra ny santionany misy.

Mazava ho azy fa miatrika olan'ny optimization izay ilaintsika hahitana ny teboka faran'ny asa iray. Mba hahitana ny teboka faratampony dia ilaina ny mandinika ny fepetran'ny filaharana voalohany, izany hoe, mampitovy ny derivative ny asa amin'ny aotra ary mamaha ny equation amin'ny mari-pamantarana irina. Na izany aza, ny fikarohana ny derivative ny vokatra amin'ny lafin-javatra maro dia mety ho asa lava, mba hisorohana izany, dia misy teknika manokana - mifindra amin'ny logarithm. asa mety. Nahoana no azo atao ny tetezamita toy izany? Aoka isika handinika ny zava-misy fa tsy mitady ny extremum ny asa mihitsyMitsako amin'ny regression logistique, ary ny teboka farany, izany hoe ny sandan'ny paramètre tsy fantatra Mitsako amin'ny regression logistiqueamin izay Mitsako amin'ny regression logistique mahatratra ny faratampony. Rehefa mifindra amin'ny logaritma dia tsy miova ny teboka farany (na dia tsy mitovy aza ny extremum), satria ny logarithma dia fiasa monotonika.

Andeha isika, araka ny voalaza etsy ambony, hanohy hampivelatra ny ohatra asehontsika amin'ny fampindramam-bola avy amin'i Vasya, Fedya ary Lesha. Andeha aloha hiroso amin'ny logarithm ny mety ho asa:

Mitsako amin'ny regression logistique

Ankehitriny dia afaka manavaka mora foana ny fomba fiteny amin'ny Mitsako amin'ny regression logistique:

Mitsako amin'ny regression logistique

Ary farany, diniho ny fepetra filaharana voalohany - ampitovintsika amin'ny zero ny derivative ny asa:

Mitsako amin'ny regression logistique

Noho izany, ny tombantombanay intuitive momba ny mety hisian'ny famerenam-bola Mitsako amin'ny regression logistique nohamarinina ara-teorika.

Tsara, fa inona no tokony hataontsika amin'ity fampahalalana ity izao? Raha heverina fa tsy mamerina ny vola any amin’ny banky ny mpindrana fahatelo rehetra, dia tsy maintsy ho bankirompitra ity farany. Marina izany, fa rehefa manombana ny mety ho famerenam-bola mitovy amin'ny Mitsako amin'ny regression logistique Tsy noraharahainay ny anton'ny fandoavana ny trosa: ny karaman'ny mpindram-bola sy ny haben'ny fandoavam-bola isam-bolana. Aoka hotsaroantsika fa efa nanao kajy teo aloha ny mety famerenan'ny mpanjifa tsirairay ny findramam-bola, amin'ny fiheverana ireo lafin-javatra ireo. Lojika fa nahazo probabilities tsy mitovy amin'ny mitovy foana Mitsako amin'ny regression logistique.

Andeha hofaritana ny mety ho santionany:

Kaody ho an'ny kajy ny mety ho santionany

from functools import reduce

def likelihood(y,p):
    line_true_proba = []
    for i in range(len(y)):
        ltp_i = p[i]**y[i]*(1-p[i])**(1-y[i])
        line_true_proba.append(ltp_i)
    likelihood = []
    return reduce(lambda a, b: a*b, line_true_proba)
        
    
y = [1.0,1.0,0.0]
p_log_response = df['Probability']
const = 2.0/3.0
p_const = [const, const, const]


print 'ΠŸΡ€Π°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΏΡ€ΠΈ константном Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΈ p=2/3:', round(likelihood(y,p_const),3)

print '****************************************************************************************************'

print 'ΠŸΡ€Π°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΏΡ€ΠΈ расчСтном Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΈ p:', round(likelihood(y,p_log_response),3)

Santionany amin'ny sanda tsy miova Mitsako amin'ny regression logistique:

Mitsako amin'ny regression logistique

Santionany ny mety ho santionany rehefa manao kajy ny mety ho famerenan'ny findramam-bola amin'ny kajikajy lafin-javatra Mitsako amin'ny regression logistique:

Mitsako amin'ny regression logistique
Mitsako amin'ny regression logistique

Ny mety hisian'ny santionany amin'ny mety ho kajy miankina amin'ny anton-javatra dia nivadika ho ambony kokoa noho ny mety manana sanda mety tsy tapaka. Inona no dikan'ity? Midika izany fa ny fahalalana momba ny anton-javatra dia nahafahana nifidy tsara kokoa ny mety ho famerenan'ny trosa ho an'ny mpanjifa tsirairay. Noho izany, rehefa mamoaka ny fampindramam-bola manaraka dia mety kokoa ny mampiasa ny maodely natolotra eo amin'ny faran'ny fizarana faha-3 amin'ny lahatsoratra amin'ny fanombanana ny mety ho famerenana trosa.

Fa avy eo, raha tiantsika ny maximize asa santionany mety, dia maninona raha mampiasa algorithm sasany izay hamokatra probabilities ho an'i Vasya, Fedya ary Lesha, ohatra, mitovy amin'ny 0.99, 0.99 ary 0.01. Angamba ny algorithm toy izany dia hahomby tsara amin'ny santionany fanofanana, satria hitondra ny sandan'ny santionany ho akaiky kokoa Mitsako amin'ny regression logistique, fa, voalohany, ny algorithm toy izany dia mety ho sarotra amin'ny fahaiza-manaon'ny ankapobeny, ary faharoa, ity algorithm ity dia azo antoka fa tsy ho linear. Ary raha toa ka tsy tafiditra ao anatin'ny drafitra amin'ity lahatsoratra ity ny fomba hiadiana amin'ny overtraining (fahaiza-manao ankapobeny mitovy amin'izany), dia andeha hojerentsika amin'ny antsipiriany bebe kokoa ny teboka faharoa. Mba hanaovana izany, mamaly fanontaniana tsotra fotsiny. Mety hitovy ve ny mety ho fandoavan'i Vasya sy Fedya ny fampindramam-bola, amin'ny fiheverana ny anton-javatra fantatray? Raha ny fomba fijery lojika feo, mazava ho azy fa tsy, tsy afaka. Noho izany dia handoa 2.5% amin'ny karamany isam-bolana i Vasya hamerenana ny trosa, ary Fedya - efa ho 27,8%. Ao amin'ny grafika 2 "fanasokajiana mpanjifa" dia hitantsika fa lavitra lavitra ny tsipika manasaraka ny kilasy noho i Fedya i Vasya. Ary farany, fantatsika fa ny asa Mitsako amin'ny regression logistique ho an'i Vasya sy Fedya dia maka sanda samihafa: 4.24 ho an'i Vasya ary 1.0 ho an'i Fedya. Ankehitriny, raha i Fedya, ohatra, dia nahazo baiko lehibe kokoa na nangataka fampindramam-bola kely kokoa, dia ho toy izany koa ny mety handoavana ny trosa ho an'i Vasya sy Fedya. Amin'ny teny hafa, ny fiankinan-doha amin'ny tsipika dia tsy azo ambakaina. Ary raha tena kajy ny mety Mitsako amin'ny regression logistique, ary tsy nanala azy ireo tamin'ny rivotra manify, dia afaka nilaza soa aman-tsara izahay fa ny soatoavinay Mitsako amin'ny regression logistique Ny tsara indrindra dia mamela antsika hanombantombana ny mety ho famerenan'ny mpampindram-bola tsirairay, fa satria nanaiky ny hihevitra fa ny famaritana ny coefficients Mitsako amin'ny regression logistique dia natao araka ny fitsipika rehetra, avy eo dia hihevitra isika - ny coefficients dia mamela antsika hanome tombanana tsara kokoa ny mety :)

Na izany aza, mihemotra isika. Ato amin'ity fizarana ity dia mila mahatakatra ny fomba hamaritana ny vector ny lanja Mitsako amin'ny regression logistique, izay ilaina amin'ny fanombanana ny mety ho famerenan'ny mpampindram-bola tsirairay.

Andeha isika hamintina fohifohy miaraka amin'ny arsenal izay alehantsika mitady odds Mitsako amin'ny regression logistique:

1. Heverintsika fa ny fifandraisana misy eo amin'ny fari-pitsipika kendrena (sanda vinavina) sy ny anton-javatra misy fiantraikany amin'ny vokatra dia linear. Noho izany antony izany no ampiasaina asa fihemorana linear tsara fanahy Mitsako amin'ny regression logistique, ny tsipika izay mizara zavatra (mpanjifa) ho kilasy Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique na Mitsako amin'ny regression logistique (mpanjifa afaka mamerina ny findramam-bola sy ireo izay tsy afaka). Amin'ny tranga misy antsika dia manana endrika ny equation Mitsako amin'ny regression logistique.

2. Mampiasa izahay inverse logit asa tsara fanahy Mitsako amin'ny regression logistique hamaritana ny mety hisian'ny zavatra iray ao amin'ny kilasy iray Mitsako amin'ny regression logistique.

3. Heverinay ho toy ny fampiharana ny fanazaran-tena amin'ny ankapobeny Bernoulli schemes, izany hoe, ho an'ny zavatra tsirairay dia misy fari-pahalalana kisendrasendra, izay misy ny mety Mitsako amin'ny regression logistique (ny azy ho an'ny zavatra tsirairay) dia maka ny sanda 1 ary miaraka amin'ny mety Mitsako amin'ny regression logistique - 0.

4. Fantatsika izay tokony hataontsika ambony indrindra asa santionany mety amin'ny fiheverana ny anton-javatra ekena mba hahatonga ny santionany azo antoka indrindra. Raha lazaina amin'ny teny hafa, dia mila mifidy masontsivana izay ho azo itokisana indrindra ny santionany. Amin'ny tranga misy antsika, ny parameter voafantina dia ny mety hisian'ny famerenam-bola Mitsako amin'ny regression logistique, izay miankina amin'ny coefficient tsy fantatra Mitsako amin'ny regression logistique. Noho izany dia mila mahita vector ny lanja toy izany isika Mitsako amin'ny regression logistique, izay mety ho ambony indrindra ny santionany.

5. Fantatsika izay tokony ho ambony indrindra santionany mety asa afaka mampiasa fomba mety indrindra. Ary fantatsika ny hafetsena rehetra mba hiasa amin'ity fomba ity.

Toy izao ny fandehany fa dingana maromaro :)

Tsarovy izao fa tany am-piandohan'ny lahatsoratra dia te hahazo karazana fatiantoka roa izahay Fatiantoka Logistika miankina amin'ny fomba fanondroana kilasy zavatra. Nitranga izany fa amin'ny olana fanasokajiana amin'ny kilasy roa, ny kilasy dia lazaina ho Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique na Mitsako amin'ny regression logistique. Miankina amin'ny fanamarihana, ny vokatra dia hanana asa fatiantoka mifanaraka amin'izany.

Tranga 1. Fanasokajiana ny zavatra ho Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique

Talohan'izay, rehefa mamaritra ny mety hisian'ny santionany, izay ny mety ho famerenan'ny trosan'ny mpampindram-bola dia kajy mifototra amin'ny anton-javatra sy nomena coefficients Mitsako amin'ny regression logistique, nampiharinay ny formula:

Mitsako amin'ny regression logistique

Raha ny marina Mitsako amin'ny regression logistique dia ny dikany asa famaliana logistika Mitsako amin'ny regression logistique ho an'ny vector ny lanja Mitsako amin'ny regression logistique

Dia tsy misy misakana antsika tsy hanoratra ny santionany mety ho asa toy izao manaraka izao:

Mitsako amin'ny regression logistique

Mitranga fa indraindray sarotra ho an'ny mpandinika vaovao sasany ny hahatakatra avy hatrany ny fomba fiasan'ity asa ity. Andeha hojerentsika ohatra fohy 4 izay hanazava ny zava-drehetra:

1. raha Mitsako amin'ny regression logistique (izany hoe, araka ny santionany fanofanana, ny zavatra dia an'ny kilasy +1), ary ny algorithm Mitsako amin'ny regression logistique mamaritra ny mety hanasokajiana zavatra iray amin'ny kilasy iray Mitsako amin'ny regression logistique mitovy amin'ny 0.9, dia hokajiana toy izao manaraka izao ity santionan'ny santionany ity:

Mitsako amin'ny regression logistique

2. raha Mitsako amin'ny regression logistiqueary Mitsako amin'ny regression logistique, dia ho toy izao ny kajy:

Mitsako amin'ny regression logistique

3. raha Mitsako amin'ny regression logistiqueary Mitsako amin'ny regression logistique, dia ho toy izao ny kajy:

Mitsako amin'ny regression logistique

4. raha Mitsako amin'ny regression logistiqueary Mitsako amin'ny regression logistique, dia ho toy izao ny kajy:

Mitsako amin'ny regression logistique

Miharihary fa ny mety ho asa dia ho ambony indrindra amin'ny tranga 1 sy 3 na amin'ny tranga ankapobeny - miaraka amin'ny sanda voatondro tsara amin'ny mety ho fanendrena zavatra iray amin'ny kilasy. Mitsako amin'ny regression logistique.

Noho ny zava-misy fa rehefa mamaritra ny mety ho fanendrena zavatra iray kilasy Mitsako amin'ny regression logistique Ny coefficients ihany no tsy fantatsika Mitsako amin'ny regression logistique, dia hitady azy ireo isika. Araka ny voalaza etsy ambony, ity dia olan'ny fanatsarana izay ilaintsika aloha ny fitadiavana ny derivative amin'ny mety ho asa mifandraika amin'ny vector ny lanja. Mitsako amin'ny regression logistique. Na izany aza, misy dikany aloha ny manatsotra ny asa ho an'ny tenantsika: hitady ny derivative amin'ny logarithm isika. asa mety.

Mitsako amin'ny regression logistique

Nahoana aorian'ny logaritma, in fiasan'ny fahadisoana ara-logistika, novanay ny famantarana avy amin'ny Mitsako amin'ny regression logistique amin'ny Mitsako amin'ny regression logistique. Tsotra ny zava-drehetra, satria amin'ny olana amin'ny fanombanana ny kalitaon'ny modely dia mahazatra ny manamaivana ny sandan'ny asa iray, ampitomboinay ny ilany havanana amin'ny teny. Mitsako amin'ny regression logistique ary arak'izany, raha tokony ho maximize, dia manamaivana ny asa.

Raha ny marina, amin'izao fotoana izao, eo imasonao, ny fiasan'ny fatiantoka dia nipoitra mafy - Fatiantoka Logistika ho an'ny fiofanana misy kilasy roa: Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique.

Ankehitriny, mba hahitana ny coefficients, mila mitady ny derivative fotsiny isika fiasan'ny fahadisoana ara-logistika ary avy eo, amin'ny fampiasana fomba fanatsarana isa, toy ny gradient gradient na stochastic gradient descent, safidio ny coefficient tsara indrindra. Mitsako amin'ny regression logistique. Saingy, raha jerena ny habetsaky ny lahatsoratra, dia soso-kevitra ny hanatanteraka ny fanavahana amin'ny tenanao manokana, na angamba ho lohahevitra ho an'ny lahatsoratra manaraka miaraka amin'ny aritmetika be dia be tsy misy ohatra amin'ny antsipiriany toy izany.

Tranga 2. Fanasokajiana ny zavatra ho Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique

Ny fomba fiasa eto dia hitovy amin'ny kilasy Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique, fa ny lalana mankany amin'ny famoahana ny asa very Fatiantoka Logistika, dia ho voaravaka kokoa. Andeha isika hanomboka. Ho an'ny asa mety hitranga dia hampiasa ny operator izahay "raha... dia..."... Izany hoe, raha Mitsako amin'ny regression logistiqueAn'ny kilasy ny zavatra th Mitsako amin'ny regression logistique, dia mampiasa ny probabilitΓ© ny kajy ny mety ho santionany Mitsako amin'ny regression logistique, raha an'ny kilasy ilay zavatra Mitsako amin'ny regression logistique, dia soloinay amin'ny mety Mitsako amin'ny regression logistique. Toy izao ny endriky ny mety ho asa:

Mitsako amin'ny regression logistique

Andeha hofaritantsika amin'ny rantsan-tanana ny fomba fiasan'izy io. Andeha isika handinika tranga 4:

1. raha Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique, dia "handeha" ny mety ho santionany Mitsako amin'ny regression logistique

2. raha Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique, dia "handeha" ny mety ho santionany Mitsako amin'ny regression logistique

3. raha Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique, dia "handeha" ny mety ho santionany Mitsako amin'ny regression logistique

4. raha Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique, dia "handeha" ny mety ho santionany Mitsako amin'ny regression logistique

Mazava ho azy fa amin'ny tranga 1 sy 3, rehefa voafaritry ny algorithm araka ny tokony ho izy ny probabilities, asa mety dia ho ambony indrindra, izany hoe izany indrindra no tiana ho azo. Na izany aza, ity fomba fiasa ity dia somary manahirana ary manaraka dia hodinihintsika ny fanamarihana kely kokoa. Fa aloha, andeha hojerentsika ny logarithm ny mety ho asa miaraka amin'ny fiovan'ny famantarana, satria izao no hanamaivana izany.

Mitsako amin'ny regression logistique

Aleo soloina Mitsako amin'ny regression logistique teny Mitsako amin'ny regression logistique:

Mitsako amin'ny regression logistique

Andao hanatsotra ny teny marina eo ambanin'ny logaritma amin'ny fampiasana teknika arithmetika tsotra ary mahazo:

Mitsako amin'ny regression logistique

Fotoana izao hialana amin'ny mpandraharaha "raha... dia...". Mariho fa rehefa zavatra iray Mitsako amin'ny regression logistique an'ny kilasy Mitsako amin'ny regression logistique, avy eo amin'ny fitenenana eo ambanin'ny logaritma, ao amin'ny denominator, Mitsako amin'ny regression logistique natsangana ho amin’ny fahefana Mitsako amin'ny regression logistique, raha an'ny kilasy ilay zavatra Mitsako amin'ny regression logistique, dia atsangana ho eo amin'ny fahefana ny $e$ Mitsako amin'ny regression logistique. Noho izany, ny fanamarihana momba ny mari-pahaizana dia azo tsotsotra amin'ny fampifangaroana ireo tranga roa ireo ho iray: Mitsako amin'ny regression logistique... dia fiasan'ny fahadisoana ara-logistika dia handray ny endrika:

Mitsako amin'ny regression logistique

Mifanaraka amin'ny fitsipiky ny logaritma, mamadika ny ampahany isika ary mametraka ny famantarana "Mitsako amin'ny regression logistique"(minus) ho an'ny logarithm dia mahazo:

Mitsako amin'ny regression logistique

Ity ny asa fatiantoka fatiantoka ara-pitaovana, izay ampiasaina amin'ny seta fanofanana miaraka amin'ireo zavatra voatendry ho an'ny kilasy: Mitsako amin'ny regression logistique ΠΈ Mitsako amin'ny regression logistique.

Eny ary, amin'izao fotoana izao dia miala sasatra aho ary mamarana ny lahatsoratra.

Mitsako amin'ny regression logistique Ny asa nataon'ny mpanoratra teo aloha dia ny "Mitondra ny equation linear regression amin'ny endrika matrix"

Fitaovana fanampiny

1. boky sy gazety

1) Famakafakana fihemorana nampiharina / N. Draper, G. Smith - 2nd ed. – M.: Finance and Statistics, 1986 (dika avy amin’ny teny anglisy)

2) Theory probabilitΓ© sy statistika matematika / V.E. Gmurman - andiany faha-9. - M.: Higher School, 2003

3) Theory probability / N.I. Chernova - Novosibirsk: Novosibirsk State University, 2007

4) Business analytics: from data to knowledge / Paklin N. B., Oreshkov V. I. - 2nd ed. β€” Saint-PΓ©tersbourg: Peter, 2013

5) Data Science Data science from scratch / Joel Gras - St. Petersburg: BHV Petersburg, 2017

6) Statistika azo ampiharina ho an'ny manam-pahaizana momba ny Siansa Data / P. Bruce, E. Bruce - St. Petersburg: BHV Petersburg, 2018

2. Lectures, courses (video)

1) Ny fototry ny fomba mety indrindra, Boris Demeshev

2) Ny fomba mety indrindra amin'ny tranga mitohy, Boris Demeshev

3) Fiverenan'ny logistika. Open ODS course, Yury Kashnitsky

4) Lecture 4, Evgeny Sokolov (avy amin'ny horonan-tsary 47 minitra)

5) Logistic regression, Vyacheslav Vorontsov

3. Loharano amin'ny Internet

1) Fanasokajiana Linear sy modely regression

2) Ahoana no ahafantarana mora foana ny regression logistique

3) Logistic Error Function

4) Fitsapana tsy miankina sy formula Bernoulli

5) Ballad de MMP

6) Fomba mety indrindra

7) Formula sy toetran'ny logarithms

8) Nahoana no isa Mitsako amin'ny regression logistique?

9) Fanasokajiana Linear

Source: www.habr.com

Add a comment