Ato amin'ity lahatsoratra ity, isika dia handinika ny teorika kajy ny fiovana asa fihemorana linear Π² Inverse logit transformation function (antsoina koa hoe fonction rΓ©ponse logistique). Avy eo, mampiasa ny arsenal fomba mety indrindra, mifanaraka amin'ny modelin'ny regression logistic, dia mahazo ny asa fatiantoka isika Fatiantoka Logistika, ΠΈΠ»ΠΈ Π΄ΡΡΠ³ΠΈΠΌΠΈ ΡΠ»ΠΎΠ²Π°ΠΌΠΈ, ΠΌΡ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΠΌ ΡΡΠ½ΠΊΡΠΈΡ, Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΠΊΠΎΡΠΎΡΠΎΠΉ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ Π»ΠΎΠ³ΠΈΡΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ ΠΏΠΎΠ΄Π±ΠΈΡΠ°ΡΡΡΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΡ Π²Π΅ΠΊΡΠΎΡΠ° Π²Π΅ΡΠΎΠ² .
Fitsipika lahatsoratra:
- Andeha isika hamerina ny fifandraisana linear eo amin'ny variables roa
- Andeha hojerentsika ny filana fanovana asa fihemorana linear Π² fiasan'ny valin'ny logistika
- Andao hanatanteraka ny fanovana sy ny vokatra fiasan'ny valin'ny logistika
- Andeha hojerentsika hoe nahoana no ratsy ny fomba efamira kely indrindra rehefa mifidy paramètre asa Fatiantoka Logistika
- Ampiasainay fomba mety indrindra mba hamaritana asa fifantenana paramètre :
5.1. Tranga 1: asa Fatiantoka Logistika ho an'ny zavatra misy fanendrena kilasy 0 ΠΈ 1:
5.2. Tranga 2: asa Fatiantoka Logistika ho an'ny zavatra misy fanendrena kilasy -1 ΠΈ +1:
Ny lahatsoratra dia feno ohatra tsotra izay mora atao am-bava na an-taratasy ny kajy rehetra; amin'ny toe-javatra sasany dia mety ilaina ny kajy. Koa miomΓ na :)
Ity lahatsoratra ity dia natao indrindra ho an'ny mpahay siansa momba ny data manana fahalalana voalohany momba ny fototry ny fianarana milina.
Hanome kaody ho an'ny fanaovana sary sy kajy koa ilay lahatsoratra. Ny kaody rehetra dia voasoratra amin'ny fiteny python-2.7. MamelΓ ahy hanazava mialoha momba ny "vaovao" amin'ny dikan-teny ampiasaina - iray amin'ireo fepetra handraisana ny taranja fanta-daza avy amin'ny Yandex amin'ny sehatra fanabeazana an-tserasera malaza ihany koa Coursera, ary, araka ny mety hiheverana azy, dia nomanina nifototra taminβity taranja ity ny fitaovana.
01. Fiankinan-doha mahitsy
Tena mitombina ny mametraka ny fanontaniana - inona no idiran'ny fiankinan-doha amin'ny tsipika sy ny fihemorana ara-logistika amin'izany?
Tsotra izany! Ny regression logistique dia iray amin'ireo modely izay an'ny mpanasokajy linear. Raha lazaina amin'ny teny tsotra, ny asan'ny mpanasokajy linear dia ny maminavina ny soatoavina kendrena avy amin'ny variables (regressors) . Misy mihevitra fa ny fiankinan-doha eo amin`ny toetra ary ny soatoavina kendrena linear. Noho izany ny anaran 'ny classifier - linear. Raha lazaina amin'ny teny henjana, ny maodely regression logistic dia mifototra amin'ny fiheverana fa misy fifandraisana tsipika eo amin'ireo toetra. ary ny soatoavina kendrena . Ity ny fifandraisana.
Misy ny ohatra voalohany ao amin'ny studio, ary izany dia, raha ny marina, momba ny fiankinan-doha amin'ny rectilinear ny habetsaky ny fianarana. Teo am-panomanana ny lahatsoratra dia nahita ohatra iray izay efa nametraka olona maro aho - ny fiankinan-doha amin'ny voltase. (βFamakafakana mihemotra ampiharinaβ, N. Draper, G. Smith). Hojerentsika eto koa.
Araka ny LalΓ na Ohm:
izay - hery ankehitriny, - Zintin'aratra, - fanoherana.
Raha tsy fantatsika LalΓ n'i Ohm, dia afaka mahita ny fiankinan-doha amin'ny alΓ lan'ny fanovana isika ary fandrefesana , raha manohana raikitra. Dia ho hitantsika fa ny graph dependance ΠΎΡ manome tsipika mahitsy kokoa na latsaka amin'ny fiaviana. Miteny izahay hoe "mihoatra na latsaka" satria, na dia marina aza ny fifandraisana, dia mety misy lesoka kely ny fandrefesanay, ary noho izany dia mety tsy hianjera amin'ny tsipika marina ny teboka eo amin'ny grafika, fa hiparitaka manodidina azy kisendrasendra.
Grapika 1 βFiankinan-dohaβ ΠΎΡ Β»
Kaody fanaovana tabilao
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import random
R = 13.75
x_line = np.arange(0,220,1)
y_line = []
for i in x_line:
y_line.append(i/R)
y_dot = []
for i in y_line:
y_dot.append(i+random.uniform(-0.9,0.9))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(x_line,y_line,color = 'purple',lw = 3, label = 'I = U/R')
plt.scatter(x_line,y_dot,color = 'red', label = 'Actual results')
plt.xlabel('I', size = 16)
plt.ylabel('U', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
02. Ny filΓ na hanovana ny equation linear regression
Andeha isika hijery ohatra iray hafa. Alao sary an-tsaina hoe miasa any amin'ny banky isika ary ny andraikitray dia ny mamaritra ny mety ho an'ny mpindram-bola handoavana ny fampindramam-bola miankina amin'ny lafin-javatra sasany. Mba hanatsorana ny asa, dia tsy hojerentsika afa-tsy lafin-javatra roa: ny karaman'ny mpindram-bola isam-bolana sy ny vola aloa isam-bolana.
Ny asa dia tena misy fepetra, saingy amin'ity ohatra ity dia azontsika atao ny mahatakatra ny antony tsy ampy ny fampiasana azy asa fihemorana linear, ary fantaro ihany koa ny fanovana tokony hatao amin'ny asa.
Andao hiverina amin'ny ohatra. Araka ny fantatra dia arakaraky ny avoakanβny karama no ahafahanβny mpindram-bola hanokana isam-bolana hamerenana ny trosa. Amin'izay fotoana izay ihany koa, ho an'ny karama sasany, ity fifandraisana ity dia ho tsipika. Ohatra, andeha isika haka ny karama isan-karazany avy amin'ny 60.000 RUR ka hatramin'ny 200.000 RUR ary heverina fa amin'ny karama voafaritra, ny fiankinan-doha amin'ny haben'ny fandoavam-bola isam-bolana amin'ny haben'ny karama dia linear. Andeha hatao hoe ho an'ny karama voafaritra dia nambara fa ny tahan'ny karama amin'ny fandoavam-bola dia tsy azo latsaka ambanin'ny 3 ary ny mpindram-bola dia tsy maintsy manana tahiry 5.000 RUR. Ary amin'ity tranga ity ihany, dia hihevitra isika fa ny mpampindram-bola dia hamerina ny trosa amin'ny banky. Avy eo, ny equation linear regression dia haka ny endrika:
izay , , , - karama - ny mpampindram-bola, - fandoavam-bola - ny mpindram-bola.
Fanoloana ny karama sy ny fandoavana ny fampindramam-bola miaraka amin'ny masontsivana raikitra ao amin'ny equation Afaka manapa-kevitra ianao na hamoaka na handΓ fampindramam-bola.
Raha mijery ny ho avy isika dia manamarika fa, miaraka amin'ireo masontsivana nomena asa fihemorana linear, ampiasaina amin'ny asa famaliana logistika dia hamokatra sanda lehibe izay hanasarotra ny kajy mba hamaritana ny mety hisian'ny famerenam-bola. Noho izany, soso-kevitra ny hampihenana ny coefficient antsika, andao atao hoe, in-25.000. Tsy hanova ny fanapahan-kevitra hamoaka findramam-bola izany fiovana eo aminβny coefficient izany. Andeha hotsaroantsika amin'ny ho avy io teboka io, fa ankehitriny, mba hampahazava kokoa ny zavatra resahina, andeha hodinihintsika ny toe-javatra misy mpindram-bola telo.
Tabilao 1 βNy mety ho mpampindram-bolaβ
Code amin'ny famoronana latabatra
import pandas as pd
r = 25000.0
w_0 = -5000.0/r
w_1 = 1.0/r
w_2 = -3.0/r
data = {'The borrower':np.array(['Vasya', 'Fedya', 'Lesha']),
'Salary':np.array([120000,180000,210000]),
'Payment':np.array([3000,50000,70000])}
df = pd.DataFrame(data)
df['f(w,x)'] = w_0 + df['Salary']*w_1 + df['Payment']*w_2
decision = []
for i in df['f(w,x)']:
if i > 0:
dec = 'Approved'
decision.append(dec)
else:
dec = 'Refusal'
decision.append(dec)
df['Decision'] = decision
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision']]
Araka ny angon-drakitra ao amin'ny latabatra, Vasya, manana karama 120.000 RUR, dia te-hahazo fampindramam-bola mba hahafahany mamerina izany isam-bolana amin'ny 3.000 RUR. Nanapa-kevitra izahay fa mba hankatoavana ny fampindramam-bola, ny karaman'i Vasya dia tsy maintsy mihoatra ny avo telo heny noho ny vola aloa, ary tsy maintsy misy RUR 5.000 sisa. Mahafeno ity fepetra ity i Vasya: . Na dia 106.000 RUR aza no tavela. Na dia eo aza ny zava-misy fa rehefa manao kajy nahenanay ny mety In-25.000, mitovy ny vokatra - azo ekena ny fampindramam-bola. Hahazo fampindramam-bola ihany koa i Fedya, fa i Lesha, na dia mahazo betsaka aza, dia tsy maintsy manetry tena ny filany.
Andao hanao sary ho an'ity tranga ity.
Tabilao 2 β Fanasokajiana ny mpindram-bolaβ
Kaody ho an'ny fanaovana ny grafika
salary = np.arange(60000,240000,20000)
payment = (-w_0-w_1*salary)/w_2
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(salary, payment, color = 'grey', lw = 2, label = '$f(w,x_i)=w_0 + w_1x_{i1} + w_2x_{i2}$')
plt.plot(df[df['Decision'] == 'Approved']['Salary'], df[df['Decision'] == 'Approved']['Payment'],
'o', color ='green', markersize = 12, label = 'Decision - Loan approved')
plt.plot(df[df['Decision'] == 'Refusal']['Salary'], df[df['Decision'] == 'Refusal']['Payment'],
's', color = 'red', markersize = 12, label = 'Decision - Loan refusal')
plt.xlabel('Salary', size = 16)
plt.ylabel('Payment', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
Noho izany, ny tsipika mahitsy, naorina araka ny asa , manasaraka ny mpindrana βratsyβ sy ny βtsaraβ. Ireo mpindram-bola izay tsy mifanaraka amin'ny fahaizany dia mihoatra ny tsipika (Lesha), fa ireo izay, araka ny mari-pamantarana amin'ny modely, dia afaka mamerina ny trosa dia eo ambanin'ny tsipika (Vasya sy Fedya). Raha lazaina amin'ny teny hafa dia izao no azontsika lazaina: ny tsipika mivantana dia mizara roa ny mpindram-bola. Andeha hojerentsika toy izao manaraka izao izy ireo: any am-pianarana Hosokajinay ireo mpindram-bola izay mety hamerina ny findramam-bola ho na Ampidirinay ireo mpindram-bola izay azo inoana fa tsy afaka mamerina ny trosa.
Andeha isika hamintina ny fanatsoahan-kevitra avy aminβio ohatra tsotra io. Andeha isika haka hevitra ary, manolo ny fandrindrana ny teboka amin'ny fampitoviana mifanaraka amin'ny tsipika , diniho ny safidy telo:
- Raha eo ambanin'ny tsipika ilay teboka ary omenay ny kilasy , avy eo ny sandan'ny asa dia ho tsara avy amin'ny Π΄ΠΎ . Midika izany fa afaka mihevitra isika fa ny mety ho famerenana ny trosa dia ao anatiny . Arakaraky ny lehibe kokoa ny sandan'ny asa no ambony kokoa ny mety.
- Raha misy teboka eo ambonin'ny tsipika iray ary omenay ny kilasy na , dia ho ratsy ny sandan'ny asa Π΄ΠΎ . Avy eo dia hoheverintsika fa ao anatin'izany ny mety hisian'ny famerenam-bola ary, arakaraky ny lehibe kokoa ny hasarobidin'ny asa no ambony kokoa ny fahatokisantsika.
- Ny teboka dia eo amin'ny tsipika mahitsy, eo amin'ny sisin-tany eo anelanelan'ny kilasy roa. Amin'ity tranga ity, ny sandan'ny asa dia hitovy ary ny mety handoavana ny trosa dia mitovy amin'ny .
Ankehitriny, andeha hojerentsika fa tsy manana antony roa isika, fa am-polony, ary tsy telo, fa mpindram-bola an'arivony. Dia ho solon'ny tsipika mahitsy no hananantsika m-dimensional fiaramanidina sy coefficients tsy hoesorina amin'ny rivotra manify izahay, fa azo avy amin'ny fitsipika rehetra, ary mifototra amin'ny angon-drakitra voaangona amin'ny mpindram-bola izay manana na tsy namerina ny trosa. Eny tokoa, mariho fa mifidy mpindram-bola mampiasa coefficient efa fantatra isika izao . Raha ny marina, ny andraikitry ny modelim-pandrefesana lozisialy dia ny mamaritra ny mari-pamantarana , izay ny sandan'ny asa fatiantoka Fatiantoka Logistika dia hirona amin'ny kely indrindra. Fa ny fomba kajy ny vector , ho hitantsika bebe kokoa ao aminβny fizarana faha-5 aminβilay lahatsoratra. Mandra-pahatongan'izany dia miverina any amin'ny tany nampanantenaina isika - amin'ny banky sy ny mpanjifany telo.
Misaotra ny asa fantatray hoe iza no azo omena findramam-bola ary iza no mila lavina. Saingy tsy afaka mankany amin'ny tale miaraka amin'ny fampahalalana toy izany ianao, satria te-hahazo avy aminay ny mety ho famerenan'ny mpampindram-bola tsirairay. Ny hatao? Tsotra ny valiny - mila manova ny fiasa isika , izay misy ny sandany eo amin'ny salan'isa amin'ny asa iray izay ny sandany dia mitoetra ao anatin'ny salan'isa . Ary misy ny asa toy izany, antsoina hoe fiasan'ny valim-panontaniana ara-logistika na fanovana inverse-logit. Mivory:
Andeha hojerentsika ny fomba fiasa fiasan'ny valin'ny logistika. Mariho fa handeha amin'ny lalana mifanohitra isika, i.e. isika dia hihevitra fa fantatsika ny sanda mety, izay mitoetra ao amin'ny isan-karazany avy Π΄ΠΎ ary avy eo dia "hanala" io sanda io amin'ny isa manontolo avy amin'ny Π΄ΠΎ .
03. Nahazo ny asa valin'ny logistika izahay
Dingana 1. Hanova ny sanda mety ho isan-karazany
Nandritra ny fanovana ny asa Π² fiasan'ny valin'ny logistika Avelantsika irery ny mpanadihady momba ny crΓ©dit fa handeha hitsidika ireo mpikirakira boky. Tsia, mazava ho azy, tsy hametraka filokana isika, izay rehetra mahaliana antsika dia ny dikan'ny teny, ohatra, ny vintana dia 4 noho 1. Ny vintana, mahazatra ny mpiloka rehetra, dia ny tahan'ny "fahombiazana" amin'ny " tsy fahombiazanaβ. Amin'ny teny mety, ny odds dia ny mety hitrangan'ny hetsika iray mizarazara amin'ny mety ho tsy hitranga. Andeha hosoratana ny raikipohy momba ny mety hisian'ny hetsika iray :
izay - ny mety hisian'ny hetsika iray, - ny mety hisian'ny hetsika TSY nitranga
Ohatra, raha mitovy amin'ny hazakazaka ny mety hisian'ny soavaly tanora sy matanjaka ary milalao miaraka amin'ny anaram-bositra hoe "Veterok" handresy vehivavy antitra sy manjavozavo antsoina hoe "Matilda". , dia ny mety ho fahombiazana ho an'ny "Veterok". ΠΊ ary ny mifamadika amin'izany, ny fahafantarana ny mety, dia tsy ho sarotra amintsika ny kajy ny mety :
Noho izany, nianatra ny "nandika" ny mety ho vintana isika, izay maka ny soatoavina Π΄ΠΎ . Andeha isika hanao dingana iray indray ary hianatra ny "mandika" ny mety ho amin'ny tsipika isa manontolo avy Π΄ΠΎ .
Dingana 2. Hanova ny sanda mety ho isan-karazany
Tena tsotra ity dingana ity - andao horaisina ny logaritma amin'ny fifanoherana mankany amin'ny fototry ny laharan'i Euler ary mahazo izahay:
Fantatsika izao fa raha , dia kajy ny sandany dia ho tena tsotra ary, ankoatra izany, dia tokony ho tsara: . Marina izany.
Noho ny fahalianana dia andeha hojerentsika hoe ahoana raha , dia manantena ny hahita sanda ratsy isika . Manamarina izahay: . Marina izany.
Ankehitriny dia fantatsika ny fomba hamadihana ny sanda mety ho avy Π΄ΠΎ miaraka amin'ny tsipika isa manontolo avy amin'ny Π΄ΠΎ . Amin'ny dingana manaraka dia hanao ny mifanohitra amin'izany isika.
Amin'izao fotoana izao, dia manamarika fa mifanaraka amin'ny fitsipiky ny logarithm, mahafantatra ny lanjan'ny asa , azonao atao ny manao kajy ny vintana:
Ity fomba hamaritana ny vintana ity dia hahasoa antsika amin'ny dingana manaraka.
Dingana 3. Andeha isika haka ny formula mba hamaritana
Noho izany dia nianatra izahay, nahafantatra , tadiavo ny sandan'ny asa . Na izany aza, raha ny marina, mila ny mifanohitra amin'izany - ny fahafantarana ny sandany mahita . Mba hanaovana izany, andeha isika hitodika any amin'ny foto-kevitra toy ny inverse odds miasa, araka izay:
Ao amin'ny lahatsoratra dia tsy haka ny formula ambony isika, fa hojerentsika izany amin'ny fampiasana ny isa avy amin'ny ohatra etsy ambony. Fantatsika fa miaraka amin'ny odds 4 noho 1 (), ny mety hisian'ny hetsika dia 0.8 (). Andao hanao fanoloana: . Mifanojo aminβny kajikajy nataontsika teo aloha izany. Andao handroso.
Tamin'ny dingana farany dia nanatsoaka hevitra izahay , izay midika fa afaka manao fanoloana ianao amin'ny fiasa inverse odds. Mahazo izahay:
Zarao amin'ny , Avy eo:
Raha sanatria, mba hahazoana antoka fa tsy nanao fahadisoana na taiza na taiza izahay, dia hanao fisavana kely indray izahay. Amin'ny dingana 2, izahay ho an'ny nanapa-kevitra izany . Avy eo, manolo ny sandany ao amin'ny asa famaliana logistika, manantena izahay fa hahazo . Manolo ary mahazo:
Arahabaina, ry mpamaky malala, vao avy nahazo sy nanandrana ny fiasan'ny valin'ny logistika izahay. Andeha hojerentsika ny sarin'ny asa.
Grapika 3 "Fantom-pamaliana logistika"
Kaody ho an'ny fanaovana ny grafika
import math
def logit (f):
return 1/(1+math.exp(-f))
f = np.arange(-7,7,0.05)
p = []
for i in f:
p.append(logit(i))
fig, axes = plt.subplots(figsize = (14,6), dpi = 80)
plt.plot(f, p, color = 'grey', label = '$ 1 / (1+e^{-w^Tx_i})$')
plt.xlabel('$f(w,x_i) = w^Tx_i$', size = 16)
plt.ylabel('$p_{i+}$', size = 16)
plt.legend(prop = {'size': 14})
plt.show()
Ao amin'ny literatiora dia azonao atao koa ny mahita ny anaran'ity asa ity ho ΡΠΈΠ³ΠΌΠΎΠΈΠ΄-ΡΡΠ½ΠΊΡΠΈΡ. Ny grafika dia mampiseho mazava tsara fa ny fiovana lehibe amin'ny mety ho zavatra iray ao anatin'ny kilasy dia miseho ao anatin'ny elanelana kely. , avy any Π΄ΠΎ .
Manoro hevitra aho ny hiverina any amin'ny mpandinika ny crΓ©dit ary hanampy azy hanao kajy ny mety ho famerenan'ny findramam-bola, raha tsy izany dia mety ho tavela tsy misy bonus izy :)
Tabilao 2 βNy mety ho mpampindram-bolaβ
Code amin'ny famoronana latabatra
proba = []
for i in df['f(w,x)']:
proba.append(round(logit(i),2))
df['Probability'] = proba
df[['The borrower', 'Salary', 'Payment', 'f(w,x)', 'Decision', 'Probability']]
Noho izany, nofaritanay ny mety hisian'ny famerenam-bola. Amin'ny ankapobeny dia toa marina izany.
Eny tokoa, ny mety hisian'ny Vasya, miaraka amin'ny karama 120.000 RUR, dia afaka manome 3.000 RUR ho an'ny banky isam-bolana dia manakaiky ny 100%. Amin'ny lafiny iray, tsy maintsy takatsika fa ny banky dia afaka manome fampindramam-bola ho an'i Lesha raha toa ny politikan'ny banky dia manome, ohatra, amin'ny fampindramam-bola amin'ny mpanjifa amin'ny mety hisian'ny famerenam-bola mihoatra ny, lazao, 0.3. Amin'ity tranga ity, ny banky dia hamorona tahiry lehibe kokoa amin'ny mety ho fatiantoka.
Tsara homarihina koa fa ny tahan'ny karama amin'ny fandoavam-bola farafahakeliny 3 ary miaraka amin'ny margin 5.000 RUR dia nalaina avy amin'ny valindrihana. Noho izany, tsy afaka mampiasa ny vector ny lanja amin'ny endriny voalohany isika . Nila nahena be ny coefficients, ary tamin'ity tranga ity dia nozarainay tamin'ny 25.000 ny coefficient tsirairay, izany hoe, raha ny marina, dia nanitsy ny vokatra. Saingy natao manokana izany mba hanatsorana ny fahatakarana ny fitaovana tamin'ny dingana voalohany. Eo amin'ny fiainana dia tsy mila mamorona sy manitsy ny coefficient isika, fa hahita azy ireo. Ao amin'ny fizarana manaraka amin'ny lahatsoratra dia haka ny equations izay nofantenana ny masontsivana .
04. Fomba efamira faran'izay kely indrindra hamaritana ny vektoran'ny lanja ao amin'ny asa famaliana logistika
Efa fantatsika ity fomba ity amin'ny fifantenana vΓ©ctor amin'ny lanja , as fomba efamira kely indrindra (LSM) ary raha ny marina, nahoana isika no tsy mampiasa izany amin'ny olana fanasokajiana binary? Eny tokoa, tsy misy manakana anao tsy hampiasa MNC, ity fomba ity amin'ny olana fanasokajiana ihany no manome valiny tsy dia marina loatra Fatiantoka Logistika. Misy fototra ara-teorika momba izany. Andeha hojerentsika aloha ny ohatra tsotra iray.
Andao atao hoe modely (mampiasa MSE ΠΈ Fatiantoka Logistika) dia efa nanomboka nisafidy ny vector ny lanja ary natsahatray ny kajy tamin'ny dingana sasany. Tsy maninona na eo afovoany, na amin'ny farany na any am-piandohana, ny zava-dehibe dia ny hoe efa manana soatoavina vitsivitsy amin'ny veteran'ny lanja isika ary andeha horaisintsika fa amin'ity dingana ity, ny vector ny lanja. ho an'ny modely roa dia tsy misy fahasamihafana. Avy eo dia raiso ireo lanja vokatr'izany ary asolo azy ireo fiasan'ny valin'ny logistika () ho an'ny zavatra sasany an'ny kilasy . Mandinika tranga roa isika rehefa, mifanaraka amin'ny vector voafantina lanja, ny modely misy antsika dia tena diso ary ny mifamadika amin'izany - ny modely dia tena matoky fa an'ny kilasy ilay zavatra. . Andeha hojerentsika hoe inona ny lamandy havoaka rehefa mampiasa MNC ΠΈ Fatiantoka Logistika.
Kaody kajy sazy miankina amin'ny asa fatiantoka ampiasaina
# ΠΊΠ»Π°ΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΠ°
y = 1
# Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΡ ΠΎΡΠ½Π΅ΡΠ΅Π½ΠΈΡ ΠΎΠ±ΡΠ΅ΠΊΡΠ° ΠΊ ΠΊΠ»Π°ΡΡΡ Π² ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΈΠΈ Ρ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠ°ΠΌΠΈ w
proba_1 = 0.01
MSE_1 = (y - proba_1)**2
print 'Π¨ΡΡΠ°Ρ MSE ΠΏΡΠΈ Π³ΡΡΠ±ΠΎΠΉ ΠΎΡΠΈΠ±ΠΊΠ΅ =', MSE_1
# Π½Π°ΠΏΠΈΡΠ΅ΠΌ ΡΡΠ½ΠΊΡΠΈΡ Π΄Π»Ρ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΡ f(w,x) ΠΏΡΠΈ ΠΈΠ·Π²Π΅ΡΡΠ½ΠΎΠΉ Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΠΈ ΠΎΡΠ½Π΅ΡΠ΅Π½ΠΈΡ ΠΎΠ±ΡΠ΅ΠΊΡΠ° ΠΊ ΠΊΠ»Π°ΡΡΡ +1 (f(w,x)=ln(odds+))
def f_w_x(proba):
return math.log(proba/(1-proba))
LogLoss_1 = math.log(1+math.exp(-y*f_w_x(proba_1)))
print 'Π¨ΡΡΠ°Ρ Log Loss ΠΏΡΠΈ Π³ΡΡΠ±ΠΎΠΉ ΠΎΡΠΈΠ±ΠΊΠ΅ =', LogLoss_1
proba_2 = 0.99
MSE_2 = (y - proba_2)**2
LogLoss_2 = math.log(1+math.exp(-y*f_w_x(proba_2)))
print '**************************************************************'
print 'Π¨ΡΡΠ°Ρ MSE ΠΏΡΠΈ ΡΠΈΠ»ΡΠ½ΠΎΠΉ ΡΠ²Π΅ΡΠ΅Π½Π½ΠΎΡΡΠΈ =', MSE_2
print 'Π¨ΡΡΠ°Ρ Log Loss ΠΏΡΠΈ ΡΠΈΠ»ΡΠ½ΠΎΠΉ ΡΠ²Π΅ΡΠ΅Π½Π½ΠΎΡΡΠΈ =', LogLoss_2
Raharaha misy diso - ny modely dia manome zavatra ho an'ny kilasy miaraka amin'ny mety ho 0,01
Sazy amin'ny fampiasana MNC dia ho:
Sazy amin'ny fampiasana Fatiantoka Logistika dia ho:
Raharaha matoky tena - ny modely dia manome zavatra ho an'ny kilasy miaraka amin'ny mety ho 0,99
Sazy amin'ny fampiasana MNC dia ho:
Sazy amin'ny fampiasana Fatiantoka Logistika dia ho:
Ity ohatra ity dia mampiseho tsara fa raha misy hadisoana lehibe ny asa very Very Log manasazy ny modely be lavitra noho ny MSE. Andeha hojerentsika izao ny fototra teorika amin'ny fampiasana ny asa fatiantoka Very Log amin'ny olana fanasokajiana.
05. Fomba mety indrindra sy ny fihemorana ara-pitaovana
Araka ny nampanantenaina tany am-piandohana, dia feno ohatra tsotra ilay lahatsoratra. Ao amin'ny studio dia misy ohatra iray hafa sy vahiny taloha - mpampindram-bola amin'ny banky: Vasya, Fedya ary Lesha.
Raha sanatria, alohan'ny hamolavolana ny ohatra, avelao aho hampahatsiahy anao fa eo amin'ny fiainana dia miatrika santionany fanofanana zavatra an'arivony na an-tapitrisany misy endri-javatra am-polony na an-jatony isika. Na izany aza, eto dia raisina ny isa mba ho mora amin'ny lohan'ny mpahay siansa momba ny data.
Andao hiverina amin'ny ohatra. Andeha hojerentsika fa nanapa-kevitra ny talen'ny banky ny hanome fampindramam-bola ho an'ny olona rehetra sahirana, na dia eo aza ny zava-misy fa ny algorithm dia nilaza taminy mba tsy hamoaka izany ho an'i Lesha. Ary ankehitriny dia ampy ny fotoana ary fantatsika hoe iza amin'ireo mahery fo telo no nanefa ny trosa ary iza no tsy nandoa. Inona no andrasana: Naverin'i Vasya sy Fedya ilay fampindramam-bola, fa i Lesha kosa tsy nanao izany. Andeha hojerentsika izao fa ho santionany fanofanana vaovao ho antsika io vokatra io ary, miaraka amin'izay koa, dia toy ny hoe nanjavona avokoa ny angon-drakitra rehetra momba ireo anton-javatra misy fiantraikany amin'ny mety handoavana ny trosa (karaman'ny mpindram-bola, ny haben'ny fandoavam-bola isam-bolana). Avy eo, intuitively, dia afaka mihevitra fa ny mpindram-bola fahatelo rehetra dia tsy mamerina ny findramam-bola amin'ny banky, na amin'ny teny hafa, ny mety hisian'ny mpampindram-bola manaraka hamerina ny trosa. . Ity eritreritra intuitive ity dia manana fanamafisana ara-teorika ary mifototra amin'ny fomba mety indrindra, matetika ao aminβny literatiora no iantsoana azy io fitsipika ambony indrindra mety.
Voalohany, andeha hofantarintsika ny fitaovana ara-kevitra.
Sampling mety dia ny mety hisian'ny santionany toy izany, ny fahazoana fandinihana/vokatra toy izany, i.e. ny vokatry ny mety hahazoana tsirairay ny santionany vokatra (ohatra, na ny fampindramam-bola Vasya, Fedya sy Lesha naverina na tsy naverina tamin'ny fotoana iray ihany).
Asa mety ΡΠ²ΡΠ·ΡΠ²Π°Π΅Ρ ΠΏΡΠ°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²ΡΠ±ΠΎΡΠΊΠΈ ΡΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΡ.
Amin'ny tranga misy antsika, ny santionany fanofanana dia rafitra Bernoulli ankapobeny, izay tsy misy afa-tsy sanda roa ny fari-piadidiana kisendrasendra: na . Noho izany, ny mety ho santionany dia azo soratana ho toy ny asa mety ho an'ny parameter toy izao manaraka izao:
Ny fidirana etsy ambony dia azo adika toy izao manaraka izao. Mitovy amin'ny mety ho fiaraha-mientan'i Vasya sy Fedya ny findramam-bola , ny mety ho TSY handoavana ny trosa i Lesha dia mitovy amin'ny (satria TSY ny famerenam-bola no nitranga), noho izany dia mitovy ny mety hitrangan'ny hetsika telo. .
Fomba mety indrindra dia fomba fanombanana paramètre tsy fantatra amin'ny alà lan'ny fampitomboana asa mety. Amin'ny toe-javatra misy antsika dia mila mahita lanja toy izany isika amin izay mahatratra ny faratampony.
Avy aiza ny tena hevitra - mba hitady ny sandan'ny paramètre tsy fantatra izay mahatratra ny fara-tampony ny asa mety hitranga? Ny niandohan'ny hevitra dia avy amin'ny hevitra fa ny santionany no hany loharanom-pahalalana azontsika momba ny mponina. Ny zavatra rehetra fantatsika momba ny mponina dia aseho amin'ny santionany. Noho izany, ny hany azontsika lazaina dia ny santionany no taratry ny tena marina momba ny mponina misy antsika. Noho izany, mila mitady paramètre izay mety ho azo inoana indrindra ny santionany misy.
Mazava ho azy fa miatrika olan'ny optimization izay ilaintsika hahitana ny teboka faran'ny asa iray. Mba hahitana ny teboka faratampony dia ilaina ny mandinika ny fepetran'ny filaharana voalohany, izany hoe, mampitovy ny derivative ny asa amin'ny aotra ary mamaha ny equation amin'ny mari-pamantarana irina. Na izany aza, ny fikarohana ny derivative ny vokatra amin'ny lafin-javatra maro dia mety ho asa lava, mba hisorohana izany, dia misy teknika manokana - mifindra amin'ny logarithm. asa mety. Nahoana no azo atao ny tetezamita toy izany? Aoka isika handinika ny zava-misy fa tsy mitady ny extremum ny asa mihitsy, ary ny teboka farany, izany hoe ny sandan'ny paramètre tsy fantatra amin izay mahatratra ny faratampony. Rehefa mifindra amin'ny logaritma dia tsy miova ny teboka farany (na dia tsy mitovy aza ny extremum), satria ny logarithma dia fiasa monotonika.
Andeha isika, araka ny voalaza etsy ambony, hanohy hampivelatra ny ohatra asehontsika amin'ny fampindramam-bola avy amin'i Vasya, Fedya ary Lesha. Andeha aloha hiroso amin'ny logarithm ny mety ho asa:
Ankehitriny dia afaka manavaka mora foana ny fomba fiteny amin'ny :
Ary farany, diniho ny fepetra filaharana voalohany - ampitovintsika amin'ny zero ny derivative ny asa:
Noho izany, ny tombantombanay intuitive momba ny mety hisian'ny famerenam-bola nohamarinina ara-teorika.
Tsara, fa inona no tokony hataontsika amin'ity fampahalalana ity izao? Raha heverina fa tsy mamerina ny vola any aminβny banky ny mpindrana fahatelo rehetra, dia tsy maintsy ho bankirompitra ity farany. Marina izany, fa rehefa manombana ny mety ho famerenam-bola mitovy amin'ny Tsy noraharahainay ny anton'ny fandoavana ny trosa: ny karaman'ny mpindram-bola sy ny haben'ny fandoavam-bola isam-bolana. Aoka hotsaroantsika fa efa nanao kajy teo aloha ny mety famerenan'ny mpanjifa tsirairay ny findramam-bola, amin'ny fiheverana ireo lafin-javatra ireo. Lojika fa nahazo probabilities tsy mitovy amin'ny mitovy foana .
Andeha hofaritana ny mety ho santionany:
Kaody ho an'ny kajy ny mety ho santionany
from functools import reduce
def likelihood(y,p):
line_true_proba = []
for i in range(len(y)):
ltp_i = p[i]**y[i]*(1-p[i])**(1-y[i])
line_true_proba.append(ltp_i)
likelihood = []
return reduce(lambda a, b: a*b, line_true_proba)
y = [1.0,1.0,0.0]
p_log_response = df['Probability']
const = 2.0/3.0
p_const = [const, const, const]
print 'ΠΡΠ°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²ΡΠ±ΠΎΡΠΊΠΈ ΠΏΡΠΈ ΠΊΠΎΠ½ΡΡΠ°Π½ΡΠ½ΠΎΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠΈ p=2/3:', round(likelihood(y,p_const),3)
print '****************************************************************************************************'
print 'ΠΡΠ°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±ΠΈΠ΅ Π²ΡΠ±ΠΎΡΠΊΠΈ ΠΏΡΠΈ ΡΠ°ΡΡΠ΅ΡΠ½ΠΎΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠΈ p:', round(likelihood(y,p_log_response),3)
Santionany amin'ny sanda tsy miova :
Santionany ny mety ho santionany rehefa manao kajy ny mety ho famerenan'ny findramam-bola amin'ny kajikajy lafin-javatra :
Ny mety hisian'ny santionany amin'ny mety ho kajy miankina amin'ny anton-javatra dia nivadika ho ambony kokoa noho ny mety manana sanda mety tsy tapaka. Inona no dikan'ity? Midika izany fa ny fahalalana momba ny anton-javatra dia nahafahana nifidy tsara kokoa ny mety ho famerenan'ny trosa ho an'ny mpanjifa tsirairay. Noho izany, rehefa mamoaka ny fampindramam-bola manaraka dia mety kokoa ny mampiasa ny maodely natolotra eo amin'ny faran'ny fizarana faha-3 amin'ny lahatsoratra amin'ny fanombanana ny mety ho famerenana trosa.
Fa avy eo, raha tiantsika ny maximize asa santionany mety, dia maninona raha mampiasa algorithm sasany izay hamokatra probabilities ho an'i Vasya, Fedya ary Lesha, ohatra, mitovy amin'ny 0.99, 0.99 ary 0.01. Angamba ny algorithm toy izany dia hahomby tsara amin'ny santionany fanofanana, satria hitondra ny sandan'ny santionany ho akaiky kokoa , fa, voalohany, ny algorithm toy izany dia mety ho sarotra amin'ny fahaiza-manaon'ny ankapobeny, ary faharoa, ity algorithm ity dia azo antoka fa tsy ho linear. Ary raha toa ka tsy tafiditra ao anatin'ny drafitra amin'ity lahatsoratra ity ny fomba hiadiana amin'ny overtraining (fahaiza-manao ankapobeny mitovy amin'izany), dia andeha hojerentsika amin'ny antsipiriany bebe kokoa ny teboka faharoa. Mba hanaovana izany, mamaly fanontaniana tsotra fotsiny. Mety hitovy ve ny mety ho fandoavan'i Vasya sy Fedya ny fampindramam-bola, amin'ny fiheverana ny anton-javatra fantatray? Raha ny fomba fijery lojika feo, mazava ho azy fa tsy, tsy afaka. Noho izany dia handoa 2.5% amin'ny karamany isam-bolana i Vasya hamerenana ny trosa, ary Fedya - efa ho 27,8%. Ao amin'ny grafika 2 "fanasokajiana mpanjifa" dia hitantsika fa lavitra lavitra ny tsipika manasaraka ny kilasy noho i Fedya i Vasya. Ary farany, fantatsika fa ny asa ho an'i Vasya sy Fedya dia maka sanda samihafa: 4.24 ho an'i Vasya ary 1.0 ho an'i Fedya. Ankehitriny, raha i Fedya, ohatra, dia nahazo baiko lehibe kokoa na nangataka fampindramam-bola kely kokoa, dia ho toy izany koa ny mety handoavana ny trosa ho an'i Vasya sy Fedya. Amin'ny teny hafa, ny fiankinan-doha amin'ny tsipika dia tsy azo ambakaina. Ary raha tena kajy ny mety , ary tsy nanala azy ireo tamin'ny rivotra manify, dia afaka nilaza soa aman-tsara izahay fa ny soatoavinay Ny tsara indrindra dia mamela antsika hanombantombana ny mety ho famerenan'ny mpampindram-bola tsirairay, fa satria nanaiky ny hihevitra fa ny famaritana ny coefficients dia natao araka ny fitsipika rehetra, avy eo dia hihevitra isika - ny coefficients dia mamela antsika hanome tombanana tsara kokoa ny mety :)
Na izany aza, mihemotra isika. Ato amin'ity fizarana ity dia mila mahatakatra ny fomba hamaritana ny vector ny lanja , izay ilaina amin'ny fanombanana ny mety ho famerenan'ny mpampindram-bola tsirairay.
Andeha isika hamintina fohifohy miaraka amin'ny arsenal izay alehantsika mitady odds :
1. Heverintsika fa ny fifandraisana misy eo amin'ny fari-pitsipika kendrena (sanda vinavina) sy ny anton-javatra misy fiantraikany amin'ny vokatra dia linear. Noho izany antony izany no ampiasaina asa fihemorana linear tsara fanahy , ny tsipika izay mizara zavatra (mpanjifa) ho kilasy ΠΈ na (mpanjifa afaka mamerina ny findramam-bola sy ireo izay tsy afaka). Amin'ny tranga misy antsika dia manana endrika ny equation .
2. Mampiasa izahay inverse logit asa tsara fanahy hamaritana ny mety hisian'ny zavatra iray ao amin'ny kilasy iray .
3. Heverinay ho toy ny fampiharana ny fanazaran-tena amin'ny ankapobeny Bernoulli schemes, izany hoe, ho an'ny zavatra tsirairay dia misy fari-pahalalana kisendrasendra, izay misy ny mety (ny azy ho an'ny zavatra tsirairay) dia maka ny sanda 1 ary miaraka amin'ny mety - 0.
4. Fantatsika izay tokony hataontsika ambony indrindra asa santionany mety amin'ny fiheverana ny anton-javatra ekena mba hahatonga ny santionany azo antoka indrindra. Raha lazaina amin'ny teny hafa, dia mila mifidy masontsivana izay ho azo itokisana indrindra ny santionany. Amin'ny tranga misy antsika, ny parameter voafantina dia ny mety hisian'ny famerenam-bola , izay miankina amin'ny coefficient tsy fantatra . Noho izany dia mila mahita vector ny lanja toy izany isika , izay mety ho ambony indrindra ny santionany.
5. Fantatsika izay tokony ho ambony indrindra santionany mety asa afaka mampiasa fomba mety indrindra. Ary fantatsika ny hafetsena rehetra mba hiasa amin'ity fomba ity.
Toy izao ny fandehany fa dingana maromaro :)
Tsarovy izao fa tany am-piandohan'ny lahatsoratra dia te hahazo karazana fatiantoka roa izahay Fatiantoka Logistika miankina amin'ny fomba fanondroana kilasy zavatra. Nitranga izany fa amin'ny olana fanasokajiana amin'ny kilasy roa, ny kilasy dia lazaina ho ΠΈ na . Miankina amin'ny fanamarihana, ny vokatra dia hanana asa fatiantoka mifanaraka amin'izany.
Tranga 1. Fanasokajiana ny zavatra ho ΠΈ
Talohan'izay, rehefa mamaritra ny mety hisian'ny santionany, izay ny mety ho famerenan'ny trosan'ny mpampindram-bola dia kajy mifototra amin'ny anton-javatra sy nomena coefficients , nampiharinay ny formula:
Raha ny marina dia ny dikany asa famaliana logistika ho an'ny vector ny lanja
Dia tsy misy misakana antsika tsy hanoratra ny santionany mety ho asa toy izao manaraka izao:
Mitranga fa indraindray sarotra ho an'ny mpandinika vaovao sasany ny hahatakatra avy hatrany ny fomba fiasan'ity asa ity. Andeha hojerentsika ohatra fohy 4 izay hanazava ny zava-drehetra:
1. raha (izany hoe, araka ny santionany fanofanana, ny zavatra dia an'ny kilasy +1), ary ny algorithm mamaritra ny mety hanasokajiana zavatra iray amin'ny kilasy iray mitovy amin'ny 0.9, dia hokajiana toy izao manaraka izao ity santionan'ny santionany ity:
2. raha ary , dia ho toy izao ny kajy:
3. raha ary , dia ho toy izao ny kajy:
4. raha ary , dia ho toy izao ny kajy:
Miharihary fa ny mety ho asa dia ho ambony indrindra amin'ny tranga 1 sy 3 na amin'ny tranga ankapobeny - miaraka amin'ny sanda voatondro tsara amin'ny mety ho fanendrena zavatra iray amin'ny kilasy. .
Noho ny zava-misy fa rehefa mamaritra ny mety ho fanendrena zavatra iray kilasy Ny coefficients ihany no tsy fantatsika , dia hitady azy ireo isika. Araka ny voalaza etsy ambony, ity dia olan'ny fanatsarana izay ilaintsika aloha ny fitadiavana ny derivative amin'ny mety ho asa mifandraika amin'ny vector ny lanja. . Na izany aza, misy dikany aloha ny manatsotra ny asa ho an'ny tenantsika: hitady ny derivative amin'ny logarithm isika. asa mety.
Nahoana aorian'ny logaritma, in fiasan'ny fahadisoana ara-logistika, novanay ny famantarana avy amin'ny amin'ny . Tsotra ny zava-drehetra, satria amin'ny olana amin'ny fanombanana ny kalitaon'ny modely dia mahazatra ny manamaivana ny sandan'ny asa iray, ampitomboinay ny ilany havanana amin'ny teny. ary arak'izany, raha tokony ho maximize, dia manamaivana ny asa.
Raha ny marina, amin'izao fotoana izao, eo imasonao, ny fiasan'ny fatiantoka dia nipoitra mafy - Fatiantoka Logistika ho an'ny fiofanana misy kilasy roa: ΠΈ .
Ankehitriny, mba hahitana ny coefficients, mila mitady ny derivative fotsiny isika fiasan'ny fahadisoana ara-logistika ary avy eo, amin'ny fampiasana fomba fanatsarana isa, toy ny gradient gradient na stochastic gradient descent, safidio ny coefficient tsara indrindra. . Saingy, raha jerena ny habetsaky ny lahatsoratra, dia soso-kevitra ny hanatanteraka ny fanavahana amin'ny tenanao manokana, na angamba ho lohahevitra ho an'ny lahatsoratra manaraka miaraka amin'ny aritmetika be dia be tsy misy ohatra amin'ny antsipiriany toy izany.
Tranga 2. Fanasokajiana ny zavatra ho ΠΈ
Ny fomba fiasa eto dia hitovy amin'ny kilasy ΠΈ , fa ny lalana mankany amin'ny famoahana ny asa very Fatiantoka Logistika, dia ho voaravaka kokoa. Andeha isika hanomboka. Ho an'ny asa mety hitranga dia hampiasa ny operator izahay "raha... dia..."... Izany hoe, raha An'ny kilasy ny zavatra th , dia mampiasa ny probabilitΓ© ny kajy ny mety ho santionany , raha an'ny kilasy ilay zavatra , dia soloinay amin'ny mety . Toy izao ny endriky ny mety ho asa:
Andeha hofaritantsika amin'ny rantsan-tanana ny fomba fiasan'izy io. Andeha isika handinika tranga 4:
1. raha ΠΈ , dia "handeha" ny mety ho santionany
2. raha ΠΈ , dia "handeha" ny mety ho santionany
3. raha ΠΈ , dia "handeha" ny mety ho santionany
4. raha ΠΈ , dia "handeha" ny mety ho santionany
Mazava ho azy fa amin'ny tranga 1 sy 3, rehefa voafaritry ny algorithm araka ny tokony ho izy ny probabilities, asa mety dia ho ambony indrindra, izany hoe izany indrindra no tiana ho azo. Na izany aza, ity fomba fiasa ity dia somary manahirana ary manaraka dia hodinihintsika ny fanamarihana kely kokoa. Fa aloha, andeha hojerentsika ny logarithm ny mety ho asa miaraka amin'ny fiovan'ny famantarana, satria izao no hanamaivana izany.
Aleo soloina teny :
Andao hanatsotra ny teny marina eo ambanin'ny logaritma amin'ny fampiasana teknika arithmetika tsotra ary mahazo:
Fotoana izao hialana amin'ny mpandraharaha "raha... dia...". Mariho fa rehefa zavatra iray an'ny kilasy , avy eo amin'ny fitenenana eo ambanin'ny logaritma, ao amin'ny denominator, natsangana ho aminβny fahefana , raha an'ny kilasy ilay zavatra , dia atsangana ho eo amin'ny fahefana ny $e$ . Noho izany, ny fanamarihana momba ny mari-pahaizana dia azo tsotsotra amin'ny fampifangaroana ireo tranga roa ireo ho iray: ... dia fiasan'ny fahadisoana ara-logistika dia handray ny endrika:
Mifanaraka amin'ny fitsipiky ny logaritma, mamadika ny ampahany isika ary mametraka ny famantarana ""(minus) ho an'ny logarithm dia mahazo:
Ity ny asa fatiantoka fatiantoka ara-pitaovana, izay ampiasaina amin'ny seta fanofanana miaraka amin'ireo zavatra voatendry ho an'ny kilasy: ΠΈ .
Eny ary, amin'izao fotoana izao dia miala sasatra aho ary mamarana ny lahatsoratra.
Fitaovana fanampiny
1. boky sy gazety
1) Famakafakana fihemorana nampiharina / N. Draper, G. Smith - 2nd ed. β M.: Finance and Statistics, 1986 (dika avy aminβny teny anglisy)
2) Theory probabilitΓ© sy statistika matematika / V.E. Gmurman - andiany faha-9. - M.: Higher School, 2003
3) Theory probability / N.I. Chernova - Novosibirsk: Novosibirsk State University, 2007
4) Business analytics: from data to knowledge / Paklin N. B., Oreshkov V. I. - 2nd ed. β Saint-PΓ©tersbourg: Peter, 2013
5) Data Science Data science from scratch / Joel Gras - St. Petersburg: BHV Petersburg, 2017
6) Statistika azo ampiharina ho an'ny manam-pahaizana momba ny Siansa Data / P. Bruce, E. Bruce - St. Petersburg: BHV Petersburg, 2018
2. Lectures, courses (video)
1)
2)
3)
4)
5)
3. Loharano amin'ny Internet
1)
2)
4)
7)
Source: www.habr.com