Linear regression na ụzọ maka mgbake ya

Linear regression na ụzọ maka mgbake ya
isi: xkcd

Nkwụghachi azụ Linear bụ otu n'ime algọridim bụ isi maka ọtụtụ mpaghara metụtara nyocha data. Ihe kpatara nke a doro anya. Nke a bụ algọridim dị mfe ma dị mfe nghọta, nke nyere aka n'iji ya eme ihe maka ọtụtụ iri iri, ma ọ bụrụ na ọ bụghị ọtụtụ narị afọ. Echiche bụ na anyị na-eche a linear ndabere nke otu mgbanwe na a set nke ndị ọzọ variables, na mgbe ahụ na-agbalị iweghachi ndabere a ndabere.

Ma isiokwu a abụghị maka iji linear regression dozie nsogbu ndị bara uru. N'ebe a, anyị ga-atụle atụmatụ ndị na-adọrọ mmasị nke mmejuputa algọridim na-ekesa maka mgbake ya, nke anyị zutere mgbe ị na-ede modul mmụta igwe na Apache Ignite. Obere mgbakọ na mwepụ, mmụta igwe, na mgbakọ na-ekesa nwere ike inyere gị aka ịchọpụta otu esi eme nkwụghachi azụ n'ahịrị ọbụlagodi mgbe ekesara data gị n'ofe ọtụtụ puku ọnụ.

Kedu ihe anyị na-ekwu?

Anyị na-eche ihu ọrụ nke iweghachi ndabere linear. Dị ka data ntinye, a na-enye otu vectors nke mgbanwe ndị a na-eche na ha nwere onwe ha, nke ọ bụla jikọtara ya na uru ụfọdụ nke mgbanwe dabere. Enwere ike igosipụta data a n'ụdị matrices abụọ:

Linear regression na ụzọ maka mgbake ya

Ugbu a, ebe ọ bụ na a na-eche na ịdabere na ya, ma, ọzọ, linear, anyị ga-ede echiche anyị n'ụdị ngwaahịa nke matrices (iji mee ka ndekọ dị mfe, ebe a na n'okpuru ebe a na-eche na a na-ezobe free okwu nke nha nha n'azụ. Linear regression na ụzọ maka mgbake ya, na kọlụm ikpeazụ nke matriks Linear regression na ụzọ maka mgbake ya nwere nkeji):

Linear regression na ụzọ maka mgbake ya

Ọ na-ada ụda dị ka usoro nke usoro nha anya ahịrị, ọ bụghị ya? Ọ dị ka, ma o yikarịrị ka ọ gaghị enwe ihe ngwọta maka usoro nhazi dị otú ahụ. Ihe kpatara nke a bụ mkpọtụ, nke dị na ihe fọrọ nke nta ka ọ bụrụ ezigbo data ọ bụla. Ihe ọzọ kpatara ya nwere ike ịbụ enweghị ịdabere na linear dị ka nke a, nke nwere ike ịlụso ya ọgụ site n'iwebata mgbanwe ndị ọzọ na-adabereghị na nke mbụ. Tụlee ihe atụ a:
Linear regression na ụzọ maka mgbake ya
isi: Wikipedia

Nke a bụ ihe atụ dị mfe nke nlọghachi azụ nke na-egosi njikọ nke otu mgbanwe (n'akụkụ axis Linear regression na ụzọ maka mgbake ya) site na mgbanwe ọzọ (n'akụkụ axis Linear regression na ụzọ maka mgbake ya). Ka usoro nke nha nha nhata kwekọrọ na ihe atụ a nwere ngwọta, isi ihe niile ga-edinarịrị kpọmkwem n'otu ahịrị kwụ ọtọ. Mana nke ahụ abụghị eziokwu. Ma ha anaghị agha ụgha n'otu ahịrị kwụ ọtọ kpọmkwem n'ihi mkpọtụ (ma ọ bụ n'ihi na echiche nke mmekọrịta kwụ ọtọ ezighi ezi). Ya mere, iji weghachi njikọ linear site na ezigbo data, ọ na-adịkarị mkpa ịmebata otu echiche ọzọ: data ntinye nwere mkpọtụ na mkpọtụ a nwere. nkesa nkịtị. Ị nwere ike ịme echiche banyere ụdị nkesa mkpọtụ ndị ọzọ, ma n'ọtụtụ ọnọdụ ọ bụ nkesa nkịtị ka a na-atụle, nke a ga-atụle n'ihu.

Usoro ohere kacha

Yabụ, anyị chere na ọnụnọ nke mkpọtụ na-ekesa na-enweghị usoro. Kedu ihe ị ga-eme n'ọnọdụ dị otú ahụ? Maka ikpe a na mgbakọ na mwepụ enwere ma ejiri ya mee ihe usoro ohere kachasị. Na nkenke, isi ya dabere na nhọrọ ohere ọrụ na njedebe ya na-esote.

Anyị na-alaghachi na iweghachi mmekọrịta kwụ ọtọ site na data na mkpọtụ nkịtị. Rịba ama na mmekọrịta ahịrị echere bụ atụmanya mgbakọ na mwepụ Linear regression na ụzọ maka mgbake ya nkesa nkịtị dị adị. N'otu oge ahụ, ihe gbasara nke puru omume na Linear regression na ụzọ maka mgbake ya na-ewere otu uru ma ọ bụ ọzọ, dabere na ọnụnọ nke ihe ngosi Linear regression na ụzọ maka mgbake ya, dị ka ndị a:

Linear regression na ụzọ maka mgbake ya

Ka anyị ugbu a dochie kama Linear regression na ụzọ maka mgbake ya и Linear regression na ụzọ maka mgbake ya Ụdị mgbanwe anyị chọrọ bụ:

Linear regression na ụzọ maka mgbake ya

Naanị ihe fọdụrụ bụ ịchọta vector Linear regression na ụzọ maka mgbake ya, nke ihe gbasara nke puru omume a kacha. Iji bulie ọrụ dị otú ahụ, ọ dị mma ibu ụzọ were logarithm ya (logarithm nke ọrụ ahụ ga-eru oke n'otu ebe ọrụ ahụ n'onwe ya):

Linear regression na ụzọ maka mgbake ya

Nke, n'aka nke ya, na-agbadata ibelata ọrụ a:

Linear regression na ụzọ maka mgbake ya

Site n'ụzọ, nke a na-akpọ usoro opekempe square. Ọtụtụ mgbe, a na-ahapụ ihe niile ndị a dị n'elu na usoro a na-eji ya eme ihe.

Nbibi nke QR

Enwere ike ịchọta opekempe nke ọrụ a dị n'elu site na ịchọta ebe gradient nke ọrụ a bụ efu. A ga-edekwa gradient dị ka ndị a:

Linear regression na ụzọ maka mgbake ya

Nbibi nke QR bụ usoro matriks maka idozi nsogbu mbelata ejiri na usoro opekata mpe mpe mpe akwa. N'akụkụ a, anyị na-edegharị akara n'ụdị matrix:

Linear regression na ụzọ maka mgbake ya

Ya mere, anyị na-emebi matriks Linear regression na ụzọ maka mgbake ya na matrices Linear regression na ụzọ maka mgbake ya и Linear regression na ụzọ maka mgbake ya ma mee mgbanwe dị iche iche (a gaghị atụle QR decomposition algorithm n'onwe ya ebe a, naanị ojiji ya n'ihe metụtara ọrụ dị n'aka):

Linear regression na ụzọ maka mgbake ya

Mbido Linear regression na ụzọ maka mgbake ya bụ orthogonal. Nke a na-enye anyị ohere iwepụ ọrụ ahụ Linear regression na ụzọ maka mgbake ya:

Linear regression na ụzọ maka mgbake ya

Ma ọ bụrụ na ị dochie Linear regression na ụzọ maka mgbake ya on Linear regression na ụzọ maka mgbake ya, mgbe ahụ ọ ga-arụ ọrụ Linear regression na ụzọ maka mgbake ya. N'ịtụle nke ahụ Linear regression na ụzọ maka mgbake ya bụ matrix triangular elu, ọ dị ka nke a:

Linear regression na ụzọ maka mgbake ya

Enwere ike idozi nke a site na iji usoro nnọchi. Ihe Linear regression na ụzọ maka mgbake ya dị ka Linear regression na ụzọ maka mgbake ya, ihe mbụ Linear regression na ụzọ maka mgbake ya dị ka Linear regression na ụzọ maka mgbake ya na na.

Ọ dị mma ịmara ebe a na mgbagwoju anya nke algọridim na-esi na ya pụta n'ihi ojiji nke ire ere QR hà nhata. Linear regression na ụzọ maka mgbake ya. Ọzọkwa, n'agbanyeghị eziokwu ahụ bụ na arụ ọrụ ịba ụba nke matrix na-arụkọ ọrụ nke ọma, ọ gaghị ekwe omume ịdepụta ụdị nkesa nke ọma nke algọridim a.

Ọdịda gradient

Mgbe ị na-ekwu maka ibelata ọrụ, ọ dị mkpa mgbe niile icheta usoro nke mgbada gradient (stochastic). Nke a bụ usoro mbelata dị mfe ma dị irè dabere na ịgbakọ gradient nke ọrụ n'otu oge wee tụgharịa ya n'ụzọ megidere gradient. Nzọụkwụ ọ bụla dị otú ahụ na-eweta ngwọta nso na kacha nta. gradient ka na-adị otu ihe:

Linear regression na ụzọ maka mgbake ya

Usoro a bụkwa nke ọma ma kesaa ya n'ihi njirimara linear nke onye ọrụ gradient. Rịba ama na n'usoro a dị n'elu, n'okpuru akara nchikota enwere okwu ndị nọọrọ onwe ha. N'ikwu ya n'ụzọ ọzọ, anyị nwere ike gbakọọ gradient n'onwe ya maka indices niile Linear regression na ụzọ maka mgbake ya site na mbụ ruo Linear regression na ụzọ maka mgbake ya, dị ka nke a, gbakọọ gradient maka indices na Linear regression na ụzọ maka mgbake ya ka Linear regression na ụzọ maka mgbake ya. Mgbe ahụ tinye gradients nke ga-esi na ya pụta. Nsonaazụ nke mgbakwunye ga-abụ otu ihe ahụ ma ọ bụrụ na anyị gbakọọ gradient ozugbo maka indices site na mbụ ruo Linear regression na ụzọ maka mgbake ya. Yabụ, ọ bụrụ na ekesara data ahụ n'etiti ọtụtụ iberibe data, enwere ike ịgbakọ gradient n'onwe ya na ibe ọ bụla, yabụ enwere ike ịchịkọta nsonaazụ nke ngụkọta ndị a iji nweta nsonaazụ ikpeazụ:

Linear regression na ụzọ maka mgbake ya

Site n'echiche mmejuputa iwu, nke a dabara na paradaịs MapReduce. Na nzọụkwụ ọ bụla nke gradient mgbada, a na-eziga ọrụ na ọnụ ọgụgụ data ọ bụla iji gbakọọ gradient, mgbe ahụ, a na-achịkọta gradients ndị a gbakọrọ ọnụ, a na-eji nsonaazụ nke nchikota ha mee ka nsonaazụ ya dịkwuo mma.

N'agbanyeghị ịdị mfe nke mmejuputa ya na ikike ime ihe na MapReduce paradigm, mgbada gradient nwekwara ihe ndọghachi azụ ya. Karịsịa, ọnụ ọgụgụ nke usoro achọrọ iji nweta njikọ dị elu nke ukwuu ma e jiri ya tụnyere ụzọ ndị ọzọ pụrụ iche.

LSQR

LSQR bụ ụzọ ọzọ maka idozi nsogbu ahụ, nke dabara ma maka iweghachi nkwụghachi azụ n'ahịrị yana maka idozi usoro nke nha nha anya. Isi njirimara ya bụ na ọ na-ejikọta uru nke ụzọ matriks na usoro nkwuputa. Enwere ike ịhụ mmejuputa usoro a na ụlọ akwụkwọ abụọ ahụ Onyeka, na na MATLAB. Agaghị enye nkọwa nke usoro a ebe a (nwere ike ịchọta ya na isiokwu LSQR: Algọridim maka nha anya ahịrị na-adịghị ahụkebe yana akụkụ ndị pere mpe). Kama, a ga-egosipụta ụzọ iji megharia LSQR na ogbugbu na gburugburu ebe kesara.

Usoro LSQR dabere na usoro bidiagonalization. Nke a bụ usoro a na-ahụkarị, nke ọ bụla nwere usoro ndị a:
Linear regression na ụzọ maka mgbake ya

Ma ọ bụrụ na anyị na-eche na matriks Linear regression na ụzọ maka mgbake ya A na-ekewa n'ụzọ kwụ ọtọ, mgbe ahụ, enwere ike igosipụta iteration ọ bụla dị ka nzọụkwụ MapReduce abụọ. N'ụzọ dị otú a, ọ ga-ekwe omume iwelata mbufe data n'oge ọ bụla iteration (naanị vectors nwere ogologo ya na ọnụ ọgụgụ nke amaghị):

Linear regression na ụzọ maka mgbake ya

Ọ bụ usoro a ka a na-eji mee ihe mgbe a na-emejuputa regression linear Apache Ignite ML.

nkwubi

Enwere ọtụtụ algọridim mgbake mgbake linear, mana ọ bụghị ha niile nwere ike itinye n'ọrụ n'ọnọdụ niile. Ya mere ire ere QR dị mma maka ngwọta ziri ezi na obere data. Ọdịda gradient dị mfe iji mejuputa ma na-enye gị ohere ịchọta ngwọta dị nso ngwa ngwa. Na LSQR na-ejikọta njirimara kachasị mma nke algọridim abụọ gara aga, ebe ọ bụ na enwere ike kesaa ya, na-agbakọta ngwa ngwa ma e jiri ya tụnyere mgbada gradient, ma na-enye ohere ịkwụsị ngwa ngwa nke algọridim, n'adịghị ka ire ere QR, ịchọta ngwọta dị nso.

isi: www.habr.com

Zụta nnabata ntụkwasị obi maka saịtị nwere nchekwa DDoS, sava VPS VDS 🔥 Zụta ebe nrụọrụ weebụ a pụrụ ịtụkwasị obi na nchekwa DDoS, sava VPS VDS | ProHoster