Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Tha Arthur Khachuyan na eòlaiche ainmeil Ruiseanach ann an giullachd dàta mòr, a stèidhich a’ chompanaidh Social Data Hub (Tazeros Global a-nis). Com-pàirtiche de Sgoil Eaconamachd Àrd-ìre an Oilthigh Rannsachaidh Nàiseanta. Air ullachadh agus air a thaisbeanadh, còmhla ri Sgoil Eaconamachd Àrd-ìre an Oilthigh Rannsachaidh Nàiseanta, bile air Dàta Mòr ann an Comhairle Caidreachas Bhruidhinn e aig Institiùd Curie ann am Paris, Oilthigh Stàite St Petersburg, Oilthigh Feadarail fo Riaghaltas Caidreachas na Ruis, aig Red Apple, International OpenDataDay, RIW 2016, AlfaFuturePeople.

Chaidh an òraid a chlàradh aig an fhèis a-muigh “Geek Picnic” ann am Moscow ann an 2019.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Artair Khachuyan (an dèidh seo - AH): - Mas ann bho àireamh mhòr de ghnìomhachasan - bho chungaidh-leigheis, bho thogail, bho rudeigin, rudeigin, gus am fear a thaghadh far a bheil teicneòlas dàta mòr, ionnsachadh innealan, ionnsachadh domhainn air a chleachdadh gu tric, is dòcha gur e margaidheachd a tha seo. Oir airson na trì bliadhna no dhà mu dheireadh, tha a h-uile dad a tha timcheall oirnn ann an seòrsa de chonaltradh sanasachd a-nis ceangailte gu mionaideach ri mion-sgrùdadh dàta agus gu dìreach ris an rud ris an canar inntleachd fuadain. Mar sin, an-diugh innsidh mi dhut mu dheidhinn seo bho eachdraidh cho fada air falbh ...

Ma smaoinicheas tu air innleachdas fuadain agus cò ris a tha e coltach, is dòcha gur e rudeigin mar sin a th’ ann. Is e an dealbh neònach aon de na lìonraidhean neural a sgrìobh mi o chionn bliadhna gus faighinn a-mach dè an eisimeileachd a bhios mo chù a ’dèanamh - cia mheud uair a dh’ fheumas i a dhol mòr, beag, agus mar a tha e san fharsaingeachd an urra ri na bhios i ag ithe no nach eil?. Is e fealla-dhà a tha seo mu mar a dh’ fhaodadh tuigse fuadain a bhith air a shamhlachadh.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Ach fhathast, smaoinichidh sinn air mar a tha e uile ag obair ann an conaltradh sanasachd. Tha trì dòighean anns am faod algorithms an latha an-diugh ann an sanasachd agus margaidheachd eadar-obrachadh leinn. Tha e soilleir gu bheil a’ chiad sgeulachd ag amas air eòlas a bharrachd fhaighinn agus a thoirt a-mach mu do dheidhinn fhèin agus mise, agus an uairsin ga chleachdadh airson adhbharan math agus nach eil cho math; pearsanachadh an dòigh-obrach airson gach neach sònraichte; Gu nàdarra, às deidh seo, cruthaich iarrtas sònraichte gus na prìomh ghnìomhan targaid a choileanadh agus reic sònraichte a dhèanamh.

A 'cleachdadh teicneòlas, tha iad a' feuchainn ri fuasgladh fhaighinn air duilgheadas conaltraidh èifeachdach

Ma dh’ innseas mi dhut smaoineachadh air na tha Pornhub agus M. Video", dè tha thu a’ smaoineachadh?

Beachdan bhon luchd-èisteachd (air an ainmeachadh an-seo mar C): - Tbh, luchd-èisteachd.

OH: - Is e mo bheachd gur e seo dà àite far am bi daoine a’ tighinn airson seòrsa sònraichte de sheirbheis, no gun can sinn seòrsa sònraichte de bhathar ris. Agus tha an luchd-èisteachd seo eadar-dhealaichte leis nach eil e airson dad innse don neach-reic. Tha i airson a thighinn a-steach agus na rudan anns a bheil ùidh aice fhaighinn ann an cruth soilleir no so-thuigsinn. Gu nàdarra, chan eil duine a 'tighinn gu M. Chan eil bhidio” ag iarraidh conaltradh le luchd-reic sam bith, chan eil e airson tuigsinn, chan eil e airson gin de na ceistean aca a fhreagairt.

Mar sin, tha a 'chiad sgeulachd a' leantainn bho seo uile.

Nuair a nochd teicneòlasan airson eòlas a bharrachd fhaighinn gus conaltradh le neach a sheachnadh. Tha sinn uile dèidheil air nuair a chuireas sinn fios chun bhanca agus tha am banca ag innse dhuinn: “Hello. Alexey, is tusa an neach-dèiligidh VIP againn. A-nis bruidhnidh cuid de shàr mhanaidsear riut. ” Thig thu chun bhanca seo, agus tha manaidsear sònraichte ann as urrainn bruidhinn riut. Gu mì-fhortanach no gu fortanach, chan eil aon chompanaidh fhathast air faighinn a-mach ciamar a gheibh iad mìle manaidsear pearsanta fhastadh airson mìle neach-dèiligidh; agus leis gu bheil a 'mhòr-chuid de na daoine sin a-nis air-loidhne, is e an obair a bhith a' tuigsinn dè an seòrsa neach a tha seo agus mar a nì thu conaltradh ceart leis mus tig e gu goireas sanasachd. Agus mar sin, gu dearbh, tha teicneòlasan air nochdadh a tha a 'feuchainn ri fuasgladh fhaighinn air an duilgheadas seo.

Is e às-tharraing dàta an ola ùr

Smaoinich gu bheil thu nad neach-seilbh air stàile fhlùraichean. Bidh triùir a’ tighinn gad fhaicinn. Tha a 'chiad fhear a' seasamh airson ùine mhòr, a 'cur dàil air, a' feuchainn ri bruidhinn riut, a 'toirt seòrsa de fhlùraichean - bidh thu a' dol ga chòmhdach, a 'dol a-mach a dhèanamh rudeigin ann; tha e a 'ruith air falbh bhon stàile leis a' bhouquet seo - tha thu air do thrì mìle rubles a chall. Carson a thachair e? Chan eil fios agad càil mun neach seo: chan eil fios agad air an eachdraidh aige mu chur an grèim ann am Ministreachd an Taobh a-staigh, chan eil fios agad gur e kleptomaniac a th’ ann agus gu bheil e clàraichte ann an ionad-leigheis inntinn. Carson? A chionn gum faca tu e airson a’ chiad uair, agus chan e anailisiche giùlain a th’ annad.

Tha cuideigin eile a' tighinn... Vitaly. Bidh Vitaly cuideachd a 'toirt ùine mhòr airson a dhèanamh a-mach, tha e ag ràdh, "Uill, tha feum agam air seo agus sin." Agus tha thu ag ràdh ris, "Flùraichean dha mama, ceart?" Agus reic thu bouquet dha.

Is e am bun-bheachd an seo dàta gu leòr fhaighinn a-mach gus tuigse fhaighinn air na tha a dhìth air an neach. Smaoinich a h-uile duine sa bhad air seòrsa de lìonraidhean sanasachd agus mar sin air adhart ...

Is dòcha gu bheil a h-uile duine air an abairt gòrach a chluinntinn gur e “dàta an ola ùr” barrachd air aon uair? Gu cinnteach tha a h-uile duine air cluinntinn. Gu dearbh, dh’ ionnsaich daoine dàta a chruinneachadh o chionn fhada, ach is e a bhith a’ toirt a-mach dàta bhon dàta seo an obair a tha inntleachd fuadain ann am margaidheachd, no seòrsa de dh’ algoirmean staitistigeil, a-nis a’ feuchainn ri fuasgladh. Carson? Oir ma bhruidhneas tu ri duine, faodaidh e freagairt cheart, ceàrr, no dath air choireigin a thoirt dhut. Is e an fealla-dhà a dh’ innseas mi dha na h-oileanaich agam mar a tha suirbhidhean eadar-dhealaichte bho staitistig. Innsidh mi seo dhut mar naidheachd:

Tha seo a’ ciallachadh gun do chuir iad romhpa sgrùdadh a dhèanamh air fad cuibheasach mac an duine ann an dà bhaile. Tha seo a 'ciallachadh, anns a' chiad bhaile, Villaribo, gu bheil an fhaid cuibheasach 15 ceudameatairean, ann am baile beag Villabaggio - 25. A bheil fios agad carson? Leis gun deach tomhas a dhèanamh sa chiad bhaile, agus chaidh sgrùdadh a dhèanamh anns an dàrna fear.

Tha an gnìomhachas porn air thoiseach air siostaman molaidh

Sin as coireach gur e an dòigh-obrach ùr-nodha a bhith a’ sgrùdadh a h-uile duine gun eisgeachd, eadhon ged a tha iad beagan nas lugha na 100%, ach is iad sin na daoine nach fheum thu faighneachd, chan fheum thu coimhead orra. Tha e gu leòr sgrùdadh a dhèanamh air an rud ris an canar a-nis lorg-coise didseatach gus tuigse fhaighinn air na tha a dhìth air an neach seo, mar a bhruidhneas tu ris gu ceart, mar a chruthaicheas tu iarrtas timcheall air gu ceart. Air an aon làimh, is e inneal gun inntinn a tha seo (ach tha thu fhèin agus mise glè eòlach air seo); chan eil sinn airson conaltradh le daoine bho M. Bhidio," agus eadhon nas motha na sin, nuair a thèid sinn gu goireasan mar Pornhub, tha sinn airson faighinn gu dìreach na tha a dhìth oirnn.

Carson a bhios mi an-còmhnaidh a’ bruidhinn mu Pornhub? Leis gur e gnìomhachas nan inbheach a’ chiad fhear a thàinig gu mion-sgrùdadh theicneòlasan mar sin, gu buileachadh nan teicneòlasan sin, gu mion-sgrùdadh dàta. Ma ghabhas tu na trì leabharlannan as mòr-chòrdte san raon seo (mar eisimpleir, TensorFlow no Pandas airson Python, airson faidhlichean CSV a ghiullachd, is mar sin air adhart), ma dh’ fhosglas tu e air Github, le Google goirid de na h-ainmean sin gheibh thu a no dhà a bha ag obair no ag obair aig a’ chompanaidh Pornhub an-dràsta, agus b’ iad a’ chiad fheadhainn a chuir an sàs siostaman molaidh an sin. San fharsaingeachd, tha an sgeulachd seo gu math adhartach, agus a 'sealltainn cho mòr' sa tha an luchd-èisteachd seo, dè an ìre a tha a 'chompanaidh seo air gluasad air adhart.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Trì ìrean aithneachaidh

Tha seata mòr de dhàta timcheall air neach a dh’ fhaodar aithneachadh. Mar as trice bidh mi a 'roinn seo gu foirmeil ann an trì ìrean, a' dol nas doimhne agus nas doimhne. Gu nàdarra, tha a dàta fhèin aig a 'chompanaidh.

Ma tha, can, tha sinn a 'bruidhinn mu bhith a' togail siostam molaidh, is e a 'chiad ìre an dàta a tha suidhichte aig a' bhùth fhèin (eachdraidh ceannach, a h-uile seòrsa de ghnothaichean, mar a bha neach ag eadar-obrachadh leis an eadar-aghaidh).

An ath rud tha ìre (an ìre mhath as motha) - is e seo an t-ainm stòran fosgailte. Na smaoinich gu bheil mi gad bhrosnachadh gus lìonraidhean sòisealta a sgrìobadh, ach gu dearbh, tha na tha ri fhaighinn ann an stòran fosgailte a’ fosgladh seata mòr de dhàta as urrainn dhut, can, ionnsachadh mu neach.

Agus is e an treas prìomh phàirt àrainneachd an neach seo fhèin. Tha, tha beachd ann mura h-eil neach air lìonraidhean sòisealta, nach eil dàta mu dheidhinn ann (is dòcha gu bheil fios agad mu thràth nach eil seo fìor), ach is e an rud as cudromaiche gu bheil an dàta a tha air ìomhaigh neach (no ann an cuid de thagradh) dìreach 40% den eòlas a gheibhear mu dheidhinn. Tha an còrr den fhiosrachadh air fhaighinn bhon àrainneachd aige. Tha an abairt “innis dhomh cò do charaid agus innsidh mi dhut cò thu” a’ gabhail brìgh ùr san XNUMXmh linn oir gheibhear tòrr dàta mun neach sin.

Ma bhruidhneas sinn nas fhaisge air conaltradh sanasachd, tha a bhith a’ faighinn conaltradh sanasachd chan ann bho sanasachd, ach bho charaid, neach-eòlais no neach air a dhearbhadh ann an dòigh air choreigin na fheart fìor fhionnar a bhios mòran de luchd-margaidh a’ cleachdadh. Nuair a bheir cuid de thagradh gu h-obann còd promo an-asgaidh dhut, bidh thu a’ dèanamh post mu dheidhinn agus mar sin a’ tàladh luchd-èisteachd ùr. Gu dearbh, cha deach an còd promo seo airson a’ chumha “Yandex.Taxi” a thaghadh air thuaiream, ach airson seo, chaidh tòrr dàta a mhion-sgrùdadh mun chomas agad luchd-èisteachd ùr a thàladh agus dòigh air choireigin eadar-obrachadh leotha.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Bidh iad eadhon a’ sgrùdadh giùlan charactaran sreath Tbh

Seallaidh mi trì dealbhan dhut, agus innsidh tu dhomh dè an diofar a tha eatorra.

Am fear seo:

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Seo:

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Agus am fear seo:

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Dè an diofar a tha eatorra? Tha a h-uile dad sìmplidh an seo. Mar a tha ann an meacanaig quantum, anns a 'chùis seo chaidh an cruthachalachd seo a chruthachadh leis an neach-amhairc. Is e sin, chan eil an eadar-dhealachadh anns an aon iomairt sanasachd, air a dhèanamh leis an aon bhrand aig an aon àm, ach anns an neach a choimhead an cruthachail seo. Gu pearsanta, nuair a thèid mi gu Ammediateka, tha iad fhathast a 'sealltainn Khal Drogo. Chan eil fios agam dè a tha Ammediateka a’ smaoineachadh mu na roghainnean agam, ach airson adhbhar air choireigin tha seo a’ tachairt.

Is e an rud ris an canar a-nis conaltradh pearsanaichte an sgeulachd as mòr-chòrdte mu bhith a’ tàladh luchd-èisteachd agus ag eadar-obrachadh gu ceart leis. Ma dh’ ainmich sinn aig a’ chiad ìre daoine a’ cleachdadh ar dàta branda fhèin, dàta stòr fosgailte agus, mar eisimpleir, dàta bho àrainneachd an neach seo, tuigidh sinn, às deidh dhuinn mion-sgrùdadh a dhèanamh air, cò e, mar a bhruidhneas sinn ris gu ceart agus, nas cudromaiche. , ciod a' chainnt a tha e labhairt ris.

An seo tha teicneòlas air a dhol cho fada agus gu bheilear a’ sgrùdadh nan caractaran ann an sreath Tbh a bhios daoine a’ coimhead. Is e sin, is toil leat sreathan Tbh - thathas a’ coimhead [is toil leotha], bidh iad a’ coimhead air cò leis an robh thu ag eadar-obrachadh an sin, gus tuigsinn dè an seòrsa neach a bhiodh freagarrach dhut airson eadar-obrachadh leis. Tha e coltach ri neòinean iomlan, ach dìreach airson spòrs, feuch e air aon de na goireasan - bidh diofar dhaoine a’ faicinn diofar dhaoine cruthachail (gus eadar-obrachadh leis gu ceart).

Chan eil aon mheadhan ùr-nodha no goireas bhidio sam bith dìreach a’ sealltainn beagan naidheachdan dhut. Rach gu na meadhanan - tha àireamh mhòr de algorithms air an luchdachadh a dh’ aithnicheas tu, a thuigeas a h-uile gnìomh a rinn thu roimhe, a nì ath-thagradh don mhodal matamataigeach agus an uairsin a sheallas dhut rudeigin. Anns a 'chùis seo, tha sgeulachd cho neònach ann.

Ciamar a tha feumalachdan air an co-dhùnadh? Psychometry. Fisiognomy

Tha mòran dhòighean (fìor) ann airson a bhith a’ dearbhadh fìor fheuman neach agus mar a nì thu conaltradh ceart leotha. Tha mòran dhòighean-obrach ann, tha a h-uile dad air a rèiteachadh ann an dòigh eadar-dhealaichte, chan urrainnear a ràdh dè a tha math agus dè a tha dona. Tha e coltach gu bheil na prìomh fheadhainn eòlach air a h-uile dad.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Psychometry. Às deidh na sgeòil le Cambridge Analytics, thug e uamhasach, nam bheachd-sa, tionndadh de sheòrsa air choreigin, oir tha a h-uile dàrna companaidh poilitigeach a-nis a’ tighinn agus ag ràdh: “O, an urrainn dhut mo dhèanamh mar Trump? Tha mi cuideachd airson buannachadh, agus mar sin air adhart." Gu dearbh, tha seo, gu dearbh, na neòinean airson ar fìrinnean, mar eisimpleir, taghaidhean poilitigeach. Ach gus psychotypes a dhearbhadh, thathas a’ cleachdadh trì modalan:

  • tha a’ chiad fhear stèidhichte air an t-susbaint a bhios tu ag ithe - na faclan a sgrìobhas tu, beagan fiosrachaidh as toil leat, bhideothan, msaa;
  • tha an dàrna fear ceangailte ri mar a bhios tu ag eadar-obrachadh leis an eadar-aghaidh lìn, mar a sgrìobhas tu, dè na putanan a bhrùthas tu - gu dearbh, tha companaidhean slàn ann a tha, stèidhichte air làmh-sgrìobhaidh a’ mheur-chlàr aca, comasach air dearbhadh gu h-earbsach dè a chanar ris a-nis psychotypes.
  • Chan e mòran eòlaiche-inntinn a th’ annam, chan eil mi dha-rìribh a’ tuigsinn mar a tha e ag obair, ach a thaobh conaltradh sanasachd, tha luchd-èisteachd air an roinn anns na roinnean sin ag obair glè mhath, oir feumaidh cuideigin scrion dearg le gorm a shealltainn. boireannach, feumaidh cuideigin sgrion dorcha a shealltainn le cùl-raon gorm le seòrsa de tharraing, agus tha e ag obair gu math fionnar. Aig cuid de ìrean ìosal - uiread gus nach bi duine eadhon a ’smaoineachadh mu dheidhinn. Dè am prìomh dhuilgheadas anns a 'mhargaidh sanasachd a-nis? Tha a h-uile duine na àidseant fiosrachaidh, tha a h-uile duine am falach, tha millean mìle cead brabhsair air a chuir a-steach, gus nach tèid an aithneachadh ann an dòigh sam bith - is dòcha gu bheil “Adblocks”, “Gostrey” agad agus a h-uile seòrsa tagradh a chuireas casg air tracadh. Air sgàth seo, tha e gu math doirbh rud sam bith a thuigsinn mu neach. Agus tha teicneòlas air gluasad air adhart - feumaidh fios a bhith agad chan ann a-mhàin gu bheil an neach seo air tilleadh chun làrach agad airson an 125mh turas, ach gu bheil e cuideachd na dhuine cho neònach.

Tha physiognomy na shaidheans gu math connspaideach. Chan eil e eadhon air a mheas mar saidheans. Is e seo buidheann de dhaoine a b ’àbhaist a bhith a’ prògramadh lorgairean breug airson cuid de Mhinistrealachd Cùisean Taobh a-staigh, agus a-nis an sàs anns an rud ris an canar pearsanachadh cruthachalachd. Tha an dòigh-obrach an seo gu math sìmplidh: tha grunn de na dealbhan poblach agad air an togail bho chuid de lìonraidhean sòisealta, agus tha geoimeatraidh trì-thaobhach air a thogail bhuapa. Agus ma tha thu nad neach-lagha, canaidh tu a-nis gur e duine agus dàta pearsanta a tha seo; ach innsidh mi dhut gur e seo 300 mìle puing suidhichte san fhànais, agus chan e duine a tha seo, agus chan e dàta pearsanta a th’ ann. Is e seo a bhios a h-uile duine ag ràdh mar as trice nuair a thig Roskomnadzor thuca.

Ach gu dona, chan e d ’aghaidh air leth, mura h-eil a’ chiad ainm agus an t-ainm mu dheireadh agad air a shoidhnigeadh an sin, an dàta pearsanta agad. Is e a ’phuing gu bheil na balaich a’ comharrachadh diofar fheartan aghaidh a bheir buaidh air mar a bhios neach a ’dèanamh cho-dhùnaidhean agus mar a nì iad eadar-obrachadh ceart leis. Ann an cuid de raointean tha seo ag obair gu dona, ann an cuid de roinnean sanasachd; anns na roinnean a tha e ag obair glè mhath. Aig a’ cheann thall, tha e a’ tionndadh a-mach, nuair a thèid thu gu goireas air choreigin, nach fhaic thu dìreach aon bhratach a tha air a nochdadh don h-uile duine, ach, mar eisimpleir... a-nis tha e àbhaisteach 16 no 20 roghainn a dhèanamh airson diofar luchd-èisteachd - agus tha e ag obair glè fhionnar. Tha, tha seo eadhon nas brònach bho shealladh an neach-cleachdaidh, leis gu bheil daoine a’ tòiseachadh air an làimhseachadh barrachd is barrachd. Ach a dh’ aindeoin sin, bho shealladh gnìomhachais tha e ag obair glè mhath.

Am bogsa dubh inneal ionnsachaidh

Tha seo ag adhbhrachadh an duilgheadas a leanas le leithid de theicneòlasan: às deidh a h-uile càil, airson a’ mhòr-chuid de luchd-leasachaidh a-nis tha an rud ris an canar ionnsachadh domhainn na “bogsa dubh”. Ma tha thu a-riamh air do bhogadh san sgeulachd seo agus air bruidhinn ris an luchd-leasachaidh, bidh iad an-còmhnaidh ag ràdh: “O, èist, uill, tha sinn air rudeigin a chòdachadh cho do-thuigsinn an sin, agus chan eil fios againn ciamar a tha e ag obair.” Is dòcha gu bheil cuideigin air seo a dhèanamh.

Tha seo gu dearbh fada bho bhith fìor. Tha an rud ris an canar a-nis ionnsachadh innealan fada bho “bogsa dubh”. Tha àireamh mhòr de dhòighean-obrach ann airson cunntas a thoirt air an dàta cuir a-steach agus toraidh, agus aig a ’cheann thall faodaidh a’ chompanaidh làn thuigse a dhèanamh air bunait nan comharran a cho-dhùin an inneal am bhidio pornagraf seo no fear eile a shealltainn dhut. Is e a’ cheist nach eil gin de na companaidhean a’ foillseachadh seo a-riamh, oir: an toiseach, is e dìomhaireachd malairt a th’ ann; san dàrna àite, bidh tòrr dàta ann air nach robh fios agad eadhon mu dheidhinn.

Mar eisimpleir, ron àm seo, ann an deasbad air beusachd, bheachdaich sinn air mar a bhios lìonraidhean sòisealta a’ sgrùdadh teachdaireachdan pearsanta gus daoine a chomharrachadh ann an seòrsa de sgeulachdan sanasachd. Ma sgrìobhas tu rudeigin gu cuideigin, stèidhichte air seo gheibh thu tag sònraichte airson, gu dearbh, seòrsa de chonaltradh sanasachd. Agus cha dhearbh thu gu bràth e, agus is dòcha nach eil feum air a dhearbhadh. Ach, nan deidheadh ​​​​pàtrain coltach ris a nochdadh, bhiodh iad ann. Tha e a ’tionndadh a-mach gu bheil a’ mhargaidh airson a leithid de shiostaman molaidh a thogail a ’leigeil orra nach eil fios aca carson a thachair seo.

Chan eil daoine airson faighinn a-mach dè a tha fios aig daoine mun deidhinn

Agus is e an dàrna sgeulachd nach eil an neach-dèiligidh a-riamh ag iarraidh faighinn a-mach carson a fhuair e an sanas sònraichte seo, an toradh sònraichte seo. Innsidh mi an sgeul seo dhut. B 'e a' chiad eòlas a bh 'agam ann a bhith a' buileachadh siostaman molaidh malairteach stèidhichte air algorithms co-ionann gu dìreach airson rannsachadh ann an 2015 ann an lìonra glè mhòr de bhùithtean gnè (tha, cuideachd chan e sgeulachd gu math mì-thlachdmhor).

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Chaidh na leanas a thabhann do luchd-ceannach: thig iad a-steach, log a-steach leis an lìonra sòisealta aca, agus às deidh timcheall air 5 diogan gheibh iad stòr gu tur pearsanta dhaibh, is e sin, tha a h-uile toradh air atharrachadh - bidh iad a ’tighinn a-steach do roinn sònraichte, agus mar sin air adhart . A bheil fios agad mar a tha ìre tionndaidh a’ bhùth seo air a dhol suas? Chan ann ann an dòigh sam bith! Thàinig daoine a-steach agus ruith iad air falbh bhuaithe sa bhad. Thàinig iad a-steach agus thuig iad gun deach an dearbh rud a bha iad a’ smaoineachadh a thabhann dhaibh ...

B ’e an duilgheadas leis an deuchainn seo gun deach a sgrìobhadh fo gach toradh carson a chaidh am fear sònraichte sin a thabhann dhut (“leis gu bheil thu nad bhall den bhuidheann falaichte“ Tha boireannach cumhachdach a ’coimhead airson fear a tha na bhrat dorais”). Mar sin, cha bhith siostaman molaidh an latha an-diugh a’ nochdadh an dàta air an deach an “ro-innse” a dhèanamh.

Is e sgeulachd a tha mòr-chòrdte na meadhanan oir tha iad uile a’ cleachdadh siostaman molaidh coltach ris. Roimhe sin, bha na h-algorithms gu math sìmplidh: thoir sùil air an roinn “Poilitigs” - agus bidh iad a’ sealltainn dhut naidheachdan bhon roinn “Poilitigs”. A-nis tha a h-uile dad cho iom-fhillte is gu bheil iad a’ dèanamh anailis air na h-àiteachan far an do stad thu an luchag, dè na faclan air an do chuir thu fòcas, na rinn thu leth-bhreac, mar a bha thu san fharsaingeachd ag eadar-obrachadh leis an duilleag seo. An uairsin bidh e a 'dèanamh anailis air briathrachas nan teachdaireachdan fhèin: seadh, chan eil thu dìreach a' leughadh naidheachdan mu Putin, ach ann an dòigh shònraichte, le dath tòcail sònraichte. Agus nuair a gheibh duine beagan naidheachdan, chan eil e eadhon a’ smaoineachadh ciamar a thàinig e an seo. A dh'aindeoin sin, bidh e an uairsin ag eadar-obrachadh leis an t-susbaint seo.

Tha seo uile, gu nàdarra, ag amas air an duine beag bochd, mì-fhortanach a tha mar-thà a’ dol às a rian leis an uiread fiosrachaidh a tha timcheall air a chumail. An seo feumar a ràdh gum biodh e math na siostaman sin a chleachdadh gus an neach cruthachail timcheall ort a phearsanachadh agus beagan fiosrachaidh a chruinneachadh, ach, gu mì-fhortanach, chan eil seirbheisean mar sin ann fhathast.

Bidh inntleachd fuadain a’ glacadh an neach-dèiligidh san adhar agus a’ cruthachadh iarrtas

Agus an seo tha aon cheist feallsanachail fìor inntinneach ag èirigh, a’ gluasad bho bhith a’ cruthachadh siostam molaidh gu bhith a’ cruthachadh iarrtas. Is ann ainneamh a bhios duine a’ smaoineachadh mu dheidhinn, ach nuair a dh’ fheuchas tu ri faighneachd don Instagram ris an canar, “Carson a tha thu a’ tional dàta? Carson nach seall thu sanasachd air thuaiream dhomh? ” - Innsidh Instagram dhut: “A charaid, tha seo uile air a dhèanamh gus sealltainn dhut dè dìreach a tha inntinneach dhut.” Mar, tha sinn airson eòlas fhaighinn ort cho mionaideach is gun urrainn dhuinn sealltainn dhut dè dìreach a tha thu a’ sireadh.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Ach tha teicneòlas air a dhol thairis air an ìre uamhasach seo o chionn fhada, agus chan eil teicneòlasan coltach ris a’ ro-innse na tha a dhìth ort tuilleadh. Bidh iad (aire!) a’ cruthachadh iarrtas. Is dòcha gur e seo an rud as iongantaiche a tha timcheall air innleachdas fuadain ann an conaltradh mar sin. Is e an rud eagallach gun deach a chleachdadh cha mhòr anns a h-uile àite airson na 3-5 bliadhna a dh’ fhalbh - bho thoraidhean rannsachaidh Google gu toraidhean rannsachaidh Yandex, gu cuid de shiostaman... Ceart gu leòr, cha bhith mi ag ràdh dad dona mu Yandex; agus math.

Dè a’ phuing? Tha ùine mhòr air a bhith ann bho tha conaltradh sanasachd mar sin air gluasad air falbh bhon ro-innleachd far a bheil thu a’ sgrìobhadh “Tha mi airson cathair cloinne a cheannach” agus ceud mìle millean foillseachadh fhaicinn. Ghluais iad air adhart gu na leanas: cho luath ‘s a chuir am boireannach dealbh suas le bolg a bha gann ri fhaicinn, thòisicheadh ​​​​an duine aice sa bhad le teachdaireachdan:“ A dhuine, tha am breith a ’tighinn a dh’ aithghearr. Ceannaich suidheachan cloinne."

An seo, is dòcha gu bheil thu gu reusanta a’ faighneachd, carson, le adhartas cho mòr ann an teicneòlas, a bheil sinn fhathast a’ faicinn sanasachd cho sgiobalta air lìonraidhean sòisealta? Is e an duilgheadas a th’ ann gu bheil a h-uile dad sa mhargaidh seo fhathast air a cho-dhùnadh le airgead, agus mar sin aon mhionaid mhath faodaidh cuid de sanasair mar Coca-Cola tighinn agus a ràdh: “Seo 20 millean dhut - seall na brataichean shitty agam air an eadar-lìn gu lèir.” Agus bidh iad dha-rìribh ga dhèanamh.

Ach ma nì thu cunntas glan de sheòrsa air choreigin agus dèan deuchainn air dè cho ceart ‘s a tha algorithms mar sin gad stiùireadh: feuchaidh iad an toiseach ri do thomhas, agus an uairsin tòisichidh iad a’ dèanamh rudeigin dhut ro-làimh. Agus tha an eanchainn daonna ag obair ann an leithid de dhòigh, nuair a gheibh e fiosrachadh a tha earbsach air a shon, nach bi e eadhon a ’giullachd a’ mhionaid a fhuair e am fiosrachadh seo. Is e a 'chiad riaghailt airson dearbhadh gu bheil thu ann am bruadar a bhith a' tuigsinn mar a thàinig thu an seo. Chan eil cuimhne aig duine air a’ mhionaid a chrìochnaich e ann an seòmar sònraichte. Tha e an aon rud an seo.

Is dòcha gun tòisich Google a’ cumadh do shealladh cruinne

Chaidh sgrùdaidhean leithid seo a dhèanamh le grunn chompanaidhean cèin a tha an sàs ann an i-tracadh. Chuir iad a-steach innealan air coimpiutairean sònraichte a tha a 'clàradh far a bheil sùilean an cuspair deuchainn a' coimhead. Thug mi eadar còig is seachd mìle saor-thoileach a bha dìreach a’ sgrolaich am biadhadh, ag eadar-obrachadh le lìonraidhean sòisealta, le sanasachd, agus chlàr iad fiosrachadh air dè na pàirtean de na brataichean agus na daoine cruthachail air an do chuir na daoine sin stad air an sùilean.

Agus tha e a 'tionndadh a-mach, nuair a gheibh daoine a leithid hyper-pearsanaichte cruthachail, chan eil iad fiù' s a 'smaoineachadh mu dheidhinn - bidh iad a' gluasad air adhart sa bhad, a 'tòiseachadh ag eadar-obrachadh leis. Bho thaobh gnìomhachais, tha seo math, ach bho shealladh dhuinn, mar luchd-cleachdaidh, chan eil seo gu math fionnar, oir - dè a tha eagal orra? - Aig aon mhionaid math faodaidh an suidheachadh “Google” tòiseachadh (no, gu dearbh, is dòcha nach tòisich e) gus a shealladh cruinne fhèin a chruthachadh. Amàireach, mar eisimpleir, faodaidh e tòiseachadh a’ sealltainn naidheachdan do dhaoine gu bheil an talamh rèidh.

Dìreach a’ magadh, ach chaidh an glacadh cho tric is gu bheil iad a’ tòiseachadh a’ toirt seachad fiosrachadh sònraichte do dhaoine sònraichte rè taghaidhean. Tha sinn uile cleachdte ris an fhìrinn gu bheil an einnsean sgrùdaidh a’ faighinn a h-uile dad gu h-onarach. Ach, mar a bhios mi an-còmhnaidh ag ràdh, ma tha thu dha-rìribh ag iarraidh faighinn a-mach mar a tha an saoghal ag obair, sgrìobh an einnsean sgrùdaidh agad fhèin, gun sìoltachain, gun aire a thoirt do dhlighe-sgrìobhaidh, gun a bhith a’ rangachadh cuid de do charaidean ann an toraidhean rannsachaidh. Tha taisbeanadh fìor dàta air an eadar-lìn sa chumantas eadar-dhealaichte bho na tha Google, Yandex, Bing, agus mar sin air adhart. Tha cuid de stuthan falaichte oir tha caraidean, co-obraichean, nàimhdean no cuideigin eile (no seann leannan leis an do chaidil thu) - chan eil e gu diofar.

Mar a bhuannaich Trump

Nuair a bha an taghadh mu dheireadh anns na Stàitean Aonaichte, chaidh sgrùdadh gu math sìmplidh a dhèanamh. Ghabh iad na h-aon iarrtasan ann an diofar àiteachan, bho sheòlaidhean IP eadar-dhealaichte, bho bhailtean-mòra eadar-dhealaichte, rinn diofar dhaoine Google an aon rud. Gu h-àbhaisteach, bha an t-iarrtas ann an stoidhle: cò a bhuannaicheas na taghaidhean? Agus gu h-iongantach, chaidh na toraidhean a thogail ann an dòigh a fhuair iad deagh naidheachd mun tagraiche a chuir Google air adhart anns na stàitean sin far an do dh’ fheuch an àireamh as motha de dhaoine ri bhòtadh airson an tagraiche ceàrr. Dè am fear? Uill, tha e soilleir dè am fear - am fear a thàinig gu bhith na cheann-suidhe. Is e sgeulachd gu tur nach gabh a dhearbhadh a tha seo, agus tha na sgrùdaidhean sin uile nam meur san uisge. Faodaidh Google a ràdh: “Guys, tha seo uile air a dhèanamh gus an seall sinn an susbaint as buntainniche dhut."

Bho seo a-mach, bu chòir dhut fios a bhith agad nach eil an rud ris an canar maximally buntainneach fìor. Bidh a’ chompanaidh a’ gairm rudeigin buntainneach a dh’ fheumar a reic riut airson adhbhar math no dona.

Tha an fheadhainn aig nach eil airgead a-nis gan ullachadh mu thràth airson ceannach san àm ri teachd

Tha puing inntinneach eile an seo air am bi mi ag innse dhut. Tha àireamh mhòr de luchd-èisteachd gnìomhach a-nis air lìonraidhean sòisealta agus ann an aplacaidean nan daoine òga. Canaidh sinn seo ris - òigridh briste: clann 8-9 bliadhna a bhios a’ cluich gheamannan moronic, is iad sin 12-13-14 a tha dìreach a’ clàradh air lìonraidhean sòisealta. Carson a bhiodh companaidhean mòra a’ cosg bhuidseatan is ghoireasan mòra gus tagraidhean a chruthachadh airson luchd-èisteachd nach eil a’ pàigheadh ​​nach fhaigh airgead gu bràth? Aig an àm nuair a dh’ fhàsas an luchd-èisteachd seo fuasglaidheach, bidh gu leòr dàta ann mu dheidhinn gus ro-innse fìor mhath a dhèanamh air a ghiùlan.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

A-nis faighnich dha targaid-eòlaiche sam bith, dè an luchd-èisteachd as duilghe? Canaidh iad: air leth prothaideach. Leis gu bheil e cha mhòr do-dhèanta reic, mar eisimpleir, àros luach 150 millean rubles tro lìonraidhean sòisealta. Tha cùisean iomallach ann nuair a nì thu seòrsa de shanasachd airson 10 mìle neach, bidh aon a’ ceannach an àros seo - tha an neach-dèiligidh soirbheachail... Ach tha aon às gach deich mìle, bho shealladh staitistigeil, na sgàineadh iomlan. Mar sin, carson a tha e duilich luchd-èisteachd le teachd-a-steach àrd a chomharrachadh? Leis gun do rugadh na daoine a tha a-nis nam buill de luchd-èisteachd air leth prothaideach nuair a bha an eadar-lìn fhathast glè bheag, nuair nach robh fios aig duine fhathast Artemy Lebedev, agus chan eil fiosrachadh sam bith mun deidhinn. Tha e do-dhèanta am pàtran giùlain aca ro-innse, tha e do-dhèanta tuigsinn cò na stiùirichean beachd a th’ aca, agus dè na stòran susbaint a gheibh iad.

Mar sin nuair a thig thu gu bhith nam billeanan ann an 25 bliadhna, agus bidh tòrr dàta aig na companaidhean a tha a’ dol a reic rudeigin dhut. Sin as coireach gu bheil GDPR mìorbhaileach againn san Roinn Eòrpa a-nis a chuireas casg air cruinneachadh dàta bho chlann bheaga.

Gu nàdarra, chan eil seo ag obair idir ann an cleachdadh, oir tha a 'chlann fhathast a' cluich air cunntasan am màthar agus an athair - seo mar a tha fiosrachadh air a chruinneachadh. An ath thuras a bheir thu clàr don leanabh agad, smaoinich air seo.

Gu dearbh chan e àm ri teachd eagallach, dystopian a th’ ann, nuair a gheibh a h-uile duine bàs ann an cogadh le innealan - sgeulachd dha-rìribh a-nis. Tha àireamh mhòr de chompanaidhean ann a tha a 'cruthachadh algorithms airson daoine a tha a' dèanamh ìomhaigh-inntinn stèidhichte air mar a bhios iad a 'cluich gheamannan. Gnìomhachas air leth inntinneach. Stèidhichte air seo uile, tha daoine an uairsin air an sgaradh gus conaltradh a dhèanamh leotha ann an dòigh air choireigin.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Bidh ro-innse mu ghiùlan nan daoine sin ri fhaighinn ann an 10-15 bliadhna - dìreach aig an àm nuair a thig iad gu bhith nan luchd-èisteachd fuasglaidh. Is e an rud as cudromaiche gu bheil na daoine sin air cead a thoirt seachad ro-làimh airson an dàta pearsanta aca a phròiseasadh, a ghluasad gu treas phàrtaidhean, agus tha seo uile na thoileachas, agus mar sin air adhart.

Cò a chailleas an obair aca?

Agus 's e an sgeulachd mu dheireadh a th' agam gu bheil a h-uile duine an-còmhnaidh a' faighneachd dè a thachras ann an 50 bliadhna: gheibh sinn uile bàs, bidh cion-cosnaidh ann do luchd-margaidh... Tha luchd-margaidh an seo a tha draghail mu chion-cosnaidh, ceart? San fharsaingeachd, chan eil feum a bhith draghail, oir cha chaill neach le teisteanas sam bith a dhreuchd.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Ge bith dè na h-algorithms a thèid a chruthachadh, ge bith dè cho faisg ‘s a gheibh an inneal faisg air na tha againn an seo (a’ comharrachadh a cheann), ma leasaicheas e luath gu leòr, cha bhith daoine mar sin air am fàgail leisg, oir feumaidh cuideigin na rudan cruthachail sin a chruthachadh. dèan. Tha, tha a h-uile seòrsa “gans” ann a bhios a’ tarraing dhealbhan a tha coltach ri daoine agus a’ cruthachadh ceòl, ach tha e eu-coltach fhathast gun caill daoine san raon seo an cuid obrach gu bràth.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Tha a h-uile càil agam leis an sgeulachd, agus mar sin faodaidh tu ceistean fhaighneachd ma tha barrachd agad. Tapadh leat.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Lead: - A charaidean, tha sinn a-nis a’ gluasad air adhart chun bhloc “Ceist is Freagairt”. Tha thu a' togail do làmh - tha mi a 'tighinn suas riut.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

Ceist bhon luchd-èisteachd (XNUMX): - Ceist mun “bhogsa dhubh”. Thuirt iad gun robh e comasach tuigsinn gu sònraichte carson a chaidh a leithid de thoradh fhaighinn airson a leithid de neach-cleachdaidh. An e algorithms de sheòrsa air choreigin a tha seo, no a bheil feum air a mhion-sgrùdadh gach uair airson gach modail ad hoc (nota an ùghdair: “gu sònraichte airson seo” - aonad briathrachais Laideann)? No a bheil feadhainn deiseil ann airson lìonra de sheòrsa air choreigin a dh’ fhaodas, gu ìre mhòr, ciall gnìomhachais a dhèanamh?

OH: - An seo feumaidh tu na leanas a thuigsinn: tha àireamh mhòr de ghnìomhan ann an ionnsachadh innealan. Mar eisimpleir, tha obair ann - ais-tharraing. Airson ais-tharraing, chan eil feum air lìonraidhean neural idir. Tha a h-uile dad sìmplidh: tha grunn chomharran agad, feumaidh tu na leanas obrachadh a-mach. Tha gnìomhan ann far a bheil e riatanach a dhol gu leithid de rud ri ionnsachadh domhainn. Gu dearbh, ann an ionnsachadh domhainn tha e duilich tuigsinn gu h-earbsach dè na cuideaman a chaidh a shònrachadh dha na neurons, ach gu laghail chan eil agad ach a bhith a’ tuigsinn dè an dàta a bha aig an cuir a-steach agus mar a chluich e aig an toradh. Tha seo gu laghail gu leòr airson a leithid de cho-dhùnadh a pheutant agus tha e gu leòr a thuigsinn air a’ bhunait a chaidh an sgeulachd a dhèanamh.

Chan eil e mar a chaidh thu chun làraich agus gun deach bratach de sheòrsa air choreigin a shealltainn dhut oir thog thu dealbh le falt ruadh air Instagram o chionn dà mhìos. Mura h-eil an leasaiche a’ toirt a-steach cruinneachadh an dàta seo agus comharrachadh dath fuilt sa mhodail seo, cha tig e a-mach à àite sam bith.

Ciamar a reic toraidhean siostaman ionnsachaidh innealan?

Z: - Chan eil ann ach ceist air dè: dìreach mar a mhìnicheas tu, mar a reiceas tu ri cuideigin nach eil a’ tuigsinn ionnsachadh innealan. Tha mi airson a ràdh: tha am modail agam gu soilleir a’ dol bho dhath na falt gu... uill, bidh dath fuilt ag atharrachadh... A bheil seo comasach no nach eil?

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

OH: - 'S dòcha tha. Ach bho shealladh reic, obraichidh an aon sgeama: tha iomairt sanasachd agad, bidh sinn a’ dol an àite an luchd-èisteachd leis an fhear a chruthaich an inneal - agus chan fhaic thu ach an toradh. Is e seo, gu mì-fhortanach, an aon dòigh air toirt a chreidsinn don neach-ceannach gu bheil an leithid de sgeulachd ag obair, oir tha tòrr fhuasglaidhean air a ’mhargaidh a chaidh a chuir an gnìomh aon uair agus nach do dh’ obraich.

Mu bhith a’ cruthachadh pearsantachd brìgheil

Z: - Halò. Tapadh leibh airson an òraid. Is e a’ cheist: dè an cothrom a th’ aig neach, nach eil airson adhbhar air choireigin airson stiùireadh ionnsachadh innealan a leantainn, gus pearsantachd brìgheil a chruthachadh dha fhèin a tha gu tur eadar-dhealaichte bho a phearsantachd fhèin, tro eadar-obrachadh leis an eadar-aghaidh no airson cuid adhbhar eile?

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

OH: - Tha dòrlach de plugins eadar-dhealaichte ann a tha a’ dèiligeadh gu sònraichte ri giùlan air thuaiream. Tha rud math ann - Ghostery, a tha, nam bheachd-sa, cha mhòr gu tur gad fhalach bho ghrunn luchd-lorg nach urrainn am fiosrachadh seo a chlàradh an uairsin. Ach gu dearbh, a-nis chan eil agad ach ìomhaigh dùinte air lìonraidhean sòisealta gus nach urrainn do dhuine sam bith, no luchd-sgrìobidh olc, dad a chruinneachadh an sin. Is dòcha gu bheil e nas fheàrr leudachadh de sheòrsa air choreigin a chuir a-steach no rudeigin a sgrìobhadh thu fhèin.

Tha thu a’ faicinn, is e am bun-bheachd an seo gu bheil, gu laghail, mar eisimpleir, dàta pearsanta a’ toirt iomradh air dàta leis an aithnichear thu, agus tha an lagh a’ toirt mar eisimpleir do sheòladh còmhnaidh, aois, agus mar sin air adhart. An-diugh tha àireamh gun àireamh de dhàta ann leis an aithnichear thu: an aon làmh-sgrìobhaidh meur-chlàr, an aon phreas, ainm-sgrìobhte didseatach a’ bhrobhsair... Luath no mall, bidh neach a’ dèanamh mearachd. Faodaidh e a bhith an àiteigin ann an “cafaidh” a ’cleachdadh“ Thor ”, ach aig a’ cheann thall, aig aon mhionaid mhath, dìochuimhnichidh an VPN tionndadh air, no rudeigin eile, agus aig an àm sin faodar a chomharrachadh. Mar sin is e an dòigh as fhasa cunntas prìobhaideach a dhèanamh agus beagan leudachaidh a chuir a-steach.

Tha a’ mhargaidh a’ gluasad chun na h-ìre far nach fheum thu ach aon phutan a bhrùthadh gus toraidhean fhaighinn.

Z: - Tapadh leibh airson an sgeulachd. Mar as àbhaist, an-còmhnaidh glè inntinneach (tha mi gad leantainn). Is e a’ cheist: dè an adhartas a tha ann a thaobh a bhith a’ cruthachadh shiostaman a tha deimhinneach do luchd-cleachdaidh, siostaman molaidh? Thuirt thu gun robh thu aig aon àm ag obair air siostam molaidh airson com-pàirtiche gnèitheasach, caraid nad bheatha (no ceòl a dh'fhaodadh a bhith a' còrdadh ri duine) a lorg... Dè cho gealltanach 's a tha seo, agus ciamar a chì thu a leasachadh bho an sealladh mu bhith a’ cruthachadh shiostaman a dh’ fheumas daoine?

OH: - San fharsaingeachd, tha a ’mhargaidh a’ gluasad chun ìre far am feum daoine aon phutan a bhrùthadh agus na tha a dhìth orra fhaighinn sa bhad. A thaobh m ’eòlas ann a bhith a’ cruthachadh thagraidhean cinn-latha (co-dhiù, bidh sinn ga chuir air bhog a-rithist aig deireadh na bliadhna), a bharrachd air gu robh 65% nam fir phòsta, b ’e an duilgheadas moladh as duilghe gun deach grunn mhodalan a thabhann do neach. aig toiseach an tagraidh - "Càirdeas", "Gnè", "Càirdeas Gnè" agus "Gnìomhachas". Cha do thagh daoine na bha a dhìth orra. Thàinig daoine agus thagh iad “Gràdh,” ach an da-rìribh thilg iad nudachd air a h-uile duine, agus mar sin air adhart.

B 'e an duilgheadas a bhith a' comharrachadh neach nach eil a 'freagairt air aon de na modailean sin, agus dòigh air choireigin ga thoirt gu rèidh agus ga ghluasad chun an taobh eile. Air sgàth cho beag de dhàta, tha e gu math duilich faighinn a-mach an e mearachd a tha seo san algairim ro-innse, no a bheil neach san roinn aige. Tha e an aon rud le ceòl: a-nis chan eil ach glè bheag de dh’ algoirmean airidh air a bhith comasach air ceòl “facastadh” gu math. 'S dòcha "Yandex.Music". Tha cuid den bheachd gu bheil an algairim Yandex.Music dona. Mar eisimpleir, is toil leam i. Gu pearsanta, mar eisimpleir, cha toil leam an algairim ciùil YouTube agus mar sin air adhart.

Tha, gu dearbh, beagan subtleties - tha a h-uile càil ceangailte ri ceadan... Ach ann an da-rìribh, tha an t-iarrtas airson leithid de shiostaman gu math àrd. Aig aon àm, bha a 'chompanaidh Retail Rocket aithnichte, a bha an sàs ann a bhith a' cur an gnìomh siostaman molaidh, ach a-nis chan eil e a 'soirbheachadh gu math - a rèir coltais seach nach do leasaich iad na h-algorithms aca airson ùine mhòr. Bidh a h-uile càil a 'dol a dh'ionnsaigh seo - chun na h-ìre gu bheil sinn a' dol a-steach agus, gun a bhith a 'bruthadh rud sam bith, a' faighinn na tha a dhìth oirnn (agus a bhith gu tur gòrach, oir tha ar comas taghadh air a dhol à bith).

Thoir buaidh air margaidheachd

Z: - Halò. 'S e Konstantin an t-ainm a th' orm. Bu mhath leam ceist a thogail mu bhuaidh margaidheachd. A bheil thu eòlach air siostaman sam bith a leigeas le gnìomhachas blogair freagarrach a thaghadh airson a’ ghnìomhachas stèidhichte air cuid de dhàta staitistigeil agus mar sin air adhart? Agus dè an adhbhar a tha seo air a dhèanamh?

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

OH: - Tha, tòisichidh mi bho chian agus canaidh mi sa bhad gur e an duilgheadas leis na teicneòlasan sin gu lèir gu bheil a h-uile fiosrachadh fuadain seo ann am margaidheachd a-nis coltach ri coisiche tightrope: air an taobh chlì tha companaidhean mòra aig a bheil tòrr airgid, agus a-staigh. ann an suidheachadh sam bith bidh a h-uile dad èifeachdach dhaibhsan ag obair leis gu bheil na h-iomairtean sanasachd aca ag amas dìreach air beachdan; air an làimh eile, tha tòrr ghnìomhachasan beaga ann airson nach obraich seo, oir tha tòrr dàta aca. Gu ruige seo, tha iomchaidheachd nan sgeulachdan sin an àiteigin sa mheadhan.

Nuair a tha buidseatan math ann mu thràth, agus is e an obair na buidseatan sin a phròiseasadh gu ceart (agus, ann am prionnsapal, tha tòrr dàta ann mu thràth)… Tha fios agam air seirbheis no dhà, rudeigin mar Getblogger, aig a bheil coltas gu bheil algorithms aca. Gus a bhith onarach, cha do rinn mi sgrùdadh air na h-algorithms sin. Is urrainn dhomh innse dhut dè an dòigh-obrach a bhios sinn a’ cleachdadh gus stiùirichean beachd a lorg nuair a dh’ fheumas sinn tiodhlac a thoirt do chuid de mhàthraichean.

Bidh sinn a’ cleachdadh meatrach ris an canar Àm Cuairteachaidh Susbaint. Bidh e ag obair mar seo: bidh thu a’ toirt neach aig a bheil an luchd-èisteachd a tha thu a’ mion-sgrùdadh, agus feumaidh tu gu riaghailteach (mar eisimpleir, aon uair gach 5 mionaidean) fiosrachadh a chruinneachadh mu gach post, cò a chòrd e, a thug beachd air, agus mar sin air adhart. San dòigh seo, tuigidh tu aig an àm anns an robh gach neach san luchd-èisteachd agad ag eadar-obrachadh leis an t-susbaint agad. Dèan an gnìomh seo a-rithist airson gach riochdaire den luchd-èisteachd aige, agus mar sin, a’ cleachdadh meatrach na h-ùine cuibheasach airson sgaoileadh susbaint, faodaidh e, mar eisimpleir, a bhith air a dhath ann an graf lìonra mòr de na daoine sin agus cleachd am meatrach seo gus cruinneachaidhean a thogail.

Bidh seo ag obair gu math ma tha sinn ag iarraidh, mar eisimpleir, 15 màthair a lorg a chumas am beachd poblach air cuid de woman.ru. Ach is e buileachadh teignigeach caran iom-fhillte a tha seo (ged a tha e dìreach gu teòiridheach faodar a dhèanamh ann am Python). Is e an loidhne gu h-ìosal gur e an duilgheadas le buaidh margaidheachd ann am buidhnean sanasachd mòra gu bheil feum aca air blogairean mòra, fionnar, daor nach eil ag obair airson cac. A-nis, tha suaicheantas càr ag iarraidh cuid de thoraidhean a reic tro stiùiriche beachd - feumaidh iad blogair càr a chleachdadh mar an roghainn mu dheireadh, leis gu bheil an luchd-èisteachd aca air càr a cheannach mu thràth, no gu bheil fios aca dè dìreach an seòrsa càr a tha iad ag iarraidh, dìreach suidhe agus coimhead air càraichean fionnar. An seo tha e cudromach gun a bhith ag ionndrainn mion-sgrùdadh luchd-èisteachd an neach fhèin.

Margaidheachd bots

Z: - Innis dhomh, dè an ìre gu bheil botaichean air lìonraidhean sòisealta a’ toirt buaidh air cruinneachadh fiosrachaidh agus air càileachd?

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

OH: - Tha e na rud cho inntinneach le botaichean. Tha botaichean saor gu math furasta an aithneachadh - an dàrna cuid tha an aon susbaint aca, no tha iad nan caraidean dha chèile, no tha iad san aon lìonra. Tha dòighean ann cuideachd airson dèiligeadh ri botaichean iom-fhillte. No a bheil thu a’ faighneachd na trioblaid ciamar a cheanglas tu duine ris a’ bhrèige aige?

Z: - Dè cho àrd sa bhios fiosrachadh mar thoradh air an sgudal seo gu lèir?

OH: - An seo tha e ag obair mar seo: air sgàth gu bheil tòrr dàta ann (mar eisimpleir, airson seòrsa de sgrùdadh margaidheachd), faodar an riffraff seo gu lèir a thilgeil a-mach. Is e sin, tha e nas fheàrr beagan a bharrachd dhaoine fìor a thilgeil a-mach na bhith a’ glacadh botaichean, oir tha e gun fheum dhaibh sanasachd sam bith a nochdadh. Ach ma chruinnicheas tu metrics, mar eisimpleir, eadar-obrachadh le brataichean no siostaman molaidh, faodar cunntasan mar sin a thilgeil a-mach.

A-nis air lìonraidhean sòisealta, tha timcheall air sia sa cheud de charactaran brìgheil no dìreach duilleagan air an trèigsinn no introverts, a bhios algorithms “a’ maidseadh ”mar bhotan. A thaobh a bhith a 'ceangal neach ris a' bhrèige aige, an seo cuideachd, tha a h-uile dad ceangailte ris an fhìrinn gum bi an neach a 'dèanamh mearachd nas luaithe no nas fhaide air adhart, agus is e an rud gu bheil am modail giùlain mar an ceudna - an dà chuid a chunntas fìor agus an fhìrinn aige. Ann an ùine ghoirid no nas fhaide air adhart seallaidh iad an aon susbaint no rudeigin eile.

An seo tha e uile a 'tighinn sìos chan ann air an àireamh sa cheud de mhearachdan, ach air an ùine a dh' fheumar gus neach aithneachadh gu h-earbsach. Dha cuideigin a tha a’ fuireach leis an Instagram aca, thig an turas seo airson comharrachadh earbsach sìos gu còig mionaidean. Airson cuid - eadar sia is ochd mìosan.

Cò dha agus ciamar a reicear dàta?

Z: - Halò. Tha ùidh agam faighinn a-mach mar a tha dàta air a reic eadar companaidhean? Mar eisimpleir, tha tagradh agam anns am faigh thu a-mach (don leasaiche) càite an tèid duine, dè na stòran a thèid e, agus dè an airgead a chosgas e an sin. Agus tha ùidh agam faighinn a-mach ciamar, canaidh mi, is urrainn dhomh dàta mun luchd-èisteachd agam a reic ris na stòran sin no an dàta agam a chuir ann an aon stòr-dàta mòr agus pàigheadh ​​​​air a shon?

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

OH: - A thaobh a bhith a’ reic dàta gu dìreach ri cuideigin, bha thu fhèin agus a h-uile duine eile air thoiseach air OFD - luchd-obrachaidh dàta fiosgail, a thog iad fhèin gu seòlta eadar gluasad seicichean agus Seirbheis nan Cìsean agus a tha a-nis a’ feuchainn ri dàta a reic ris a h-uile duine. Gu dearbh, rinn iad sgrios air a’ mhargaidh anailis gluasadach gu lèir. Gu dearbh, faodaidh tu an tagradh agad fhighe a-steach, mar eisimpleir, am piogsail Facebook, an siostam DMP aige; an uairsin cleachd an luchd-èisteachd seo airson a reic. Mar eisimpleir, am piogsail “Targaid May”. Chan eil fios agam dè an seòrsa luchd-èisteachd a th’ agad, feumaidh tu tuigsinn. Ach co-dhiù, faodaidh tu fhilleadh a-steach do Yandex no My Target, a tha na siostaman DMP as motha.

Is e sgeulachd gu math inntinneach a tha seo. Is e an aon dhuilgheadas gum bi thu a 'toirt dhaibh an trafaig gu lèir, agus bidh iadsan, mar luchd-iomlaid, a' gabhail orra fhèin monetization an trafaig seo. Is dòcha gu bheil no nach innis iad dhut gu bheil 10 neach air an luchd-èisteachd agad a chleachdadh. Mar sin, an dàrna cuid bidh thu a’ togail an lìonra sanasachd agad fhèin, no a’ gèilleadh do DMPan mòra.

Cò a bhuannaicheas - an neach-ealain neo an techie?

Z: - Ceist beagan air falbh bhon phàirt theicnigeach. Chaidh a ràdh mu na h-eagal a bha air luchd-margaidh mun t-uabhas cion-cosnaidh a bha ri thighinn. A bheil seòrsa de strì farpaiseach ann eadar margaidheachd chruthachail (na daoine sin a thàinig suas le sanasachd cearc, sanasachd Volkswagen, tha e coltach) agus an fheadhainn a tha an sàs ann an Dàta Mòr (a tha ag ràdh: a-nis bidh sinn dìreach a’ cruinneachadh an dàta gu lèir agus a’ lìbhrigeadh sanasachd cuimsichte gu a h-uile duine)? Mar neach a tha an sàs gu dìreach, dè do bheachd air cò a bhuannaicheas - neach-ealain, teicneòlaiche, no am bi buaidh synergistic de sheòrsa air choreigin ann?

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

OH: - Èist, uill, bidh iad ag obair còmhla. Cha bhith innleadairean a’ tighinn suas le cruthachalachd. Chan eil an fheadhainn a tha cruthachail a 'cruthachadh luchd-èisteachd. Tha seòrsa de sgeulachd ioma-chuspaireil an seo. Tha na fìor dhuilgheadasan a-nis dhaibhsan a bhios a’ suidhe agus a’ brùthadh putanan, dhaibhsan a nì an “obair muncaidh”, a’ putadh an aon rud a h-uile latha - is iad sin na daoine a thèid à bith.

Ach fuirichidh an fheadhainn a nì mion-sgrùdadh air an dàta gu nàdarra, ach feumaidh cuideigin an dàta seo a phròiseasadh. Feumaidh cuideigin na dealbhan seo a thogail, an tarraing. Chan urrainn dha inneal a leithid de chruthachalachd a chruthachadh! Is e cuthach iomlan a tha seo! No mar, mar eisimpleir, sanasachd viral Carprice, a bha, leis an t-slighe, ag obair glè mhath. Cuimhnich, bha am fear seo air YouTube: “Sell e aig Carprice,” gu tur craicte. Gu dearbh, cha ghineadh lìonra neòil a leithid de sgeulachd.
San fharsaingeachd, tha mi a’ toirt taic don fhìrinn nach e daoine a chailleas an cuid obrach, ach bidh beagan a bharrachd ùine shaor aca, agus bidh e comasach dhaibh an ùine shaor seo a chaitheamh air fèin-fhoghlam.

Bidh sanasachd prìomhadail a’ bàsachadh

Z: - Gu ìre mhòr, chan eil an t-sanasachd a tha air a shealltainn, na brataichean - gu ìre mhòr, eadhon teacsaichean reic air an sgrìobhadh an sin: “Feumaidh tu uinneagan - gabh e!”, “Feumaidh tu rudeigin eile - gabh e!”, is e sin, chan eil cruthachalachd ann idir.

OH: - Bidh sanasachd mar seo a’ bàsachadh, gu dearbh, luath no mall. Bàsaichidh e a-mach chan ann mar thoradh air leasachadh teicneòlais, ach air sgàth an leasachadh a tha thu fhèin agus mise.

Tha e nas fheàrr an stuth iomchaidh a mheasgachadh leis an fheadhainn nach eil buntainneach

Z: - Tha mi an seo! Tha ceist agam mun deuchainn a thuirt thu nach do dh’ obraich a-mach dhut (leis an t-siostam molaidh). Nad bheachd-sa, an e an duilgheadas a chaidh a shoidhnigeadh an sin, carson a thathas a ’moladh, no an e gu robh a h-uile dad a chunnaic an neach-cleachdaidh a’ coimhead buntainneach dha? Leis gun do leugh mi deuchainn airson màthraichean, agus cha robh uimhir de dhàta ann fhathast, agus cha robh uimhir de dhàta ann bhon eadar-lìn, cha robh ann ach dàta bho neach-reic grosaireachd a bha a ’ro-innse torrachas (gum biodh iad nam màthraichean). Agus nuair a sheall iad taghadh de stuthan airson màthraichean a bha an dùil, bha màthraichean air an uabhasachadh gun d'fhuair iad a-mach mun deidhinn ro rudan oifigeil sam bith. Agus cha do dh'obraich e. Agus gus an duilgheadas seo fhuasgladh, bha iad a dh’aona ghnothach a’ measgachadh thoraidhean buntainneach le rudeigin gu tur neo-iomchaidh.

Arthur Khachuyan: innleachdas fuadain ann am margaidheachd

OH: “Sheall sinn gu sònraichte do dhaoine am bunait air an deach na molaidhean a dhèanamh gus am fios air ais a thuigsinn. Gu fìrinneach, is ann an seo a rugadh am bun-bheachd nach fheum daoine innse gur e seo cuid de thoraidhean air leth buntainneach dha.

Tha, leis an t-slighe, tha dòigh ann airson am measgachadh le feadhainn nach eil buntainneach. Ach tha an rud eile ann: uaireannan bidh daoine a’ tighinn a-steach agus ag eadar-obrachadh leis an toradh neo-iomchaidh seo - bidh outliers air thuaiream a’ tachairt, bidh modalan a’ briseadh agus bidh cùisean a’ fàs eadhon nas toinnte. Ach gu dearbh tha seo ann. A bharrachd air an sin, bidh mòran chompanaidhean a dh’aona ghnothach, ma tha fios aca gu bheil cuideigin a ’giullachd an dàta aca (dh’ fhaodadh cuideigin an leithid de thoraidhean a ghoid bhuapa), bidh iad uaireannan ga mheasgachadh gus an urrainn dhaibh dearbhadh nas fhaide air adhart nach do ghabh thu an dàta bhon t-siostam molaidh aca, ach bho an t-ainm Yandex.Market.

Luchd-bacadh sanasachd agus tèarainteachd brabhsair

Z: - Halò. Thug thu iomradh air Ghostery agus Adblock. An innis thu dhuinn dè cho èifeachdach sa tha na lorgairean sin san fharsaingeachd (is dòcha stèidhichte air staitistig)? Agus an robh òrdughan sam bith agad bho chompanaidhean: tha iad ag ràdh, dèan cinnteach nach urrainn don t-sanasachd againn a bhith dùinte le Adblock.

OH: - Cha bhith sinn a’ conaltradh gu dìreach ri àrd-ùrlaran sanasachd - dìreach gus nach iarr iad an sanasachd aca a dhèanamh follaiseach don h-uile duine. Bidh mi gu pearsanta a’ cleachdadh Ghostery - tha mi a’ smaoineachadh gur e leudachadh gu math fionnar a th’ ann. A-nis tha a h-uile brobhsair a’ sabaid airson prìobhaideachd: tha Mozilla air dòrlach de gach seòrsa ùrachadh fhoillseachadh, tha Google Chrome a-nis air leth tèarainte. Bidh iad uile a’ bacadh a h-uile rud as urrainn dhaibh. Tha “Safari” eadhon air “Gyroscope” a chuir dheth gu bunaiteach.
Agus tha an gluasad seo, gu dearbh, math (chan ann airson an fheadhainn a bhios a 'tional dàta, ged a fhuair iad a-mach às cuideachd), oir chuir daoine bacadh air briosgaidean an toiseach. Bha cuimhne aig a h-uile duine aig an robh lìonraidhean sanasachd air teicneòlas cho math ri lorgan-meòir brabhsair - is iad sin algorithms a gheibh 60 paramadair eadar-dhealaichte (fuasgladh sgrion, dreach, clòidean stàlaichte) agus stèidhichte orra bidh iad a’ tomhas “ID” sònraichte. Gluaisidh sinn air adhart gu seo. Agus thòisich brobhsairean a’ strì le seo. San fharsaingeachd, bidh seo na bhlàr gun chrìoch de na titans.

Tha an leasaiche Mozilla as ùire gu math tèarainte. Bidh e a 'sàbhaladh cha mhòr nach eil briosgaidean ann agus a' suidheachadh beatha ghoirid. Gu sònraichte ma thionndaidheas tu air “Incognito”, chan fhaigh duine thu idir. Is e a’ cheist am bi e mì-ghoireasach faclan-faire a chuir a-steach anns a h-uile seirbheis.

Càite a bheil psychotyping agus physiognomy ag obair agus nach eil ag obair?

Z: - Artair, mòran taing airson an òraid. Tha e a’ còrdadh rium cuideachd na h-òraidean agad a leantainn air YouTube. Thuirt thu gu bheil luchd-margaidh a’ sìor fhàs a’ cleachdadh psychotyping agus physiognomy. Is e mo cheist: dè na roinnean branda anns a bheil seo ag obair? Is e mo bheachd nach eil seo freagarrach ach airson FMCG. Mar eisimpleir, tha taghadh càr ...

OH: - Is urrainn dhomh luchdachadh sìos far a bheil e ag obair gu dìreach. Tha seo ag obair anns a h-uile seòrsa de sgeulachdan mar "Amediateka", sreath TBh, filmichean agus mar sin air adhart. Bidh seo ag obair gu math ann am bancaichean agus toraidhean bancaidh, mura h-e am prìomh roinn, ach a h-uile seòrsa de chairtean oileanach, planaichean cuibhreannan - na seòrsaichean rudan sin. Tha seo dha-rìribh ag obair glè mhath ann am FMCG agus a h-uile seòrsa de iPhones, chargers, a h-uile crap seo. Tha seo ag obair gu math ann am bathar “mama is pop”. Ged a tha fios agam gu bheil ann an iasgach (tha leithid de chuspair ann)... Tha cùisean air a bhith ann le iasgairean grunn thursan - chan urrainn dhaibh a-riamh a bhith air an sgaradh gu earbsach. Chan eil fios agam carson. Seòrsa de mhearachd staitistigeil.

Chan eil seo ag obair gu math le draibhearan, le seudaireachd, no le cuid de stuthan taighe. Gu dearbh, chan eil e ag obair gu math le rudan nach biodh daoine gu bràth a’ sgrìobhadh mu dheidhinn air na meadhanan sòisealta - faodaidh tu sgrùdadh a dhèanamh air san dòigh seo. Gu gnàthach, le ceannach inneal nigheadaireachd: seo mar a thuigeas tu cò aig a bheil inneal nigheadaireachd agus cò aig nach eil? Tha e coltach gu bheil e aig a h-uile duine. Faodaidh tu dàta OFD a chleachdadh - faic cò cheannaich dè a’ cleachdadh cuidhteasan, agus maids na daoine sin a’ cleachdadh cuidhteasan. Ach gu dearbh, tha rudan ann nach biodh tu a-riamh a ’bruidhinn mu dheidhinn, mar eisimpleir, air Instagram - tha e duilich a bhith ag obair le rudan mar sin.

Bidh innealan ag aithneachadh cleasan mar stuth staitistigeil.

Z: - Tha ceist agam mu bhith ag amas. A bheil e comasach (no a bheil iad ann gu h-obann) de charactar air thuaiream cumhach a tha a’ dol an aghaidh a h-uile càil: an toiseach tha e “na gyms as fheàrr” aig Google, agus an uairsin tha e “10 dòighean gun dad a dhèanamh” aig Google? Agus mar sin tha e anns a h-uile càil. An urrainn dha targaid sùil a chumail air rudeigin a tha an aghaidh a chèile?

OH: - Is e seo an aon cheist an seo: ma tha thu air a bhith a’ cleachdadh Google airson 2 bhliadhna, dh’ innis thu a h-uile dad as urrainn dhut mu do dheidhinn fhèin, agus a-nis stàlaich plugan dhut fhèin a sgrìobhas ceistean air thuaiream coltach ris, an uairsin, gu dearbh, bho na staitistig a nì thu a bhith comasach air tuigsinn - tha na tha thu a’ dèanamh a-nis na rud staitistigeil a-muigh, agus tha seo uile na chùis criathradh. Ma tha thu ag iarraidh, clàraich cunntas ùr, ach cha atharraich an ìre sanasachd. Bidh i dìreach neònach. Ged a tha i fhathast neònach.

Cuid de shanasan 🙂

Tapadh leibh airson fuireach còmhla rinn. An toil leat na h-artaigilean againn? A bheil thu airson susbaint nas inntinniche fhaicinn? Thoir taic dhuinn le bhith a’ cur òrdugh no a’ moladh do charaidean, sgòth VPS airson luchd-leasachaidh bho $4.99, analog sònraichte de luchd-frithealaidh ìre inntrigidh, a chaidh a chruthachadh leinn dhut: An fhìrinn gu lèir mu VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps bho $ 19 no ciamar a roinn thu frithealaiche? (ri fhaighinn le RAID1 agus RAID10, suas ri 24 cores agus suas ri 40GB DDR4).

Dell R730xd 2x nas saoire ann an ionad dàta Equinix Tier IV ann an Amsterdam? A-mhàin an seo 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV bho $199 anns an Òlaind! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - bho $99! Leugh mu dheidhinn Ciamar a thogail bun-structair Corp. clas le bhith a’ cleachdadh frithealaichean Dell R730xd E5-2650 v4 luach 9000 iùro airson sgillinn?

Source: www.habr.com

Cuir beachd ann