NeurIPS 2019: Mitindo ya ML ambayo itakuwa nasi kwa muongo ujao

NeuroIPS (Mifumo ya Usindikaji wa Taarifa za Neural) ni mkutano mkubwa zaidi duniani wa kujifunza kwa mashine na akili bandia na tukio kuu katika ulimwengu wa kujifunza kwa kina.

Je, sisi, wahandisi wa DS, pia tutabobea katika biolojia, isimu na saikolojia katika muongo mpya? Tutakuambia katika ukaguzi wetu.

NeurIPS 2019: Mitindo ya ML ambayo itakuwa nasi kwa muongo ujao

Mwaka huu mkutano huo ulileta pamoja zaidi ya watu 13500 kutoka nchi 80 huko Vancouver, Kanada. Huu sio mwaka wa kwanza ambao Sberbank imewakilisha Urusi katika mkutano huo - timu ya DS ilizungumza kuhusu utekelezaji wa ML katika michakato ya benki, kuhusu ushindani wa ML na kuhusu uwezo wa jukwaa la Sberbank DS. Je, ni mitindo gani kuu ya 2019 katika jumuiya ya ML? Washiriki wa mkutano wanasema: Andrey Chertok ΠΈ Tatyana Shavrina.

Mwaka huu, NeurIPS ilikubali zaidi ya karatasi 1400β€”algorithms, miundo mipya na programu mpya kwa data mpya. Unganisha kwa nyenzo zote

Yaliyomo:

  • Mwelekeo
    • Ufafanuzi wa mfano
    • Taaluma nyingi
    • Hoja
    • RL
    • Gan
  • Mazungumzo ya Msingi ya Kualikwa
    • "Social Intelligence", Blaise Aguera y Arcas (Google)
    • "Sayansi ya Takwimu ya Haki", Bin Yu (Berkeley)
    • "Kuiga Tabia ya Kibinadamu kwa Kujifunza kwa Mashine: Fursa na Changamoto", Nuria M Oliver, Albert Ali Salah
    • "Kutoka Mfumo wa 1 hadi Mfumo wa 2 wa Mafunzo ya kina", Yoshua Bengio

Mitindo ya 2019

1. Ufafanuzi wa kielelezo na mbinu mpya ya ML

Mada kuu ya mkutano huo ni tafsiri na ushahidi wa kwa nini tunapata matokeo fulani. Mtu anaweza kuzungumza kwa muda mrefu juu ya umuhimu wa falsafa ya tafsiri ya "sanduku nyeusi", lakini kulikuwa na mbinu halisi zaidi na maendeleo ya kiufundi katika eneo hili.

Mbinu ya kunakili modeli na kupata maarifa kutoka kwayo ni zana mpya ya sayansi. Mitindo inaweza kutumika kama zana ya kupata maarifa mapya na kuyajaribu, na kila hatua ya usindikaji wa awali, mafunzo na utumiaji wa modeli lazima iweze kuzaliana.
Sehemu kubwa ya machapisho haijatolewa kwa ujenzi wa mifano na zana, lakini kwa shida za kuhakikisha usalama, uwazi na uthibitishaji wa matokeo. Hasa, mkondo tofauti umeonekana kuhusu mashambulizi ya mfano (mashambulizi ya adui), na chaguzi za mashambulizi yote juu ya mafunzo na mashambulizi ya maombi huzingatiwa.

Makala:

NeurIPS 2019: Mitindo ya ML ambayo itakuwa nasi kwa muongo ujao
ExBert.net inaonyesha tafsiri ya mfano kwa kazi za usindikaji wa maandishi

2. Taaluma nyingi

Ili kuhakikisha uthibitishaji unaotegemewa na kubuni mbinu za kuthibitisha na kupanua maarifa, tunahitaji wataalamu katika nyanja zinazohusiana ambao kwa wakati mmoja wana ujuzi katika ML na katika eneo la somo (dawa, isimu, neurobiolojia, elimu, n.k.). Inastahili kuzingatia uwepo muhimu zaidi wa kazi na hotuba katika sayansi ya neva na sayansi ya utambuzi - kuna ukaribu wa wataalam na kukopa kwa maoni.

Mbali na ukaribu huu, taaluma nyingi zinajitokeza katika usindikaji wa pamoja wa habari kutoka kwa vyanzo anuwai: maandishi na picha, maandishi na michezo, hifadhidata za grafu + maandishi na picha.

Makala:

NeurIPS 2019: Mitindo ya ML ambayo itakuwa nasi kwa muongo ujao
Miundo miwili - mwanamkakati na mtendaji - kulingana na mkakati wa kucheza mtandaoni wa RL na NLP

3. Kujadili

Kuimarisha akili ya bandia ni harakati kuelekea mifumo ya kujifunza binafsi, "fahamu", hoja na hoja. Hasa, uelekezaji wa sababu na hoja za kawaida zinaendelea. Baadhi ya ripoti zimejikita katika mafunzo ya meta (kuhusu jinsi ya kujifunza kujifunza) na mchanganyiko wa teknolojia za DL zenye mantiki ya mpangilio wa 1 na wa 2 - neno Artificial General Intelligence (AGI) linakuwa neno la kawaida katika hotuba za wazungumzaji.

Makala:

4.Kuimarisha Mafunzo

Kazi nyingi zinaendelea kuendeleza maeneo ya jadi ya RL - DOTA2, Starcraft, kuchanganya usanifu na maono ya kompyuta, NLP, hifadhidata za grafu.

Siku tofauti ya mkutano ilitolewa kwa warsha ya RL, ambapo usanifu wa Optimistic Actor Critic Model uliwasilishwa, bora kuliko zote za awali, hasa Soft Actor Critic.

Makala:

NeurIPS 2019: Mitindo ya ML ambayo itakuwa nasi kwa muongo ujao
Wachezaji wa StarCraft wanapambana na mtindo wa Alphastar (DeepMind)

5.GAN

Mitandao ya uzalishaji bado iko katika uangalizi: kazi nyingi hutumia GAN za vanilla kwa uthibitisho wa hisabati, na pia huzitumia kwa njia mpya, zisizo za kawaida (miundo ya kuzalisha grafu, kufanya kazi na mfululizo, maombi ya kusababisha-na-athari uhusiano katika data, nk.).

Makala:

Kwa kuwa kazi zaidi ilikubaliwa 1400 Hapo chini tutazungumza juu ya hotuba muhimu zaidi.

Mazungumzo Yanayoalikwa

"Social Intelligence", Blaise Aguera y Arcas (Google)

Kiungo
Slaidi na video
Mazungumzo hayo yanaangazia mbinu ya jumla ya kujifunza kwa mashine na matarajio ya kubadilisha tasnia hivi sasa - ni njia panda zipi tunazokabiliana nazo? Ubongo na mageuzi hufanyaje kazi, na kwa nini sisi hutumia kidogo sana kile tunachojua tayari kuhusu ukuzi wa mifumo ya asili?

Maendeleo ya kiviwanda ya ML kwa kiasi kikubwa yanawiana na hatua muhimu za maendeleo ya Google, ambayo huchapisha utafiti wake kuhusu NeurIPS mwaka baada ya mwaka:

  • 1997 - uzinduzi wa vituo vya utafutaji, seva za kwanza, nguvu ndogo za kompyuta
  • 2010 - Jeff Dean anazindua mradi wa Google Brain, ukuaji wa mitandao ya neural mwanzoni kabisa
  • 2015 - utekelezaji wa viwanda wa mitandao ya neva, utambuzi wa uso wa haraka moja kwa moja kwenye kifaa cha ndani, vichakataji vya kiwango cha chini vilivyoundwa kwa ajili ya kompyuta ya tensor - TPU. Google yazindua Coral ai - analogi ya raspberry pi, kompyuta ndogo kwa ajili ya kuanzisha mitandao ya neva katika usakinishaji wa majaribio
  • 2017 - Google inaanza kutengeneza mafunzo yaliyogatuliwa na kuchanganya matokeo ya mafunzo ya mtandao wa neva kutoka kwa vifaa tofauti hadi muundo mmoja - kwenye Android.

Leo, tasnia nzima imejitolea kwa usalama wa data, ujumlishaji na urudufishaji wa matokeo ya kujifunza kwenye vifaa vya ndani.

Kujifunza kwa Shirikisho - mwelekeo wa ML ambapo miundo ya mtu binafsi hujifunza kwa kujitegemea na kisha kuunganishwa kuwa mfano mmoja (bila kuweka data ya chanzo kati), iliyorekebishwa kwa matukio adimu, hitilafu, ubinafsishaji, n.k. Vifaa vyote vya Android kimsingi ni kompyuta kuu moja ya Google.

Miundo ya uzalishaji kulingana na ujifunzaji ulioshirikishwa ni mwelekeo mzuri wa siku zijazo kulingana na Google, ambayo "iko katika hatua za awali za ukuaji mkubwa." GAN, kulingana na mhadhiri, zina uwezo wa kujifunza kuzaliana tabia ya wingi wa viumbe hai na algorithms ya kufikiria.

Kwa kutumia mfano wa usanifu mbili rahisi wa GAN, inaonyeshwa kuwa ndani yao utaftaji wa njia ya uboreshaji huzunguka kwenye mduara, ambayo inamaanisha kuwa uboreshaji kama huo haufanyiki. Wakati huo huo, mifano hii inafanikiwa sana katika kuiga majaribio ambayo wanabiolojia hufanya juu ya idadi ya bakteria, na kuwalazimisha kujifunza mikakati mpya ya tabia katika kutafuta chakula. Tunaweza kuhitimisha kuwa maisha hufanya kazi tofauti na utendaji wa uboreshaji.

NeurIPS 2019: Mitindo ya ML ambayo itakuwa nasi kwa muongo ujao
Uboreshaji wa GAN ya Kutembea

Yote tunayofanya katika mfumo wa kujifunza kwa mashine sasa ni kazi finyu na zilizorasimishwa sana, ilhali taratibu hizi hazishirikiani vizuri na hazilingani na maarifa yetu ya somo katika maeneo kama vile neurofiziolojia na baiolojia.

Kinachofaa sana kukopa kutoka kwa uwanja wa neurophysiology katika siku za usoni ni usanifu mpya wa neuroni na marekebisho kidogo ya mifumo ya uenezaji wa makosa.

Ubongo wa mwanadamu wenyewe haujifunzi kama mtandao wa neva:

  • Yeye hana pembejeo za kimsingi za nasibu, pamoja na zile zilizowekwa kupitia hisi na utotoni
  • Ana mwelekeo wa asili wa ukuaji wa silika (hamu ya kujifunza lugha kutoka kwa mtoto mchanga, kutembea wima)

Kufunza ubongo wa mtu binafsi ni kazi ya kiwango cha chini; labda tunapaswa kuzingatia "koloni" za watu binafsi wanaobadilika kwa haraka kupitisha ujuzi kwa kila mmoja ili kuzalisha taratibu za mageuzi ya kikundi.

Tunachoweza kupitisha katika algoriti za ML sasa:

  • Tumia mifano ya ukoo wa seli ambayo inahakikisha ujifunzaji wa idadi ya watu, lakini maisha mafupi ya mtu binafsi ("ubongo wa mtu binafsi")
  • Kujifunza kwa risasi chache kwa kutumia idadi ndogo ya mifano
  • Miundo ngumu zaidi ya neuroni, kazi tofauti kidogo za uanzishaji
  • Kuhamisha "jenomu" kwa vizazi vijavyo - algorithm ya uenezi nyuma
  • Mara tu tunapounganisha niurofiziolojia na mitandao ya neva, tutajifunza kujenga ubongo wenye kazi nyingi kutoka kwa vipengele vingi.

Kwa mtazamo huu, mazoezi ya ufumbuzi wa SOTA ni mabaya na yanapaswa kurekebishwa kwa ajili ya kuendeleza kazi za kawaida (benchmarks).

"Sayansi ya Takwimu ya Haki", Bin Yu (Berkeley)

Video na slaidi
Ripoti hii imejikita kwa tatizo la kutafsiri miundo ya mashine ya kujifunza na mbinu ya majaribio yao ya moja kwa moja na uthibitishaji. Muundo wowote wa ML uliofunzwa unaweza kutambuliwa kama chanzo cha maarifa ambacho kinahitaji kutolewa kutoka humo.

Katika maeneo mengi, haswa katika dawa, utumiaji wa modeli hauwezekani bila kutoa maarifa haya yaliyofichwa na kutafsiri matokeo ya mfano - vinginevyo hatutakuwa na uhakika kuwa matokeo yatakuwa thabiti, yasiyo ya nasibu, ya kuaminika, na hayataua mgonjwa. Mwelekeo mzima wa mbinu ya kazi unakuzwa ndani ya dhana ya kina ya kujifunza na kwenda nje ya mipaka yake - sayansi ya data veridical. Ni nini?

Tunataka kufikia ubora wa machapisho ya kisayansi na uigaji wa mifano ambayo ni:

  1. kutabirika
  2. inayoweza kutekelezeka
  3. imara

Kanuni hizi tatu zinaunda msingi wa mbinu mpya. Je, mifano ya ML inawezaje kuangaliwa dhidi ya vigezo hivi? Njia rahisi ni kujenga mifano inayoweza kufasirika mara moja (regressions, miti ya uamuzi). Hata hivyo, tunataka pia kupata manufaa ya haraka ya kujifunza kwa kina.

Njia kadhaa zilizopo za kushughulikia shida:

  1. kutafsiri mfano;
  2. tumia njia kulingana na umakini;
  3. tumia mikusanyiko ya algoriti wakati wa mafunzo, na uhakikishe kuwa miundo ya mstari inayotafsirika inajifunza kutabiri majibu sawa na mtandao wa neva, vipengele vya kutafsiri kutoka kwa modeli ya mstari;
  4. kubadilisha na kuongeza data ya mafunzo. Hii ni pamoja na kuongeza kelele, kuingiliwa, na kuongeza data;
  5. njia zozote zinazosaidia kuhakikisha kuwa matokeo ya mfano sio ya bahati nasibu na haitegemei uingilivu mdogo usiohitajika (mashambulizi ya wapinzani);
  6. kutafsiri mfano baada ya ukweli, baada ya mafunzo;
  7. utafiti kipengele uzito kwa njia mbalimbali;
  8. soma uwezekano wa nadharia zote, usambazaji wa darasa.

NeurIPS 2019: Mitindo ya ML ambayo itakuwa nasi kwa muongo ujao
Shambulio la adui kwa nguruwe

Makosa ya uundaji mfano ni ya gharama kwa kila mtu: mfano mkuu ni kazi ya Reinhart na Rogov."Ukuaji katika wakati wa deni" iliathiri sera za kiuchumi za nchi nyingi za Ulaya na kuzilazimisha kufuata sera za kubana matumizi, lakini ukaguzi wa uangalifu wa data na usindikaji wao miaka ya baadaye ulionyesha matokeo tofauti!

Teknolojia yoyote ya ML ina mzunguko wake wa maisha kutoka kwa utekelezaji hadi utekelezaji. Lengo la mbinu mpya ni kuangalia kanuni tatu za msingi katika kila hatua ya maisha ya modeli.

Matokeo:

  • Miradi kadhaa inatengenezwa ambayo itasaidia kielelezo cha ML kuwa cha kutegemewa zaidi. Hii ni, kwa mfano, deeptune (kiungo kwa: github.com/ChrisCummins/paper-end2end-dl);
  • Kwa maendeleo zaidi ya mbinu, ni muhimu kuboresha kwa kiasi kikubwa ubora wa machapisho katika uwanja wa ML;
  • Kujifunza kwa mashine kunahitaji viongozi walio na mafunzo ya taaluma mbalimbali na utaalam katika nyanja za kiufundi na za kibinadamu.

"Kuiga Tabia ya Kibinadamu kwa Kujifunza kwa Mashine: Fursa na Changamoto" Nuria M Oliver, Albert Ali Salah

Hotuba inayotolewa kwa kuiga tabia ya binadamu, misingi yake ya kiteknolojia na matarajio ya matumizi.

Mfano wa tabia ya kibinadamu inaweza kugawanywa katika:

  • tabia ya mtu binafsi
  • tabia ya kikundi kidogo cha watu
  • tabia ya wingi

Kila moja ya aina hizi zinaweza kutengenezwa kwa kutumia ML, lakini kwa taarifa na vipengele tofauti kabisa vya uingizaji. Kila aina pia ina masuala yake ya kimaadili ambayo kila mradi hupitia:

  • tabia ya mtu binafsi - wizi wa utambulisho, kina bandia;
  • tabia ya makundi ya watu - de-anonymization, kupata taarifa kuhusu harakati, simu, nk;

tabia ya mtu binafsi

Inahusiana sana na mada ya Maono ya Kompyuta - utambuzi wa hisia na athari za binadamu. Labda tu katika muktadha, kwa wakati, au kwa kiwango cha jamaa cha tofauti zake za mhemko. Slaidi inaonyesha utambuzi wa hisia za Mona Lisa kwa kutumia muktadha kutoka kwa wigo wa kihisia wa wanawake wa Mediterania. Matokeo: tabasamu la furaha, lakini kwa dharau na karaha. Sababu ni uwezekano mkubwa katika njia ya kiufundi ya kufafanua hisia "neutral".

Tabia ya kikundi kidogo cha watu

Hadi sasa mfano mbaya zaidi ni kutokana na taarifa zisizo za kutosha. Kwa mfano, kazi kutoka 2018 - 2019 zilionyeshwa. kwa watu kadhaa X kadhaa wa video (cf. 100k++ seti za picha za picha). Ili kutoa mfano bora wa kazi hii, maelezo ya multimodal inahitajika, ikiwezekana kutoka kwa sensorer kwenye altimeter ya mwili, kipimajoto, kurekodi kipaza sauti, nk.

Tabia ya wingi

Eneo lililoendelea zaidi, kwani mteja ni UN na majimbo mengi. Kamera za uchunguzi wa nje, data kutoka kwa minara ya simu - bili, SMS, simu, data juu ya harakati kati ya mipaka ya serikali - yote haya yanatoa picha ya kuaminika sana ya harakati za watu na machafuko ya kijamii. Utumizi unaowezekana wa teknolojia: uboreshaji wa shughuli za uokoaji, usaidizi na uhamishaji wa watu kwa wakati wakati wa dharura. Mitindo inayotumika bado haijafasiriwa vibaya - hizi ni LSTM na mitandao ya ubadilishaji. Kulikuwa na maelezo mafupi kwamba Umoja wa Mataifa ulikuwa unashawishi kuwepo kwa sheria mpya ambayo ingewalazimu wafanyabiashara wa Ulaya kushiriki data isiyojulikana inayohitajika kwa utafiti wowote.

"Kutoka Mfumo wa 1 hadi Mfumo wa 2 wa Mafunzo ya kina", Yoshua Bengio

Slaidi
Katika somo la Joshua Bengio, kujifunza kwa kina hukutana na sayansi ya neva katika kiwango cha kuweka malengo.
Bengio anabainisha aina mbili kuu za matatizo kulingana na mbinu ya mshindi wa Tuzo ya Nobel Daniel Kahneman (kitabu β€œFikiria polepole, amua haraka")
aina ya 1 - Mfumo wa 1, vitendo vya kutojua ambavyo tunafanya "moja kwa moja" (ubongo wa zamani): kuendesha gari katika maeneo uliyozoea, kutembea, kutambua nyuso.
aina ya 2 - Mfumo wa 2, vitendo vya ufahamu (cortex ya ubongo), kuweka lengo, uchambuzi, kufikiri, kazi za mchanganyiko.

AI hadi sasa imefikia urefu wa kutosha tu katika kazi za aina ya kwanza, wakati kazi yetu ni kuileta kwa pili, kuifundisha kufanya shughuli za aina mbalimbali na kufanya kazi kwa mantiki na ujuzi wa juu wa utambuzi.

Ili kufikia lengo hili inapendekezwa:

  1. katika kazi za NLP, tumia umakini kama njia kuu ya kufikiria kielelezo
  2. tumia mafunzo ya meta na uwakilishi ili kuboresha vipengele vya muundo vinavyoathiri fahamu na ujanibishaji wao - na kwa misingi yao kuendelea na uendeshaji na dhana za kiwango cha juu.

Badala ya hitimisho, hapa kuna mazungumzo yaliyoalikwa: Bengio ni mmoja wa wanasayansi wengi ambao wanajaribu kupanua uwanja wa ML zaidi ya shida za uboreshaji, SOTA na usanifu mpya.
Swali linabaki wazi ni kwa kiwango gani mchanganyiko wa shida za fahamu, ushawishi wa lugha kwenye fikra, neurobiolojia na algorithms ndio unatungojea katika siku zijazo na itaturuhusu kuhamia mashine ambazo "hufikiria" kama watu.

Asante!



Chanzo: mapenzi.com

Kuongeza maoni