🥇NeurIPS 2019: ML tendences, kas būs ar mums nākamajā desmitgadē

NeuroIPS (Neironu informācijas apstrādes sistēmas) ir pasaulē lielākā konference par mašīnmācību un mākslīgo intelektu un galvenais notikums dziļās mācīšanās pasaulē.

Vai mēs, DS inženieri, jaunajā desmitgadē apgūsim arī bioloģiju, valodniecību un psiholoģiju? Mēs jums to pastāstīsim savā pārskatā.

Šogad konference pulcēja vairāk nekā 13500 80 cilvēku no 2019 valstīm Vankūverā, Kanādā. Šis nav pirmais gads, kad Sberbank konferencē pārstāv Krieviju - DS komanda stāstīja par ML ieviešanu banku procesos, par ML konkurenci un par Sberbank DS platformas iespējām. Kādas bija XNUMX. gada galvenās tendences ML sabiedrībā? Konferences dalībnieki saka: Andrejs Čertoks и Tatjana Šavrina.

Šogad NeurIPS pieņēma vairāk nekā 1400 dokumentus — algoritmus, jaunus modeļus un jaunas lietojumprogrammas jauniem datiem. Saite uz visiem materiāliem

Saturs:

Tendences
- Modeļa interpretējamība
- Multidisciplinaritāte
- Pamatojums
- RL
- GAN
Pamata ielūgtās sarunas
- “Sociālā inteliģence”, Blēzs Agvera un Arkass (Google)
- “Veridical Data Science”, Bin Yu (Berkeley)
- “Cilvēka uzvedības modelēšana ar mašīnmācīšanos: iespējas un izaicinājumi”, Nuria M Oliver, Alberts Ali Salahs
- “No 1. sistēmas uz sistēmu 2. dziļā mācīšanās”, Jošua Bendžo

Tendences 2019. gadā

1. Modeļu interpretējamība un jauna ML metodoloģija

Konferences galvenā tēma ir interpretācija un pierādījumi tam, kāpēc mēs iegūstam noteiktus rezultātus. Var ilgi runāt par “melnās kastes” interpretācijas filozofisko nozīmi, taču šajā jomā bija vairāk reālu metožu un tehnikas attīstības.

Metodoloģija modeļu replicēšanai un zināšanu iegūšanai no tiem ir jauns zinātnes instrumentu kopums. Modeļi var kalpot kā instruments jaunu zināšanu iegūšanai un to pārbaudei, un katram modeļa priekšapstrādes, apmācības un pielietojuma posmam jābūt reproducējamam.
Ievērojama publikāciju daļa ir veltīta nevis modeļu un rīku konstruēšanai, bet gan drošības, caurskatāmības un rezultātu pārbaudāmības nodrošināšanas problēmām. Jo īpaši ir parādījusies atsevišķa straume par uzbrukumiem modelim (pretēja uzbrukumi), un tiek apsvērtas iespējas gan uzbrukumiem apmācībai, gan uzbrukumiem lietojumprogrammai.

Raksti:

Veridālā datu zinātne — programmatisks raksts par modeļu pārbaudes metodoloģiju. Ietver pārskatu par mūsdienu modeļu interpretācijas rīkiem, jo īpaši par uzmanības izmantošanu un pazīmju svarīguma iegūšanu, “destilējot” neironu tīklu ar lineāriem modeļiem.
Tas izskatās šādi: dziļa mācīšanās interpretējama attēla atpazīšanai Čaofans Čens, Oskars Li, Daniels Tao, Alīna Bārneta, Sintija Rudina, Džonatans K. Su
Interpretējamības metožu etalons dziļajos neironu tīklos Sāra Hukere, Dumitru Erana, Pīters-Jans Kindermans, Been Kim
Ceļā uz interpretējamu pastiprināšanas mācīšanos, izmantojot uzmanības pastiprinātus līdzekļus Aleksandrs Mots, Daniels Zorans, Maiks Hrzanovskis, Dāns Virštra, Danilo Himeness Rezende
Novirzīts MDI funkcijas nozīmes mērs nejaušiem mežiem Sjao Li, Ju Vans, Sumanta Basu, Kārlis Kumbjers, Bin Ju
Zināšanu iegūšana bez novērojamiem datiem Jaemin Yoo, Minyong Cho, Taebum Kim, U Kang
Solis ceļā uz patstāvīgi reproducējamu mašīnmācības pētījumu kvantitatīvu noteikšanu Edvards Rafs

ExBert.net parāda modeļa interpretāciju teksta apstrādes uzdevumiem

2. Multidisciplinaritāte

Lai nodrošinātu uzticamu verifikāciju un izstrādātu mehānismus zināšanu pārbaudei un paplašināšanai, mums ir nepieciešami saistītu nozaru speciālisti, kuriem vienlaikus ir kompetences ML un mācību priekšmetā (medicīna, valodniecība, neirobioloģija, izglītība uc). Īpaši jāatzīmē nozīmīgāka darbu un runu klātbūtne neirozinātnēs un kognitīvajās zinātnēs - notiek speciālistu tuvināšanās un ideju aizgūšana.

Papildus šai tuvināšanai, kopīgā informācijas apstrādē no dažādiem avotiem parādās multidisciplinaritāte: teksts un fotogrāfijas, teksts un spēles, grafiku datu bāzes + teksts un fotogrāfijas.

Raksti:

Neirozinātne + ML — Tulkošana un dabiskās valodas apstrādes uzlabošana (mašīnās) ar dabiskās valodas apstrādi (smadzenēs)
VisualQA — Mācīšanās ar abstrakcijas palīdzību: neironu stāvokļa mašīna
RL + NLP — Hierarhiska lēmumu pieņemšana, ģenerējot un ievērojot dabiskās valodas instrukcijas

Divi modeļi – stratēģis un izpilddirektors – balstīti uz RL un NLP spēles tiešsaistes stratēģiju

3. Pamatojums

Mākslīgā intelekta stiprināšana ir virzība uz pašmācības sistēmām, “apzinātu”, spriešanu un spriešanu. Jo īpaši attīstās cēloņsakarības secinājumi un veselā saprāta spriešana. Daži ziņojumi ir veltīti metamācībai (par to, kā iemācīties mācīties) un DL tehnoloģiju apvienošanai ar 1. un 2. kārtas loģiku – termins Artificial General Intelligence (AGI) kļūst par izplatītu terminu runātāju runās.

Raksti:

Heterogēnu grafiku apguve vizuālai saprātīgai spriešanai Weijiang Yu, Jingwen Zhou, Weihao Yu, Xiaodan Liang, Nong Xiao
Mašīnmācīšanās un loģiskā spriešanas savienošana ar abduktīvo mācīšanos Van-Džou Dai, Qiuling Xu, Yang Yu, Zhi-Hua Zhou
Netiešā veidā mācās spriest pirmās kārtas loģikā Vaišaks Belle, Brendans Džuba
PHYRE: jauns fiziskās spriešanas kritērijs Antons Bahtins, Lorensa van der Mātens, Džastins Džonsons, Laura Gustafsone, Ross Giršiks
Zināšanu kvantu iegulšana spriešanai Dinešs Gargs, Šadžits Ikbals, Santosh K. Srivastava, Harit Višvakarma, Hima Karanam, L Venkata Subramaniam

4. Pastiprināšanas mācības

Lielākā daļa darbu turpina attīstīt tradicionālās RL jomas - DOTA2, Starcraft, apvienojot arhitektūras ar datorredzi, NLP, grafu datubāzēm.

Atsevišķa konferences diena tika veltīta RL darbnīcai, kurā tika prezentēta Optimistic Actor Actor Critic modeļa arhitektūra, kas ir pārāka par visām iepriekšējām, īpaši Soft Actor Critic.

Raksti:

Labāka izpēte ar optimistisku aktiera kritiķi; Kamils Cioseks, Kvans Vuongs, Roberts Loftins, Katja Hofmane
ChainerRL: dziļas pastiprināšanas mācību bibliotēka; Yasuhiro Fujita (Preferred Networks, Inc.)*; Toshiki Kataoka (Preferred Networks, Inc.); Prabhat Nagarajan (vēlamie tīkli); Takahiro Ishikawa (Tokijas Universitāte) [ārēja pdf saite].
Sapnis, ko kontrolēt: slēptās iztēles mācīšanās uzvedība; Danijars Hafners (Google)*; Timotijs Lilikraps (DeepMind); Džimijs Ba (Toronto Universitāte); Mohammad Norouzi (Google Brain)
Darbnīcas materiāli

StarCraft spēlētāji cīnās ar Alphastar modeli (DeepMind)

5.GAN

Ģeneratīvie tīkli joprojām ir uzmanības centrā: daudzos darbos matemātiskiem pierādījumiem tiek izmantoti vaniļas GAN, kā arī tie tiek izmantoti jaunos, neparastos veidos (grafiku ģeneratīvie modeļi, darbs ar sērijām, pielietojums datu cēloņu un seku attiecībām utt.).

Raksti:

Zelta paraugu ieguve nosacījuma GAN Sangwoo Mo, Chiheon Kim, Sungwoong Kim, Minsu Cho, Jinwoo Shin
Progresīva GAN palielināšana Dens Džans, Anna Horeva
Tabulu datu modelēšana, izmantojot nosacījumu GAN Lei Sju, Marija Skularidou, Alfredo Kuesta-Infante, Kaljans Vēramačeneni
papers.nips.cc/paper/9377-a-domain-agnostic-measure-for-monitoring-and-evaluating-gans

Tā kā tika pieņemts vairāk darba 1400 Tālāk mēs runāsim par svarīgākajām runām.

Uzaicinātās sarunas

“Sociālā inteliģence”, Blēzs Agvera un Arkass (Google)

Saite
Slaidi un video
Saruna ir vērsta uz vispārējo mašīnmācīšanās metodoloģiju un perspektīvām, kas šobrīd mainīs nozari — ar kādām krustcelēm mēs saskaramies? Kā darbojas smadzenes un evolūcija, un kāpēc mēs tik maz izmantojam to, ko jau zinām par dabisko sistēmu attīstību?

ML rūpnieciskā attīstība lielā mērā sakrīt ar Google attīstības pavērsieniem, kas gadu no gada publicē savus pētījumus par NeurIPS:

1997. gads – meklēšanas iespēju palaišana, pirmie serveri, maza skaitļošanas jauda
2010. gads — Džefs Dīns uzsāk Google Brain projektu, neironu tīklu uzplaukumu pašā sākumā
2015. gads – neironu tīklu rūpnieciska ieviešana, ātra sejas atpazīšana tieši lokālajā ierīcē, zema līmeņa procesori, kas pielāgoti tenzoru skaitļošanai - TPU. Google izlaiž Coral ai — raspberry pi analogu — mini datoru neironu tīklu ieviešanai eksperimentālās instalācijās.
2017. gads — Google sāk izstrādāt decentralizētu apmācību un apvienot neironu tīklu apmācības rezultātus no dažādām ierīcēm vienā modelī — operētājsistēmā Android

Mūsdienās visa nozare ir veltīta datu drošībai, apkopošanai un mācību rezultātu replikācijai vietējās ierīcēs.

Federētā mācīšanās – ML virziens, kurā atsevišķi modeļi mācās neatkarīgi viens no otra un pēc tam tiek apvienoti vienā modelī (bez avota datu centralizācijas), kas pielāgots retiem notikumiem, anomālijām, personalizācijai utt. Visas Android ierīces būtībā ir viens skaitļošanas superdators uzņēmumam Google.

Ģeneratīvie modeļi, kuru pamatā ir apvienotā mācīšanās, ir daudzsološs nākotnes virziens, saskaņā ar Google, kas ir “eksponenciālās izaugsmes sākumposmā”. GAN, pēc lektora domām, spēj iemācīties reproducēt dzīvo organismu populāciju masveida uzvedību un domāšanas algoritmus.

Izmantojot divu vienkāršu GAN arhitektūru piemēru, tiek parādīts, ka tajās optimizācijas ceļa meklēšana klīst pa apli, kas nozīmē, ka optimizācija kā tāda nenotiek. Tajā pašā laikā šie modeļi ļoti veiksmīgi simulē eksperimentus, ko biologi veic ar baktēriju populācijām, liekot viņiem apgūt jaunas uzvedības stratēģijas, meklējot pārtiku. Varam secināt, ka dzīve darbojas savādāk nekā optimizācijas funkcija.

Pastaigas GAN optimizācija

Viss, ko mēs tagad darām mašīnmācīšanās ietvaros, ir šauri un ārkārtīgi formalizēti uzdevumi, savukārt šie formālismi nav labi vispārināmi un neatbilst mūsu priekšmeta zināšanām tādās jomās kā neirofizioloģija un bioloģija.

Tuvākajā nākotnē patiešām ir vērts aizņemties no neirofizioloģijas jomas, ir jaunas neironu arhitektūras un neliela kļūdu atpakaļpavairošanas mehānismu pārskatīšana.

Cilvēka smadzenes pašas nemācās kā neironu tīkls:

Viņam nav nejaušas primārās ievades, tostarp tās, kas noteiktas ar maņām un bērnībā
Viņam ir raksturīgi instinktīvas attīstības virzieni (vēlme mācīties valodu no zīdaiņa, staigājot stāvus)

Atsevišķu smadzeņu apmācība ir zema līmeņa uzdevums; iespējams, mums vajadzētu apsvērt ātri mainīgu indivīdu "kolonijas", kas nodod zināšanas viens otram, lai reproducētu grupas evolūcijas mehānismus.

Ko mēs tagad varam pieņemt ML algoritmos:

Pielietot šūnu līnijas modeļus, kas nodrošina populācijas mācīšanos, bet indivīda īsu mūžu (“individuālās smadzenes”).
Neliela apmācība, izmantojot nelielu skaitu piemēru
Sarežģītākas neironu struktūras, nedaudz atšķirīgas aktivizācijas funkcijas
“Genoma” nodošana nākamajām paaudzēm - atpakaļpavairošanas algoritms
Kad mēs savienosim neirofizioloģiju un neironu tīklus, mēs iemācīsimies izveidot daudzfunkcionālas smadzenes no daudziem komponentiem.

No šī viedokļa SOTA risinājumu prakse ir kaitīga, un tā būtu jāpārskata, lai izstrādātu kopīgus uzdevumus (benchmarks).

“Veridical Data Science”, Bin Yu (Berkeley)

Videoklipi un slaidi
Ziņojums ir veltīts mašīnmācīšanās modeļu interpretācijas problēmai un to tiešās testēšanas un verifikācijas metodikai. Jebkuru apmācītu ML modeli var uztvert kā zināšanu avotu, kas no tā ir jāiegūst.

Daudzās jomās, īpaši medicīnā, modeļa izmantošana nav iespējama bez šo slēpto zināšanu iegūšanas un modeļa rezultātu interpretācijas - pretējā gadījumā mēs nebūsim pārliecināti, ka rezultāti būs stabili, nejauši, uzticami un nenogalinās pacients. Vesels darba metodoloģijas virziens attīstās dziļās mācīšanās paradigmas ietvaros un pārsniedz tās robežas - veridiskā datu zinātne. Kas tas ir?

Mēs vēlamies sasniegt tādu zinātnisko publikāciju kvalitāti un modeļu reproducējamību, lai tie būtu:

paredzams
aprēķināms
stabils

Šie trīs principi veido jaunās metodoloģijas pamatu. Kā ML modeļus var pārbaudīt saskaņā ar šiem kritērijiem? Vienkāršākais veids ir izveidot uzreiz interpretējamus modeļus (regresijas, lēmumu kokus). Tomēr mēs vēlamies arī gūt tūlītējus ieguvumus no dziļas mācīšanās.

Vairāki esošie veidi, kā strādāt ar problēmu:

interpretēt modeli;
izmantot metodes, kuru pamatā ir uzmanība;
apmācībā izmantot algoritmu ansambļus un nodrošināt, ka lineāri interpretējamie modeļi mācās paredzēt tādas pašas atbildes kā neironu tīkls, interpretējot lineārā modeļa pazīmes;
mainīt un papildināt treniņu datus. Tas ietver trokšņu, traucējumu pievienošanu un datu palielināšanu;
jebkuras metodes, kas palīdz nodrošināt, ka modeļa rezultāti nav nejauši un nav atkarīgi no nelieliem nevēlamiem traucējumiem (pretrunīgi uzbrukumi);
interpretēt modeli pēc fakta, pēc apmācības;
pētīt pazīmju svarus dažādos veidos;
izpētīt visu hipotēžu varbūtības, klases sadalījumu.

Pretendīvs uzbrukums par cūku

Modelēšanas kļūdas ir dārgas ikvienam: lielisks piemērs ir Reinharta un Rogova darbs.Izaugsme parādu laikā" ietekmēja daudzu Eiropas valstu ekonomisko politiku un piespieda tās īstenot taupības politiku, taču rūpīga datu atkārtota pārbaude un to apstrāde gadiem vēlāk parādīja pretēju rezultātu!

Jebkurai ML tehnoloģijai ir savs dzīves cikls no ieviešanas līdz ieviešanai. Jaunās metodoloģijas mērķis ir pārbaudīt trīs pamatprincipus katrā modeļa dzīves posmā.

Rezultāti:

Tiek izstrādāti vairāki projekti, kas palīdzēs ML modelim būt uzticamākam. Tas ir, piemēram, deeptune (saite uz: github.com/ChrisCummins/paper-end2end-dl);
Metodoloģijas tālākai attīstībai nepieciešams būtiski uzlabot publikāciju kvalitāti ML jomā;
Mašīnmācībai ir nepieciešami vadītāji ar daudznozaru apmācību un zināšanām gan tehniskajās, gan humanitārajās jomās.

"Cilvēka uzvedības modelēšana ar mašīnmācīšanos: iespējas un izaicinājumi" Nuria M Oliver, Albert Ali Salah

Lekcija veltīta cilvēka uzvedības modelēšanai, tās tehnoloģiskajiem pamatiem un pielietojuma perspektīvām.

Cilvēka uzvedības modelēšanu var iedalīt:

individuālā uzvedība
nelielas cilvēku grupas uzvedība
masu uzvedība

Katru no šiem veidiem var modelēt, izmantojot ML, bet ar pilnīgi atšķirīgu ievades informāciju un funkcijām. Katram veidam ir arī savas ētiskās problēmas, kas tiek risinātas katrā projektā:

individuāla uzvedība – identitātes zādzība, deepfake;
cilvēku grupu uzvedība - deanonimizācija, informācijas iegūšana par kustībām, telefona zvani utt.;

individuālā uzvedība

Pārsvarā saistīts ar Datorredzes tēmu – cilvēka emociju un reakciju atpazīšanu. Varbūt tikai kontekstā, laikā vai ar viņa paša emociju mainīguma relatīvo mērogu. Slaids parāda Monas Lizas emociju atpazīšanu, izmantojot kontekstu no Vidusjūras reģiona sieviešu emocionālā spektra. Rezultāts: prieka smaids, bet ar nicinājumu un riebumu. Iemesls, visticamāk, ir “neitrālas” emocijas definēšanas tehniskajā veidā.

Mazas cilvēku grupas uzvedība

Līdz šim sliktākais modelis ir nepietiekamas informācijas dēļ. Kā piemērs tika rādīti darbi no 2018. – 2019. gadam. desmitiem cilvēku X desmitiem videoklipu (sal. ar 100 XNUMX++ attēlu datu kopām). Lai vislabāk modelētu šo uzdevumu, ir nepieciešama multimodāla informācija, vēlams no sensoriem uz ķermeņa altimetra, termometra, mikrofona ierakstīšanas utt.

Masu uzvedība

Visattīstītākā joma, jo pasūtītājs ir ANO un daudzas valstis. Āra novērošanas kameras, dati no telefona torņiem – rēķini, SMS, zvani, dati par pārvietošanos starp valsts robežām – tas viss sniedz ļoti ticamu priekšstatu par cilvēku kustību un sociālo nestabilitāti. Tehnoloģijas potenciālie pielietojumi: glābšanas operāciju optimizācija, palīdzība un savlaicīga iedzīvotāju evakuācija ārkārtas situācijās. Izmantotie modeļi galvenokārt joprojām ir slikti interpretēti - tie ir dažādi LSTM un konvolucionālie tīkli. Tika īsa piezīme, ka ANO lobē jaunu likumu, kas uzliktu Eiropas uzņēmumiem pienākumu koplietot anonimizētus datus, kas nepieciešami jebkurai izpētei.

“No 1. sistēmas uz sistēmu 2. dziļā mācīšanās”, Jošua Bendžo

Slaidi
Džošua Bengio lekcijā dziļā mācīšanās satiekas ar neirozinātni mērķu noteikšanas līmenī.
Bengio identificē divus galvenos problēmu veidus saskaņā ar Nobela prēmijas laureāta Daniela Kānemana metodoloģiju (grāmata “Domā lēni, izlem ātri")
1. tips - 1. sistēma, neapzinātas darbības, kuras mēs veicam “automātiski” (senās smadzenes): braukšana ar automašīnu pazīstamās vietās, iešana, seju atpazīšana.
2. tips - 2. sistēma, apzinātas darbības (smadzeņu garoza), mērķu noteikšana, analīze, domāšana, saliktie uzdevumi.

AI līdz šim ir sasniedzis pietiekamus augstumus tikai pirmā veida uzdevumos, savukārt mūsu uzdevums ir to novest līdz otrajam, mācot veikt daudznozaru darbības un darboties ar loģiku un augsta līmeņa kognitīvām prasmēm.

Lai sasniegtu šo mērķi, tiek piedāvāts:

NLP uzdevumos izmantot uzmanību kā galveno domāšanas modelēšanas mehānismu
izmantot metamācīšanos un reprezentācijas mācīšanos, lai labāk modelētu iezīmes, kas ietekmē apziņu un to lokalizāciju, un uz to pamata pāriet uz darbību ar augstāka līmeņa koncepcijām.

Secinājuma vietā šeit ir uzaicināta runa: Bengio ir viens no daudziem zinātniekiem, kas cenšas paplašināt ML jomu ārpus optimizācijas problēmām, SOTA un jaunām arhitektūrām.
Atklāts paliek jautājums, cik lielā mērā apziņas problēmu kombinācija, valodas ietekme uz domāšanu, neirobioloģija un algoritmi ir tas, kas mūs sagaida nākotnē un ļaus pāriet uz mašīnām, kas “domā” kā cilvēki.

Paldies!

Avots: www.habr.com

NeurIPS 2019: ML tendences, kas būs ar mums nākamajā desmitgadē

Saturs:

Tendences 2019. gadā

Uzaicinātās sarunas

“Sociālā inteliģence”, Blēzs Agvera un Arkass (Google)

“Veridical Data Science”, Bin Yu (Berkeley)

"Cilvēka uzvedības modelēšana ar mašīnmācīšanos: iespējas un izaicinājumi" Nuria M Oliver, Albert Ali Salah

“No 1. sistēmas uz sistēmu 2. dziļā mācīšanās”, Jošua Bendžo

Pievieno komentāru Atcelt atbildi