NeurIPS 2019: ML tendences, kas bÅ«s ar mums nÄkamajÄ desmitgadÄ
NeuroIPS (Neironu informÄcijas apstrÄdes sistÄmas) ir pasaulÄ lielÄkÄ konference par maŔīnmÄcÄ«bu un mÄkslÄ«go intelektu un galvenais notikums dziļÄs mÄcÄ«Å”anÄs pasaulÄ.
Vai mÄs, DS inženieri, jaunajÄ desmitgadÄ apgÅ«sim arÄ« bioloÄ£iju, valodniecÄ«bu un psiholoÄ£iju? MÄs jums to pastÄstÄ«sim savÄ pÄrskatÄ.
Å ogad konference pulcÄja vairÄk nekÄ 13500 80 cilvÄku no 2019 valstÄ«m VankÅ«verÄ, KanÄdÄ. Å is nav pirmais gads, kad Sberbank konferencÄ pÄrstÄv Krieviju - DS komanda stÄstÄ«ja par ML ievieÅ”anu banku procesos, par ML konkurenci un par Sberbank DS platformas iespÄjÄm. KÄdas bija XNUMX. gada galvenÄs tendences ML sabiedrÄ«bÄ? Konferences dalÄ«bnieki saka: Andrejs Äertoks Šø Tatjana Å avrina.
Å ogad NeurIPS pieÅÄma vairÄk nekÄ 1400 dokumentus ā algoritmus, jaunus modeļus un jaunas lietojumprogrammas jauniem datiem. Saite uz visiem materiÄliem
Saturs:
Tendences
Modeļa interpretÄjamÄ«ba
MultidisciplinaritÄte
Pamatojums
RL
GAN
Pamata ielÅ«gtÄs sarunas
āSociÄlÄ inteliÄ£enceā, BlÄzs Agvera un Arkass (Google)
āVeridical Data Scienceā, Bin Yu (Berkeley)
āCilvÄka uzvedÄ«bas modelÄÅ”ana ar maŔīnmÄcÄ«Å”anos: iespÄjas un izaicinÄjumiā, Nuria M Oliver, Alberts Ali Salahs
āNo 1. sistÄmas uz sistÄmu 2. dziÄ¼Ä mÄcÄ«Å”anÄsā, JoÅ”ua Bendžo
Tendences 2019. gadÄ
1. Modeļu interpretÄjamÄ«ba un jauna ML metodoloÄ£ija
Konferences galvenÄ tÄma ir interpretÄcija un pierÄdÄ«jumi tam, kÄpÄc mÄs iegÅ«stam noteiktus rezultÄtus. Var ilgi runÄt par āmelnÄs kastesā interpretÄcijas filozofisko nozÄ«mi, taÄu Å”ajÄ jomÄ bija vairÄk reÄlu metožu un tehnikas attÄ«stÄ«bas.
MetodoloÄ£ija modeļu replicÄÅ”anai un zinÄÅ”anu iegÅ«Å”anai no tiem ir jauns zinÄtnes instrumentu kopums. Modeļi var kalpot kÄ instruments jaunu zinÄÅ”anu iegÅ«Å”anai un to pÄrbaudei, un katram modeļa priekÅ”apstrÄdes, apmÄcÄ«bas un pielietojuma posmam jÄbÅ«t reproducÄjamam.
IevÄrojama publikÄciju daļa ir veltÄ«ta nevis modeļu un rÄ«ku konstruÄÅ”anai, bet gan droŔības, caurskatÄmÄ«bas un rezultÄtu pÄrbaudÄmÄ«bas nodroÅ”inÄÅ”anas problÄmÄm. Jo Ä«paÅ”i ir parÄdÄ«jusies atseviŔķa straume par uzbrukumiem modelim (pretÄja uzbrukumi), un tiek apsvÄrtas iespÄjas gan uzbrukumiem apmÄcÄ«bai, gan uzbrukumiem lietojumprogrammai.
Raksti:
VeridÄlÄ datu zinÄtne ā programmatisks raksts par modeļu pÄrbaudes metodoloÄ£iju. Ietver pÄrskatu par mÅ«sdienu modeļu interpretÄcijas rÄ«kiem, jo āāÄ«paÅ”i par uzmanÄ«bas izmantoÅ”anu un pazÄ«mju svarÄ«guma iegÅ«Å”anu, ādestilÄjotā neironu tÄ«klu ar lineÄriem modeļiem.
ExBert.net parÄda modeļa interpretÄciju teksta apstrÄdes uzdevumiem
2. MultidisciplinaritÄte
Lai nodroÅ”inÄtu uzticamu verifikÄciju un izstrÄdÄtu mehÄnismus zinÄÅ”anu pÄrbaudei un paplaÅ”inÄÅ”anai, mums ir nepiecieÅ”ami saistÄ«tu nozaru speciÄlisti, kuriem vienlaikus ir kompetences ML un mÄcÄ«bu priekÅ”metÄ (medicÄ«na, valodniecÄ«ba, neirobioloÄ£ija, izglÄ«tÄ«ba uc). ÄŖpaÅ”i jÄatzÄ«mÄ nozÄ«mÄ«gÄka darbu un runu klÄtbÅ«tne neirozinÄtnÄs un kognitÄ«vajÄs zinÄtnÄs - notiek speciÄlistu tuvinÄÅ”anÄs un ideju aizgÅ«Å”ana.
Papildus Å”ai tuvinÄÅ”anai, kopÄ«gÄ informÄcijas apstrÄdÄ no dažÄdiem avotiem parÄdÄs multidisciplinaritÄte: teksts un fotogrÄfijas, teksts un spÄles, grafiku datu bÄzes + teksts un fotogrÄfijas.
Divi modeļi ā stratÄÄ£is un izpilddirektors ā balstÄ«ti uz RL un NLP spÄles tieÅ”saistes stratÄÄ£iju
3. Pamatojums
MÄkslÄ«gÄ intelekta stiprinÄÅ”ana ir virzÄ«ba uz paÅ”mÄcÄ«bas sistÄmÄm, āapzinÄtuā, sprieÅ”anu un sprieÅ”anu. Jo Ä«paÅ”i attÄ«stÄs cÄloÅsakarÄ«bas secinÄjumi un veselÄ saprÄta sprieÅ”ana. Daži ziÅojumi ir veltÄ«ti metamÄcÄ«bai (par to, kÄ iemÄcÄ«ties mÄcÄ«ties) un DL tehnoloÄ£iju apvienoÅ”anai ar 1. un 2. kÄrtas loÄ£iku ā termins Artificial General Intelligence (AGI) kļūst par izplatÄ«tu terminu runÄtÄju runÄs.
LielÄkÄ daļa darbu turpina attÄ«stÄ«t tradicionÄlÄs RL jomas - DOTA2, Starcraft, apvienojot arhitektÅ«ras ar datorredzi, NLP, grafu datubÄzÄm.
AtseviŔķa konferences diena tika veltÄ«ta RL darbnÄ«cai, kurÄ tika prezentÄta Optimistic Actor Actor Critic modeļa arhitektÅ«ra, kas ir pÄrÄka par visÄm iepriekÅ”ÄjÄm, Ä«paÅ”i Soft Actor Critic.
StarCraft spÄlÄtÄji cÄ«nÄs ar Alphastar modeli (DeepMind)
5.GAN
Ä¢eneratÄ«vie tÄ«kli joprojÄm ir uzmanÄ«bas centrÄ: daudzos darbos matemÄtiskiem pierÄdÄ«jumiem tiek izmantoti vaniļas GAN, kÄ arÄ« tie tiek izmantoti jaunos, neparastos veidos (grafiku Ä£eneratÄ«vie modeļi, darbs ar sÄrijÄm, pielietojums datu cÄloÅu un seku attiecÄ«bÄm utt.).
TÄ kÄ tika pieÅemts vairÄk darba 1400 TÄlÄk mÄs runÄsim par svarÄ«gÄkajÄm runÄm.
UzaicinÄtÄs sarunas
āSociÄlÄ inteliÄ£enceā, BlÄzs Agvera un Arkass (Google)
Saite Slaidi un video
Saruna ir vÄrsta uz vispÄrÄjo maŔīnmÄcÄ«Å”anÄs metodoloÄ£iju un perspektÄ«vÄm, kas Å”obrÄ«d mainÄ«s nozari ā ar kÄdÄm krustcelÄm mÄs saskaramies? KÄ darbojas smadzenes un evolÅ«cija, un kÄpÄc mÄs tik maz izmantojam to, ko jau zinÄm par dabisko sistÄmu attÄ«stÄ«bu?
ML rÅ«pnieciskÄ attÄ«stÄ«ba lielÄ mÄrÄ sakrÄ«t ar Google attÄ«stÄ«bas pavÄrsieniem, kas gadu no gada publicÄ savus pÄtÄ«jumus par NeurIPS:
1997. gads ā meklÄÅ”anas iespÄju palaiÅ”ana, pirmie serveri, maza skaitļoÅ”anas jauda
2010. gads ā Džefs DÄ«ns uzsÄk Google Brain projektu, neironu tÄ«klu uzplaukumu paÅ”Ä sÄkumÄ
2015. gads ā neironu tÄ«klu rÅ«pnieciska ievieÅ”ana, Ätra sejas atpazÄ«Å”ana tieÅ”i lokÄlajÄ ierÄ«cÄ, zema lÄ«meÅa procesori, kas pielÄgoti tenzoru skaitļoÅ”anai - TPU. Google izlaiž Coral ai ā raspberry pi analogu ā mini datoru neironu tÄ«klu ievieÅ”anai eksperimentÄlÄs instalÄcijÄs.
2017. gads ā Google sÄk izstrÄdÄt decentralizÄtu apmÄcÄ«bu un apvienot neironu tÄ«klu apmÄcÄ«bas rezultÄtus no dažÄdÄm ierÄ«cÄm vienÄ modelÄ« ā operÄtÄjsistÄmÄ Android
MÅ«sdienÄs visa nozare ir veltÄ«ta datu droŔībai, apkopoÅ”anai un mÄcÄ«bu rezultÄtu replikÄcijai vietÄjÄs ierÄ«cÄs.
FederÄtÄ mÄcÄ«Å”anÄs ā ML virziens, kurÄ atseviŔķi modeļi mÄcÄs neatkarÄ«gi viens no otra un pÄc tam tiek apvienoti vienÄ modelÄ« (bez avota datu centralizÄcijas), kas pielÄgots retiem notikumiem, anomÄlijÄm, personalizÄcijai utt. Visas Android ierÄ«ces bÅ«tÄ«bÄ ir viens skaitļoÅ”anas superdators uzÅÄmumam Google.
Ä¢eneratÄ«vie modeļi, kuru pamatÄ ir apvienotÄ mÄcÄ«Å”anÄs, ir daudzsoloÅ”s nÄkotnes virziens, saskaÅÄ ar Google, kas ir āeksponenciÄlÄs izaugsmes sÄkumposmÄā. GAN, pÄc lektora domÄm, spÄj iemÄcÄ«ties reproducÄt dzÄ«vo organismu populÄciju masveida uzvedÄ«bu un domÄÅ”anas algoritmus.
Izmantojot divu vienkÄrÅ”u GAN arhitektÅ«ru piemÄru, tiek parÄdÄ«ts, ka tajÄs optimizÄcijas ceļa meklÄÅ”ana klÄ«st pa apli, kas nozÄ«mÄ, ka optimizÄcija kÄ tÄda nenotiek. TajÄ paÅ”Ä laikÄ Å”ie modeļi ļoti veiksmÄ«gi simulÄ eksperimentus, ko biologi veic ar baktÄriju populÄcijÄm, liekot viÅiem apgÅ«t jaunas uzvedÄ«bas stratÄÄ£ijas, meklÄjot pÄrtiku. Varam secinÄt, ka dzÄ«ve darbojas savÄdÄk nekÄ optimizÄcijas funkcija.
Pastaigas GAN optimizÄcija
Viss, ko mÄs tagad darÄm maŔīnmÄcÄ«Å”anÄs ietvaros, ir Å”auri un ÄrkÄrtÄ«gi formalizÄti uzdevumi, savukÄrt Å”ie formÄlismi nav labi vispÄrinÄmi un neatbilst mÅ«su priekÅ”meta zinÄÅ”anÄm tÄdÄs jomÄs kÄ neirofizioloÄ£ija un bioloÄ£ija.
TuvÄkajÄ nÄkotnÄ patieÅ”Äm ir vÄrts aizÅemties no neirofizioloÄ£ijas jomas, ir jaunas neironu arhitektÅ«ras un neliela kļūdu atpakaļpavairoÅ”anas mehÄnismu pÄrskatÄ«Å”ana.
ViÅam nav nejauÅ”as primÄrÄs ievades, tostarp tÄs, kas noteiktas ar maÅÄm un bÄrnÄ«bÄ
ViÅam ir raksturÄ«gi instinktÄ«vas attÄ«stÄ«bas virzieni (vÄlme mÄcÄ«ties valodu no zÄ«daiÅa, staigÄjot stÄvus)
AtseviŔķu smadzeÅu apmÄcÄ«ba ir zema lÄ«meÅa uzdevums; iespÄjams, mums vajadzÄtu apsvÄrt Ätri mainÄ«gu indivÄ«du "kolonijas", kas nodod zinÄÅ”anas viens otram, lai reproducÄtu grupas evolÅ«cijas mehÄnismus.
Ko mÄs tagad varam pieÅemt ML algoritmos:
Pielietot Ŕūnu lÄ«nijas modeļus, kas nodroÅ”ina populÄcijas mÄcÄ«Å”anos, bet indivÄ«da Ä«su mūžu (āindividuÄlÄs smadzenesā).
Neliela apmÄcÄ«ba, izmantojot nelielu skaitu piemÄru
SarežģītÄkas neironu struktÅ«ras, nedaudz atŔķirÄ«gas aktivizÄcijas funkcijas
Kad mÄs savienosim neirofizioloÄ£iju un neironu tÄ«klus, mÄs iemÄcÄ«simies izveidot daudzfunkcionÄlas smadzenes no daudziem komponentiem.
No Ŕī viedokļa SOTA risinÄjumu prakse ir kaitÄ«ga, un tÄ bÅ«tu jÄpÄrskata, lai izstrÄdÄtu kopÄ«gus uzdevumus (benchmarks).
āVeridical Data Scienceā, Bin Yu (Berkeley)
Videoklipi un slaidi
ZiÅojums ir veltÄ«ts maŔīnmÄcÄ«Å”anÄs modeļu interpretÄcijas problÄmai un to tieÅ”Äs testÄÅ”anas un verifikÄcijas metodikai. Jebkuru apmÄcÄ«tu ML modeli var uztvert kÄ zinÄÅ”anu avotu, kas no tÄ ir jÄiegÅ«st.
DaudzÄs jomÄs, Ä«paÅ”i medicÄ«nÄ, modeļa izmantoÅ”ana nav iespÄjama bez Å”o slÄpto zinÄÅ”anu iegÅ«Å”anas un modeļa rezultÄtu interpretÄcijas - pretÄjÄ gadÄ«jumÄ mÄs nebÅ«sim pÄrliecinÄti, ka rezultÄti bÅ«s stabili, nejauÅ”i, uzticami un nenogalinÄs pacients. Vesels darba metodoloÄ£ijas virziens attÄ«stÄs dziļÄs mÄcÄ«Å”anÄs paradigmas ietvaros un pÄrsniedz tÄs robežas - veridiskÄ datu zinÄtne. Kas tas ir?
MÄs vÄlamies sasniegt tÄdu zinÄtnisko publikÄciju kvalitÄti un modeļu reproducÄjamÄ«bu, lai tie bÅ«tu:
paredzams
aprÄÄ·inÄms
stabils
Å ie trÄ«s principi veido jaunÄs metodoloÄ£ijas pamatu. KÄ ML modeļus var pÄrbaudÄ«t saskaÅÄ ar Å”iem kritÄrijiem? VienkÄrÅ”Äkais veids ir izveidot uzreiz interpretÄjamus modeļus (regresijas, lÄmumu kokus). TomÄr mÄs vÄlamies arÄ« gÅ«t tÅ«lÄ«tÄjus ieguvumus no dziļas mÄcÄ«Å”anÄs.
VairÄki esoÅ”ie veidi, kÄ strÄdÄt ar problÄmu:
interpretÄt modeli;
izmantot metodes, kuru pamatÄ ir uzmanÄ«ba;
apmÄcÄ«bÄ izmantot algoritmu ansambļus un nodroÅ”inÄt, ka lineÄri interpretÄjamie modeļi mÄcÄs paredzÄt tÄdas paÅ”as atbildes kÄ neironu tÄ«kls, interpretÄjot lineÄrÄ modeļa pazÄ«mes;
mainÄ«t un papildinÄt treniÅu datus. Tas ietver trokÅ”Åu, traucÄjumu pievienoÅ”anu un datu palielinÄÅ”anu;
jebkuras metodes, kas palÄ«dz nodroÅ”inÄt, ka modeļa rezultÄti nav nejauÅ”i un nav atkarÄ«gi no nelieliem nevÄlamiem traucÄjumiem (pretrunÄ«gi uzbrukumi);
interpretÄt modeli pÄc fakta, pÄc apmÄcÄ«bas;
pÄtÄ«t pazÄ«mju svarus dažÄdos veidos;
izpÄtÄ«t visu hipotÄžu varbÅ«tÄ«bas, klases sadalÄ«jumu.
ModelÄÅ”anas kļūdas ir dÄrgas ikvienam: lielisks piemÄrs ir Reinharta un Rogova darbs.Izaugsme parÄdu laikÄ" ietekmÄja daudzu Eiropas valstu ekonomisko politiku un piespieda tÄs Ä«stenot taupÄ«bas politiku, taÄu rÅ«pÄ«ga datu atkÄrtota pÄrbaude un to apstrÄde gadiem vÄlÄk parÄdÄ«ja pretÄju rezultÄtu!
Jebkurai ML tehnoloÄ£ijai ir savs dzÄ«ves cikls no ievieÅ”anas lÄ«dz ievieÅ”anai. JaunÄs metodoloÄ£ijas mÄrÄ·is ir pÄrbaudÄ«t trÄ«s pamatprincipus katrÄ modeļa dzÄ«ves posmÄ.
RezultÄti:
Tiek izstrÄdÄti vairÄki projekti, kas palÄ«dzÄs ML modelim bÅ«t uzticamÄkam. Tas ir, piemÄram, deeptune (saite uz: github.com/ChrisCummins/paper-end2end-dl);
MetodoloÄ£ijas tÄlÄkai attÄ«stÄ«bai nepiecieÅ”ams bÅ«tiski uzlabot publikÄciju kvalitÄti ML jomÄ;
MaŔīnmÄcÄ«bai ir nepiecieÅ”ami vadÄ«tÄji ar daudznozaru apmÄcÄ«bu un zinÄÅ”anÄm gan tehniskajÄs, gan humanitÄrajÄs jomÄs.
"CilvÄka uzvedÄ«bas modelÄÅ”ana ar maŔīnmÄcÄ«Å”anos: iespÄjas un izaicinÄjumi" Nuria M Oliver, Albert Ali Salah
Katru no Å”iem veidiem var modelÄt, izmantojot ML, bet ar pilnÄ«gi atŔķirÄ«gu ievades informÄciju un funkcijÄm. Katram veidam ir arÄ« savas ÄtiskÄs problÄmas, kas tiek risinÄtas katrÄ projektÄ:
cilvÄku grupu uzvedÄ«ba - deanonimizÄcija, informÄcijas iegÅ«Å”ana par kustÄ«bÄm, telefona zvani utt.;
individuÄlÄ uzvedÄ«ba
PÄrsvarÄ saistÄ«ts ar Datorredzes tÄmu ā cilvÄka emociju un reakciju atpazÄ«Å”anu. VarbÅ«t tikai kontekstÄ, laikÄ vai ar viÅa paÅ”a emociju mainÄ«guma relatÄ«vo mÄrogu. Slaids parÄda Monas Lizas emociju atpazÄ«Å”anu, izmantojot kontekstu no VidusjÅ«ras reÄ£iona sievieÅ”u emocionÄlÄ spektra. RezultÄts: prieka smaids, bet ar nicinÄjumu un riebumu. Iemesls, visticamÄk, ir āneitrÄlasā emocijas definÄÅ”anas tehniskajÄ veidÄ.
Mazas cilvÄku grupas uzvedÄ«ba
LÄ«dz Å”im sliktÄkais modelis ir nepietiekamas informÄcijas dÄļ. KÄ piemÄrs tika rÄdÄ«ti darbi no 2018. ā 2019. gadam. desmitiem cilvÄku X desmitiem videoklipu (sal. ar 100 XNUMX++ attÄlu datu kopÄm). Lai vislabÄk modelÄtu Å”o uzdevumu, ir nepiecieÅ”ama multimodÄla informÄcija, vÄlams no sensoriem uz Ä·ermeÅa altimetra, termometra, mikrofona ierakstÄ«Å”anas utt.
Masu uzvedība
VisattÄ«stÄ«tÄkÄ joma, jo pasÅ«tÄ«tÄjs ir ANO un daudzas valstis. Ära novÄroÅ”anas kameras, dati no telefona torÅiem ā rÄÄ·ini, SMS, zvani, dati par pÄrvietoÅ”anos starp valsts robežÄm ā tas viss sniedz ļoti ticamu priekÅ”statu par cilvÄku kustÄ«bu un sociÄlo nestabilitÄti. TehnoloÄ£ijas potenciÄlie pielietojumi: glÄbÅ”anas operÄciju optimizÄcija, palÄ«dzÄ«ba un savlaicÄ«ga iedzÄ«votÄju evakuÄcija ÄrkÄrtas situÄcijÄs. Izmantotie modeļi galvenokÄrt joprojÄm ir slikti interpretÄti - tie ir dažÄdi LSTM un konvolucionÄlie tÄ«kli. Tika Ä«sa piezÄ«me, ka ANO lobÄ jaunu likumu, kas uzliktu Eiropas uzÅÄmumiem pienÄkumu koplietot anonimizÄtus datus, kas nepiecieÅ”ami jebkurai izpÄtei.
āNo 1. sistÄmas uz sistÄmu 2. dziÄ¼Ä mÄcÄ«Å”anÄsā, JoÅ”ua Bendžo
AI lÄ«dz Å”im ir sasniedzis pietiekamus augstumus tikai pirmÄ veida uzdevumos, savukÄrt mÅ«su uzdevums ir to novest lÄ«dz otrajam, mÄcot veikt daudznozaru darbÄ«bas un darboties ar loÄ£iku un augsta lÄ«meÅa kognitÄ«vÄm prasmÄm.
Lai sasniegtu Å”o mÄrÄ·i, tiek piedÄvÄts:
NLP uzdevumos izmantot uzmanÄ«bu kÄ galveno domÄÅ”anas modelÄÅ”anas mehÄnismu
izmantot metamÄcÄ«Å”anos un reprezentÄcijas mÄcÄ«Å”anos, lai labÄk modelÄtu iezÄ«mes, kas ietekmÄ apziÅu un to lokalizÄciju, un uz to pamata pÄriet uz darbÄ«bu ar augstÄka lÄ«meÅa koncepcijÄm.
SecinÄjuma vietÄ Å”eit ir uzaicinÄta runa: Bengio ir viens no daudziem zinÄtniekiem, kas cenÅ”as paplaÅ”inÄt ML jomu Ärpus optimizÄcijas problÄmÄm, SOTA un jaunÄm arhitektÅ«rÄm.
AtklÄts paliek jautÄjums, cik lielÄ mÄrÄ apziÅas problÄmu kombinÄcija, valodas ietekme uz domÄÅ”anu, neirobioloÄ£ija un algoritmi ir tas, kas mÅ«s sagaida nÄkotnÄ un ļaus pÄriet uz maŔīnÄm, kas ādomÄā kÄ cilvÄki.