NeurIPS 2019: ML stefnur sem munu fylgja okkur næsta áratuginn

NeuroIPS (Taugaupplýsingavinnslukerfi) er stærsta ráðstefna heims um vélanám og gervigreind og aðalviðburðurinn í heimi djúpnáms.

Munum við, DS verkfræðingar, líka ná tökum á líffræði, málvísindum og sálfræði á nýjum áratug? Við munum segja þér það í umfjöllun okkar.

NeurIPS 2019: ML stefnur sem munu fylgja okkur næsta áratuginn

Í ár komu saman meira en 13500 manns frá 80 löndum á ráðstefnunni í Vancouver í Kanada. Þetta er ekki fyrsta árið sem Sberbank er fulltrúi Rússlands á ráðstefnunni - DS teymið talaði um innleiðingu ML í bankaferlum, um ML keppnina og um getu Sberbank DS vettvangsins. Hverjar voru helstu stefnur ársins 2019 í ML samfélaginu? Þátttakendur ráðstefnunnar segja: Andrey Chertok и Tatyana Shavrina.

Á þessu ári samþykkti NeurIPS meira en 1400 pappíra - reiknirit, nýjar gerðir og ný forrit fyrir ný gögn. Tengill á allt efni

Efnisyfirlit:

  • Stefna
    • Túlkanleiki líkana
    • Fjölfræði
    • Rökstuðningur
    • RL
    • GAN
  • Grunnboðsspjall
    • „Social Intelligence“, Blaise Aguera y Arcas (Google)
    • „Sanngjarn gagnavísindi“, Bin Yu (Berkeley)
    • „Mannleg atferlislíkan með vélanámi: tækifæri og áskoranir“, Nuria M Oliver, Albert Ali Salah
    • „Frá kerfi 1 til kerfis 2 djúpt nám“, Yoshua Bengio

Þróun 2019 ársins

1. Túlkanleiki líkana og ný aðferðafræði ML

Meginefni ráðstefnunnar er túlkun og sönnun þess hvers vegna við fáum ákveðnar niðurstöður. Það má lengi tala um heimspekilegt mikilvægi „svarta kassans“ túlkunar, en það voru raunverulegri aðferðir og tækniþróun á þessu sviði.

Aðferðafræðin við að endurtaka líkön og draga þekkingu úr þeim er ný verkfærakista fyrir vísindi. Líkön geta þjónað sem tæki til að afla nýrrar þekkingar og prófa hana og hvert stig í forvinnslu, þjálfun og beitingu líkansins verður að vera hægt að endurskapa.
Umtalsverður hluti rita er ekki varið til smíði líkana og verkfæra, heldur vandamálum við að tryggja öryggi, gagnsæi og sannreynandi niðurstöður. Sérstaklega hefur sérstakt straumur birst um árásir á líkanið (andstæðingarárásir) og valkostir fyrir bæði árásir á þjálfun og árásir á forrit eru skoðaðar.

Greinar:

NeurIPS 2019: ML stefnur sem munu fylgja okkur næsta áratuginn
ExBert.net sýnir líkantúlkun fyrir textavinnsluverkefni

2. Fjölfræði

Til að tryggja áreiðanlega sannprófun og þróa aðferðir til að sannreyna og auka þekkingu, þurfum við sérfræðinga á skyldum sviðum sem hafa samtímis hæfni í ML og á fagsviðinu (læknisfræði, málvísindi, taugalíffræði, menntun o.fl.). Sérstaklega er vert að taka eftir mikilvægari tilvist verka og ræðna í taugavísindum og hugrænum vísindum - það er nálgun sérfræðinga og lánaðar hugmyndir.

Auk þessarar nálgunar er að myndast þverfaglegt í sameiginlegri úrvinnslu upplýsinga úr ýmsum áttum: texta og myndum, texta og leikjum, línuritagrunnum + texta og myndum.

Greinar:

NeurIPS 2019: ML stefnur sem munu fylgja okkur næsta áratuginn
Tvær gerðir - strategist og framkvæmdastjóri - byggðar á RL og NLP spila stefnu á netinu

3. Rökstuðningur

Efling gervigreindar er hreyfing í átt að sjálflærandi kerfum, „meðvitað“, rökhugsun og rökhugsun. Sérstaklega eru orsakaályktanir og skynsemisrök að þróast. Sumar skýrslurnar eru helgaðar meta-námi (um hvernig á að læra að læra) og samsetningu DL tækni með 1. og 2. röð rökfræði - hugtakið Artificial General Intelligence (AGI) er að verða algengt hugtak í ræðum ræðumanna.

Greinar:

4.Reinforcement Learning

Mest af vinnunni heldur áfram að þróa hefðbundin svæði RL - DOTA2, Starcraft, sem sameinar arkitektúr með tölvusjón, NLP, grafgagnagrunnum.

Sérstakur dagur ráðstefnunnar var helgaður RL vinnustofu, þar sem arkitektúr Optimistic Actor Critic Model var kynntur, betri en allar fyrri, einkum Soft Actor Critic.

Greinar:

NeurIPS 2019: ML stefnur sem munu fylgja okkur næsta áratuginn
StarCraft leikmenn berjast við Alphastar líkanið (DeepMind)

5.GAN

Generative net eru enn í sviðsljósinu: mörg verk nota vanillu GANs fyrir stærðfræðilegar sannanir og beita þeim einnig á nýjan, óvenjulegan hátt (myndagerðarlíkön, vinna með röð, beitingu á orsök-og-afleiðingartengsl í gögnum, osfrv.).

Greinar:

Þar sem meira verk var tekið 1400 Hér að neðan verður fjallað um mikilvægustu ræðurnar.

Boðsspjall

„Social Intelligence“, Blaise Aguera y Arcas (Google)

Link
Glærur og myndbönd
Erindið fjallar um almenna aðferðafræði vélanáms og horfur sem breyta greininni núna - hvaða krossgötur stöndum við frammi fyrir? Hvernig virkar heilinn og þróunin og hvers vegna nýtum við svo lítið það sem við vitum nú þegar um þróun náttúrukerfa?

Iðnaðarþróun ML fellur að mestu leyti saman við tímamót þróunar Google, sem gefur út rannsóknir sínar á NeurIPS ár eftir ár:

  • 1997 – opnun leitaraðstöðu, fyrstu netþjóna, lítill tölvuafli
  • 2010 - Jeff Dean setur af stað Google Brain verkefnið, uppsveiflu tauganeta strax í upphafi
  • 2015 – iðnaðarútfærsla tauganeta, hröð andlitsþekking beint á staðbundnu tæki, örgjörvar á lágu stigi sérsniðnir fyrir tensor-tölvu – TPU. Google kynnir Coral ai - hliðstæðu við raspberry pi, smátölvu til að kynna taugakerfi í tilraunauppsetningar
  • 2017 - Google byrjar að þróa dreifða þjálfun og sameina niðurstöður tauganetþjálfunar frá mismunandi tækjum í eina gerð - á Android

Í dag er heil iðnaður tileinkaður gagnaöryggi, samansöfnun og afritun námsárangurs á staðbundnum tækjum.

Sambandsnám – stefnu ML þar sem einstök líkön læra óháð hvert öðru og eru síðan sameinuð í eitt líkan (án þess að miðlægja upprunagögnin), aðlagað fyrir sjaldgæfa atburði, frávik, sérstillingu o.s.frv. Öll Android tæki eru í rauninni ein ofurtölva fyrir Google.

Generative líkön sem byggjast á sameinuðu námi eru vænleg framtíðarstefna samkvæmt Google, sem er „á fyrstu stigum veldisvaxtar“. GAN, að sögn fyrirlesarans, eru fær um að læra að endurskapa fjöldahegðun stofna lifandi lífvera og hugsana reiknirit.

Með því að nota dæmi um tvo einfalda GAN arkitektúra er sýnt að í þeim flakkar leitin að hagræðingarleið í hring, sem þýðir að hagræðing sem slík á sér ekki stað. Á sama tíma eru þessi líkön mjög farsæl við að líkja eftir tilraunum sem líffræðingar gera á bakteríum, sem neyða þá til að læra nýjar hegðunaraðferðir í leit að fæðu. Við getum ályktað að lífið virki öðruvísi en hagræðingaraðgerðin.

NeurIPS 2019: ML stefnur sem munu fylgja okkur næsta áratuginn
Gangandi GAN hagræðing

Allt sem við gerum innan ramma vélanáms núna eru þröng og afar formbundin verkefni, á meðan þessi formalismi er illa alhæfður og samsvarar ekki faglegri þekkingu okkar á sviðum eins og taugalífeðlisfræði og líffræði.

Það sem er í raun þess virði að fá að láni frá sviði taugalífeðlisfræði í náinni framtíð er nýr taugafrumuarkitektúr og lítilsháttar endurskoðun á aðferðum við bakútbreiðsla villna.

Mannsheilinn sjálfur lærir ekki eins og taugakerfi:

  • Hann hefur ekki tilviljunarkenndar fruminntak, þar með talið þau sem sett eru í gegnum skynfærin og í æsku
  • Hann hefur eðlislægar stefnur um eðlislægan þroska (löngun til að læra tungumál af ungbarni, gangandi uppréttur)

Þjálfun einstaks heila er á lágu stigi verkefni; kannski ættum við að íhuga „nýlendur“ einstaklinga sem eru að breytast hratt og miðla þekkingu hver til annars til að endurskapa ferli hópþróunar.

Það sem við getum tekið upp í ML reiknirit núna:

  • Notaðu frumulíkön sem tryggja nám íbúanna, en stutt líf einstaklingsins („einstakur heili“)
  • Nám með fáum skotum með fáum dæmum
  • Flóknari taugafrumubyggingar, örlítið mismunandi virkjunaraðgerðir
  • Flutningur „erfðaefnisins“ til næstu kynslóða - reiknirit fyrir útbreiðslu aftur
  • Þegar við tengjum taugalífeðlisfræði og tauganet, munum við læra að byggja upp fjölvirkan heila úr mörgum þáttum.

Frá þessu sjónarhorni er notkun SOTA lausna skaðleg og ætti að endurskoða þær til að þróa sameiginleg verkefni (viðmið).

„Sanngjarn gagnavísindi“, Bin Yu (Berkeley)

Myndbönd og glærur
Skýrslan er helguð vandamálinu við að túlka vélanámslíkön og aðferðafræðina fyrir beina prófun þeirra og sannprófun. Hægt er að líta á hvaða þjálfaða ML líkan sem er sem uppsprettu þekkingar sem þarf að vinna úr því.

Á mörgum sviðum, sérstaklega í læknisfræði, er notkun líkans ómöguleg án þess að draga fram þessa huldu þekkingu og túlka niðurstöður líkansins - annars erum við ekki viss um að niðurstöðurnar verði stöðugar, ótilviljanakenndar, áreiðanlegar og drepi ekki þolinmóður. Heil stefna vinnuaðferðafræði er að þróast innan djúpnámshugmyndarinnar og fer út fyrir mörk hennar - sannkölluð gagnavísindi. Hvað það er?

Við viljum ná slíkum gæðum vísindarita og endurgerðanleika líkana að þau séu:

  1. fyrirsjáanlegt
  2. reiknanleg
  3. stöðugt

Þessar þrjár meginreglur liggja til grundvallar nýju aðferðafræðinni. Hvernig er hægt að athuga ML líkön gegn þessum viðmiðum? Auðveldasta leiðin er að byggja strax túlkanleg líkön (aðhvarf, ákvörðunartré). Hins vegar viljum við líka fá strax ávinning af djúpnámi.

Nokkrar núverandi leiðir til að vinna með vandamálið:

  1. túlka líkanið;
  2. nota aðferðir sem byggja á athygli;
  3. nota samsetningar reiknirita við þjálfun og tryggja að línuleg túlkanleg líkön læri að spá fyrir um sömu svör og tauganetið, túlka eiginleika úr línulega líkaninu;
  4. breyta og auka þjálfunargögn. Þetta felur í sér að bæta við hávaða, truflunum og gagnaaukningu;
  5. allar aðferðir sem hjálpa til við að tryggja að niðurstöður líkansins séu ekki tilviljunarkenndar og séu ekki háðar minniháttar óæskilegum truflunum (andstæðingarárásum);
  6. túlka líkanið eftir staðreyndinni, eftir þjálfun;
  7. námseiginleikavigtir á ýmsan hátt;
  8. rannsaka líkur á öllum tilgátum, flokkadreifingu.

NeurIPS 2019: ML stefnur sem munu fylgja okkur næsta áratuginn
Andstæðingur árás fyrir svín

Líkanavillur eru dýrar fyrir alla: gott dæmi er verk Reinhart og Rogov.“Vöxtur á tímum skulda“ hafði áhrif á efnahagsstefnu margra Evrópulanda og neyddi þau til að fylgja niðurskurðarstefnu, en vandlega endurskoðuð gögnin og úrvinnsla þeirra árum síðar sýndi þveröfuga niðurstöðu!

Sérhver ML tækni hefur sína eigin lífsferil frá innleiðingu til innleiðingar. Markmiðið með nýju aðferðafræðinni er að athuga þrjár grundvallarreglur á hverju stigi lífs líkansins.

Niðurstöður:

  • Nokkur verkefni eru í þróun sem munu hjálpa ML líkaninu að vera áreiðanlegra. Þetta er til dæmis deeptune (tengill á: github.com/ChrisCummins/paper-end2end-dl);
  • Til frekari þróunar aðferðafræðinnar er nauðsynlegt að bæta verulega gæði rita á sviði ML;
  • Vélnám þarf leiðtoga með þverfaglega þjálfun og sérfræðiþekkingu bæði á tækni- og hugvísindasviði.

„Mannleg atferlislíkan með vélanámi: tækifæri og áskoranir“ Nuria M Oliver, Albert Ali Salah

Fyrirlestur tileinkaður líkan mannlegrar hegðunar, tæknilegum grunni hennar og umsóknarhorfum.

Mannlegri hegðunarlíkönum má skipta í:

  • einstaklingshegðun
  • hegðun lítils hóps fólks
  • fjöldahegðun

Hægt er að móta hverja þessara tegunda með ML, en með gjörólíkum inntaksupplýsingum og eiginleikum. Hver tegund hefur einnig sín siðferðilegu vandamál sem hvert verkefni gengur í gegnum:

  • einstaklingshegðun - persónuþjófnaður, djúpfalsun;
  • hegðun hópa fólks - afnöfnun nafnleyndar, öflun upplýsinga um hreyfingar, símtöl o.s.frv.;

einstaklingshegðun

Aðallega tengt efninu Tölvusjón - viðurkenning á tilfinningum og viðbrögðum manna. Kannski aðeins í samhengi, í tíma eða með hlutfallslegu mælikvarða hans eigin breytileika tilfinninga. Skyggnan sýnir viðurkenningu á tilfinningum Mónu Lísu með því að nota samhengi úr tilfinningasviði Miðjarðarhafskvenna. Niðurstaða: bros af gleði, en með fyrirlitningu og viðbjóði. Ástæðan er líklegast í tæknilegum hætti við að skilgreina „hlutlausa“ tilfinningu.

Hegðun lítils hóps fólks

Hingað til er versta líkanið vegna ófullnægjandi upplýsinga. Sem dæmi voru sýnd verk frá 2018 – 2019. á tugum manna X tugum myndbanda (sbr. 100k++ myndagagnasett). Til að móta þetta verkefni sem best þarf fjölþættar upplýsingar, helst frá skynjurum á líkamshæðarmæli, hitamæli, hljóðnemaupptöku o.s.frv.

Massahegðun

Þróaðasta svæðið, þar sem viðskiptavinurinn er SÞ og mörg ríki. Eftirlitsmyndavélar utandyra, gögn frá símaturnum - innheimtu, SMS, símtöl, gögn um flutning milli landamæra ríkisins - allt gefur þetta mjög áreiðanlega mynd af fólksflutningum og félagslegum óstöðugleika. Hugsanleg notkun tækninnar: hagræðing björgunaraðgerða, aðstoð og tímanlega brottflutning íbúa í neyðartilvikum. Líkönin sem notuð eru eru aðallega enn illa túlkuð - þetta eru ýmis LSTM og flækjunet. Það var stutt athugasemd um að SÞ beitti sér fyrir nýjum lögum sem skylda evrópsk fyrirtæki til að deila nafnlausum gögnum sem nauðsynleg eru fyrir allar rannsóknir.

„Frá kerfi 1 til kerfis 2 djúpt nám“, Yoshua Bengio

Glærur
Í fyrirlestri Joshua Bengio mætir djúpt nám taugavísindi á stigi markmiðasetningar.
Bengio skilgreinir tvær megin tegundir vandamála samkvæmt aðferðafræði Nóbelsverðlaunahafans Daniel Kahneman (bók “Hugsaðu hægt, ákveðiððu hratt")
tegund 1 - Kerfi 1, meðvitundarlausar aðgerðir sem við gerum "sjálfkrafa" (forn heili): að keyra bíl á kunnuglegum stöðum, ganga, þekkja andlit.
tegund 2 - Kerfi 2, meðvitaðar aðgerðir (heilaberki), markmiðasetning, greining, hugsun, samsett verkefni.

Gervigreind hefur hingað til aðeins náð nægum hæðum í verkefnum af fyrstu gerð, á meðan verkefni okkar er að koma því yfir í þá seinni, kenna því að framkvæma þverfaglegar aðgerðir og starfa með rökfræði og vitsmunalegri færni á háu stigi.

Til að ná þessu markmiði er lagt til:

  1. í NLP verkefnum, notaðu athygli sem lykilbúnað til að móta hugsun
  2. nota meta-learning og representation learning til að búa betur til eiginleika sem hafa áhrif á meðvitund og staðsetningu þeirra - og á grundvelli þeirra halda áfram að vinna með hugtök á hærra stigi.

Í stað niðurstöðu, hér er boðið erindi: Bengio er einn af mörgum vísindamönnum sem eru að reyna að víkka út svið ML umfram hagræðingarvandamál, SOTA og nýjan arkitektúr.
Spurningin er enn opin að hve miklu leyti sambland af vandamálum meðvitundar, áhrif tungumáls á hugsun, taugalíffræði og reiknirit er það sem bíður okkar í framtíðinni og gerir okkur kleift að fara yfir í vélar sem „hugsa“ eins og fólk.

Þakka þér!



Heimild: www.habr.com

Bæta við athugasemd