Við getum ekki treyst gervigreindarkerfum sem eru byggð á djúpnámi eingöngu

Við getum ekki treyst gervigreindarkerfum sem eru byggð á djúpnámi eingöngu

Þessi texti er ekki afrakstur vísindarannsókna heldur ein af mörgum skoðunum varðandi tækniþróun okkar. Og um leið boð til umræðu.

Gary Marcus, prófessor við New York háskóla, telur að djúpt nám gegni mikilvægu hlutverki í þróun gervigreindar. En hann telur líka að óhófleg áhugi fyrir þessari tækni geti leitt til vanvirðingar hennar.

Í bók hans Endurræsa gervigreind: Að byggja upp gervigreind sem við getum treyst Marcus, taugavísindamaður að mennt sem hefur byggt upp feril í fremstu röð gervigreindarrannsókna, fjallar um tæknilega og siðferðilega þætti. Frá tæknilegu sjónarhorni getur djúpnám með góðum árangri líkt eftir skynjunarverkefnum sem heilinn okkar sinnir, svo sem mynd- eða talgreiningu. En fyrir önnur verkefni, eins og að skilja samtöl eða ákvarða orsök og afleiðingar tengsl, hentar djúpt nám ekki. Til að búa til fullkomnari greindar vélar sem geta leyst fjölbreyttari vandamál - oft kölluð gervi almenn greind - þarf að sameina djúpt nám við aðra tækni.

Ef gervigreind kerfi skilur ekki raunverulega verkefni sín eða heiminn í kringum það getur það leitt til hættulegra afleiðinga. Jafnvel minnstu óvæntar breytingar á umhverfi kerfisins geta leitt til rangrar hegðunar. Það hafa þegar verið mörg slík dæmi: ákvarðanir um óviðeigandi orðatiltæki sem auðvelt er að blekkja; atvinnuleitarkerfi sem mismuna stöðugt; ökumannslausir bílar sem fara á hausinn og drepa stundum ökumann eða gangandi vegfaranda. Að búa til gervi almenna greind er ekki bara áhugavert rannsóknarvandamál, það hefur mörg algjörlega hagnýt forrit.

Í bók sinni færa Marcus og meðhöfundur hans Ernest Davis rök fyrir annarri leið. Þeir telja að við séum enn langt frá því að búa til almenna gervigreind, en þeir eru fullvissir um að fyrr eða síðar verði hægt að búa það til.

Af hverju þurfum við almenna gervigreind? Sérhæfðar útgáfur hafa þegar verið búnar til og hafa marga kosti í för með sér.

Það er rétt, og það verður enn meiri ávinningur. En það eru mörg vandamál sem sérhæfð gervigreind getur einfaldlega ekki leyst. Til dæmis að skilja venjulegt tal eða almenna aðstoð í sýndarheiminum eða vélmenni sem hjálpar til við að þrífa og elda. Slík verkefni eru umfram getu sérhæfðrar gervigreindar. Önnur áhugaverð hagnýt spurning: er hægt að búa til öruggan sjálfkeyrandi bíl með sérhæfðri gervigreind? Reynslan sýnir að slík gervigreind eiga enn í miklum vandræðum með hegðun við óeðlilegar aðstæður, jafnvel við akstur, sem flækir aðstæður mjög.

Ég held að við myndum öll vilja hafa gervigreind sem getur hjálpað okkur að gera stórar nýjar uppgötvanir í læknisfræði. Óljóst er hvort núverandi tækni hentar til þess þar sem líffræði er flókið svið. Þú þarft að vera tilbúinn að lesa margar bækur. Vísindamenn skilja orsök og afleiðingu tengsl í samspili neta og sameinda, geta þróað kenningar um plánetur o.s.frv. Hins vegar, með sérhæfðri gervigreind, getum við ekki búið til vélar sem geta gert slíkar uppgötvanir. Og með almennri gervigreind gætum við gjörbylt vísindum, tækni og læknisfræði. Að mínu mati er mjög mikilvægt að halda áfram að vinna að því að búa til almenna gervigreind.

Það hljómar eins og með „almennt“ ertu að meina sterka gervigreind?

Með „almennt“ á ég við að gervigreind muni geta hugsað um og leyst ný vandamál á flugu. Ólíkt til dæmis Go, þar sem vandamálið hefur ekki breyst síðustu 2000 árin.

Almenn gervigreind ætti að geta tekið ákvarðanir bæði í stjórnmálum og læknisfræði. Þetta er hliðstætt mannlegri getu; hver heilvita maður getur gert mikið. Þú tekur óreynda nemendur og á nokkrum dögum lætur þá vinna við nánast hvað sem er, allt frá lögfræðilegu vandamáli til læknisfræðilegs vandamáls. Þetta er vegna þess að þeir hafa almennan skilning á heiminum og geta lesið og geta því stuðlað að mjög fjölbreyttri starfsemi.

Sambandið á milli slíkrar upplýsingaöflunar og sterkrar upplýsingaöflunar er að greind sem ekki er sterk mun líklega ekki geta leyst almenn vandamál. Til að búa til eitthvað nógu öflugt til að takast á við síbreytilegan heim gætir þú þurft að minnsta kosti að nálgast almenna greind.

En nú erum við mjög langt frá þessu. AlphaGo getur spilað mjög vel á 19x19 borði, en það þarf að endurþjálfa það til að spila á rétthyrndu borði. Eða taktu meðaldjúpnámskerfið: það getur þekkt fíl ef hann er vel upplýstur og húðáferð hans sést. Og ef aðeins skuggamynd fíls sést mun kerfið líklega ekki þekkja hana.

Í bók þinni nefnir þú að djúpt nám getur ekki náð hæfileikum almennrar gervigreindar vegna þess að það er ekki fær um að skilja djúpt.

Í hugrænum vísindum er talað um myndun ýmissa vitræna líkana. Ég sit á hótelherbergi og ég skil að það er skápur, það er rúm, það er sjónvarp sem er hengt upp á óvenjulegan hátt. Ég þekki alla þessa hluti, ég þekki þá ekki bara. Ég skil líka hvernig þau eru tengd innbyrðis. Ég hef hugmyndir um virkni heimsins í kringum mig. Þeir eru ekki fullkomnir. Þeir geta verið rangir, en þeir eru nokkuð góðir. Og út frá þeim tek ég margar ályktanir sem verða leiðbeiningar um daglegar athafnir mínar.

Hin öfgin var eitthvað eins og Atari leikjakerfið sem DeepMind smíðaði, þar sem það mundi hvað það þurfti að gera þegar það sá pixla á ákveðnum stöðum á skjánum. Ef þú færð næg gögn gætirðu haldið að þú hafir skilning, en í raun er það mjög yfirborðskennt. Sönnun fyrir þessu er sú að ef þú færir hluti um þrjá pixla þá spilar gervigreindin mun verr. Breytingar koma honum í opna skjöldu. Þetta er andstæðan við djúpan skilning.

Til að leysa þetta vandamál leggurðu til að þú farir aftur í klassíska gervigreind. Hvaða kosti ættum við að reyna að nota?

Það eru nokkrir kostir.

Í fyrsta lagi er klassísk gervigreind í raun rammi til að búa til vitsmunaleg líkön af heiminum, byggt á þeim ályktunum sem síðan er hægt að draga.

Í öðru lagi er klassísk gervigreind fullkomlega samhæfð reglum. Það er undarleg þróun í djúpnámi núna þar sem sérfræðingar reyna að forðast reglur. Þeir vilja gera allt á tauganetum og gera ekki neitt sem lítur út eins og klassísk forritun. En það eru vandamál sem voru leyst í rólegheitum á þennan hátt og enginn veitti því gaum. Til dæmis að byggja leiðir í Google Maps.

Í raun þurfum við báðar aðferðir. Vélnám er gott í að læra af gögnum, en mjög lélegt í að tákna abstrakt sem er tölvuforrit. Klassísk gervigreind virkar vel með abstraktum, en það verður að forrita algjörlega í höndunum og það er of mikil þekking í heiminum til að forrita þær allar. Ljóst er að við þurfum að sameina báðar leiðir.

Þetta tengist kaflanum þar sem þú talar um hvað við getum lært af mannshuganum. Og fyrst og fremst um hugmyndina sem byggir á hugmyndinni sem nefnd er hér að ofan að meðvitund okkar samanstendur af mörgum mismunandi kerfum sem virka á mismunandi hátt.

Ég held að önnur leið til að útskýra þetta sé að hvert vitsmunakerfi sem við höfum leysir í raun mismunandi vandamál. Svipaðir hlutar gervigreindar verða að vera hannaðir til að leysa mismunandi vandamál sem hafa mismunandi eiginleika.

Nú erum við að reyna að nota allt-í-einn tækni til að leysa vandamál sem eru gjörólík hvert öðru. Að skilja setningu er alls ekki það sama og að þekkja hlut. En fólk er að reyna að nota djúpt nám í báðum tilfellum. Frá vitsmunalegu sjónarhorni eru þetta eigindlega ólík verkefni. Ég er einfaldlega hissa á því hversu lítið þakklæti er fyrir klassískri gervigreind í djúpnámssamfélaginu. Af hverju að bíða eftir að silfurkúla birtist? Það er óviðunandi og árangurslaus leit gerir okkur ekki kleift að skilja að fullu flókið verkefni að búa til gervigreind.

Þú nefnir líka að gervigreind kerfi séu nauðsynleg til að skilja orsök og afleiðingu sambönd. Heldurðu að djúpt nám, klassísk gervigreind eða eitthvað alveg nýtt muni hjálpa okkur með þetta?

Þetta er annað svæði þar sem djúpnám hentar ekki vel. Það útskýrir ekki orsakir ákveðinna atburða heldur reiknar út líkur á atburði við gefnar aðstæður.

Hvað erum við að tala um? Þú horfir á ákveðnar aðstæður og skilur hvers vegna þetta gerist og hvað gæti gerst ef einhverjar aðstæður breytast. Ég get horft á standinn sem sjónvarpið situr á og ímyndað mér að ef ég klippi annan fótinn af honum þá velti standurinn og sjónvarpið detti. Þetta er orsök og afleiðing samband.

Klassísk gervigreind gefur okkur nokkur verkfæri fyrir þetta. Hann getur til dæmis ímyndað sér hvað stuðningur er og hvað fall er. En ég mun ekki hrósa of mikið. Vandamálið er að klassísk gervigreind er að miklu leyti háð fullkomnum upplýsingum um hvað er að gerast og ég komst að niðurstöðu bara með því að skoða standinn. Ég get einhvern veginn alhæft, ímyndað mér hluta af standinum sem eru mér ekki sýnilegir. Við höfum ekki enn tækin til að innleiða þessa eign.

Þú segir líka að fólk hafi meðfædda þekkingu. Hvernig er hægt að útfæra þetta í gervigreind?

Við fæðingu er heilinn okkar nú þegar mjög vandað kerfi. Það er ekki fast, náttúran skapaði fyrstu, grófu drögin. Og svo hjálpar nám okkur að endurskoða þessi drög alla ævi.

Gróft uppkast af heilanum hefur þegar ákveðna getu. Nýfædd fjallageit er fær um að stíga villulaust niður fjallshlíðina innan nokkurra klukkustunda. Það er augljóst að hann hefur þegar skilning á þrívíðu rými, líkama sínum og tengslum þeirra á milli. Mjög flókið kerfi.

Þetta er að hluta til þess vegna sem ég tel að við þurfum blendingar. Það er erfitt að ímynda sér hvernig hægt væri að búa til vélmenni sem virkar vel í heimi án svipaðrar þekkingar á því hvar eigi að byrja, frekar en að byrja á auðu blaði og læra af langri og mikilli reynslu.

Eins og fyrir menn, þá kemur meðfædd þekking okkar frá erfðamengi okkar, sem hefur þróast í langan tíma. En með gervigreindarkerfum verðum við að fara aðra leið. Hluti af þessu geta verið reglurnar um að smíða reiknirit okkar. Hluti af þessu geta verið reglurnar um að búa til gagnauppbygginguna sem þessi reiknirit vinna. Og hluti af þessu gæti verið vitneskjan um að við munum fjárfesta beint í vélum.

Það er áhugavert að í bókinni kemurðu með hugmyndina um traust og sköpun traustkerfa. Hvers vegna valdir þú þessa tilteknu viðmiðun?

Ég trúi því að í dag sé þetta allt boltaleikur. Mér sýnist að við lifum í gegnum undarlega stund í sögunni, treystum fullt af hugbúnaði sem er ekki treystandi. Ég held að áhyggjurnar sem við höfum í dag muni ekki vara að eilífu. Eftir hundrað ár mun gervigreind réttlæta traust okkar, og kannski fyrr.

En í dag er gervigreind hættuleg. Ekki í þeim skilningi sem Elon Musk óttast, heldur í þeim skilningi að atvinnuviðtalskerfi mismuna konum, óháð því hvað forritarar gera, vegna þess að verkfæri þeirra eru of einföld.

Ég vildi að við hefðum betri gervigreind. Ég vil ekki sjá „AI vetur“ þar sem fólk áttar sig á því að AI virkar ekki og er einfaldlega hættulegt og vill ekki laga það.

Að sumu leyti virðist bókin þín mjög bjartsýn. Þú gerir ráð fyrir að það sé hægt að byggja upp áreiðanlega gervigreind. Við þurfum bara að horfa í aðra átt.

Það er rétt, bókin er mjög svartsýn til skamms tíma og mjög bjartsýn til lengri tíma litið. Við teljum að hægt sé að leysa öll vandamálin sem við höfum lýst með því að skoða betur hver réttu svörin ættu að vera. Og við teljum að ef þetta gerist þá verði heimurinn betri.

Heimild: www.habr.com

Bæta við athugasemd