Um gervigreindarhlutdrægni

Um gervigreindarhlutdrægni

tl; dr:

  • Vélnám leitar að mynstrum í gögnum. En gervigreind getur verið „hlutdræg“ - það er að segja að finna mynstur sem eru röng. Til dæmis gæti húðkrabbameinsuppgötvunarkerfi sem byggir á ljósmyndum veitt myndum sem teknar eru á skrifstofu læknis sérstaka athygli. Vélnám getur það ekki skilja: Reiknirit þess auðkenna aðeins mynstur í tölum og ef gögnin eru ekki dæmigerð mun niðurstaðan úr vinnslu þeirra einnig verða. Og það getur verið erfitt að ná slíkum villum vegna aflfræði vélanáms.
  • Augljósasta og skelfilegasta vandamálið er mannlegur fjölbreytileiki. Það eru margar ástæður fyrir því að gögn um fólk missi hlutlægni jafnvel á söfnunarstigi. En ekki halda að þetta vandamál hafi aðeins áhrif á fólk: nákvæmlega sömu erfiðleikar koma upp þegar reynt er að greina flóð í vöruhúsi eða bilaða gastúrbínu. Sum kerfi geta verið hlutdræg að húðlit, önnur hallast að Siemens skynjara.
  • Slík vandamál eru ekki ný í vélanámi og þau eru langt frá því að vera einstök fyrir það. Rangar forsendur eru gerðar í hvaða flóknu skipulagi sem er og það er alltaf erfitt að skilja hvers vegna ákveðin ákvörðun var tekin. Við þurfum að berjast gegn þessu á alhliða hátt: búa til verkfæri og ferla til sannprófunar - og fræða notendur þannig að þeir fylgi ekki í blindni tilmælum gervigreindar. Vélnám gerir suma hluti miklu betur en við getum - en hundar, til dæmis, eru mun áhrifaríkari en menn við að greina fíkniefni, sem er ekki ástæða til að nota þá sem vitni og dæma út frá framburði þeirra. Og hundar, við the vegur, eru miklu snjallari en öll vélanámskerfi.

Vélnám er ein mikilvægasta tækniþróunin í dag. Þetta er ein helsta leiðin sem tækni mun breyta heiminum í kringum okkur á næsta áratug. Sumir þættir þessara breytinga eru áhyggjuefni. Til dæmis, hugsanleg áhrif vélanáms á vinnumarkaðinn eða notkun þess í siðlausum tilgangi (til dæmis af einræðisstjórnum). Það er annað vandamál sem þessi færsla tekur á: hlutdrægni í gervigreind.

Þetta er ekki auðveld saga.

Um gervigreindarhlutdrægni
AI Google getur fundið ketti. Þessar fréttir frá 2012 voru eitthvað sérstakar þá.

Hvað er „AI Bias“?

„Raw data“ er bæði oxymoron og slæm hugmynd; gögn verða að undirbúa vel og vandlega. — Geoffrey Boker

Einhvers staðar fyrir 2013, til þess að búa til kerfi sem til dæmis þekkir ketti á ljósmyndum, þurfti að lýsa rökréttum skrefum. Hvernig á að finna horn á mynd, þekkja augu, greina áferð fyrir skinn, telja loppur og svo framvegis. Settu síðan alla íhlutina saman og uppgötvaðu að það virkar ekki í raun. Líkt og vélrænan hest - fræðilega er hægt að búa hann til, en í reynd er hann of flókinn til að lýsa honum. Lokaniðurstaðan er hundruð (eða jafnvel þúsundir) handskrifaðra reglna. Og ekki eitt einasta vinnandi líkan.

Með tilkomu vélanáms hættum við að nota „handvirkar“ reglur til að þekkja tiltekinn hlut. Í staðinn tökum við þúsund sýnishorn af „þessu“, X, þúsund sýnishornum af „annað“, Y, og látum tölvuna búa til líkan sem byggir á tölfræðilegri greiningu þeirra. Við gefum þessu líkani síðan nokkur sýnishornsgögn og það ákvarðar með nokkurri nákvæmni hvort það passi við eitt af settunum. Vélnám býr til líkan úr gögnum frekar en frá manneskju sem skrifar þau. Árangurinn er glæsilegur, sérstaklega á sviði mynd- og mynsturgreiningar, og þess vegna færist allur tækniiðnaðurinn nú yfir í vélanám (ML).

En það er ekki svo einfalt. Í raunveruleikanum innihalda þúsundir dæma þinna af X eða Y einnig A, B, J, L, O, R og jafnvel L. Þetta er kannski ekki jafnt dreift og sum geta komið fyrir svo oft að kerfið mun borga meira gaum að þeim en hlutum sem vekja áhuga þinn.

Hvað þýðir þetta í reynd? Uppáhalds dæmið mitt er þegar myndgreiningarkerfi Horfðu á grashæð og segðu "sauður". Það er ljóst hvers vegna: flestar dæmimyndir af „sauðfé“ eru teknar á engjunum þar sem þær búa og á þessum myndum tekur grasið miklu meira pláss en litlu hvítu lóin og það er grasið sem kerfið telur mikilvægast .

Það eru alvarlegri dæmi. Ein nýleg verkefni til að greina húðkrabbamein á ljósmyndum. Í ljós kom að húðlæknar myndu oft reglustikuna ásamt einkennum húðkrabbameins til að skrá stærð myndanna. Það eru engar reglustikur í dæminu ljósmyndum af heilbrigðri húð. Fyrir gervigreindarkerfi hafa slíkar reglustikur (nánar tiltekið, punktarnir sem við skilgreinum sem „reglustiku“) orðið einn af muninum á dæmum og stundum mikilvægari en lítil útbrot á húðinni. Þannig að kerfi sem búið var til til að bera kennsl á húðkrabbamein viðurkenndi stundum höfðingja í staðinn.

Lykilatriðið hér er að kerfið hefur engan merkingarlegan skilning á því sem það er að horfa á. Við skoðum pixlasett og sjáum í þeim kind, skinn eða stikur, en kerfið er aðeins talnalína. Hún sér ekki þrívítt rými, sér ekki hluti, áferð eða kindur. Hún sér einfaldlega mynstur í gögnunum.

Erfiðleikarnir við að greina slík vandamál er að tauganetið (líkanið sem myndast af vélanámskerfinu þínu) samanstendur af þúsundum hundruð þúsunda hnúta. Það er engin auðveld leið til að skoða líkan og sjá hvernig það tekur ákvörðun. Að hafa slíkan hátt myndi þýða að ferlið er nógu einfalt til að lýsa öllum reglum handvirkt, án þess að nota vélanám. Fólk hefur áhyggjur af því að vélanám sé orðið eitthvað svartur kassi. (Ég mun útskýra aðeins síðar hvers vegna þessi samanburður er enn of mikill.)

Þetta er almennt séð vandamálið við hlutdrægni í gervigreind eða vélanámi: Kerfi til að finna mynstur í gögnum gæti fundið rangt mynstur og þú gætir ekki tekið eftir því. Þetta er grundvallareinkenni tækninnar og það er augljóst öllum sem vinna við hana innan háskólans og hjá stórum tæknifyrirtækjum. En afleiðingar þess eru flóknar og mögulegar lausnir okkar á þeim afleiðingum líka.

Við skulum tala um afleiðingarnar fyrst.

Um gervigreindarhlutdrægni
AI getur, óbeint fyrir okkur, valið í þágu ákveðinna flokka fólks, byggt á fjölda ómerkjanlegra merkja

AI hlutdrægni

Augljóslegast og ógnvekjandi getur þetta vandamál komið fram þegar kemur að mannlegum fjölbreytileika. Nýlega það var orðrómurað Amazon hafi reynt að byggja upp vélanámskerfi fyrir fyrstu skimun á umsækjendum um starf. Þar sem það eru fleiri karlar meðal starfsmanna Amazon eru dæmi um „vel heppnaða ráðningu“ líka oftar karlkyns og það voru fleiri karlar í vali á ferilskrám sem kerfið lagði til. Amazon tók eftir þessu og gaf kerfið ekki út í framleiðslu.

Það sem skiptir mestu máli í þessu dæmi er að kerfið var orðrómur um að hygla karlkyns umsækjendum, þrátt fyrir að kyn væri ekki tilgreint á ferilskránni. Kerfið sá önnur mynstur í dæmum um „góðar ráðningar“: til dæmis gætu konur notað sérstök orð til að lýsa afrekum eða haft sérstök áhugamál. Auðvitað vissi kerfið ekki hvað „hokkí“ var, eða hver „fólk“ var, eða hvað „árangur“ var - það framkvæmdi einfaldlega tölfræðilega greiningu á textanum. En mynstrin sem hún sá myndu líklegast fara framhjá mönnum og sum þeirra (til dæmis sú staðreynd að fólk af mismunandi kynjum lýsir velgengni á mismunandi hátt) væri líklega erfitt fyrir okkur að sjá þótt við skoðuðum þau.

Frekari - verra. Vélnámskerfi sem er mjög gott í að finna krabbamein á fölri húð getur ekki gengið eins vel á dökkri húð, eða öfugt. Ekki endilega vegna hlutdrægni, heldur vegna þess að þú þarft líklega að byggja upp sérstakt líkan fyrir annan húðlit, velja mismunandi eiginleika. Vélanámskerfi eru ekki skiptanleg jafnvel á svo þröngu svæði eins og myndgreiningu. Þú þarft að fínstilla kerfið, stundum bara með prufu og villa, til að ná góðum tökum á eiginleikum gagna sem þú hefur áhuga á þar til þú nærð þeirri nákvæmni sem þú vilt. En það sem þú tekur kannski ekki eftir er að kerfið er nákvæmt 98% tilvika með einum hópnum og aðeins 91% (jafnvel nákvæmara en mannleg greining) með hinum.

Hingað til hef ég aðallega notað dæmi sem tengjast fólki og eiginleikum þess. Umræðan um þetta vandamál beinist aðallega að þessu efni. En það er mikilvægt að skilja að hlutdrægni í garð fólks er aðeins hluti af vandamálinu. Við munum nota vélanám fyrir fullt af hlutum og sýnatökuvillur munu skipta máli fyrir þá alla. Á hinn bóginn, ef þú vinnur með fólki, gæti hlutdrægni í gögnunum ekki verið tengd þeim.

Til að skilja þetta skulum við snúa aftur að húðkrabbameinsdæminu og íhuga þrjá ímyndaða möguleika á kerfisbilun.

  1. Misleit dreifing fólks: ójafnvægi mynda af mismunandi húðlitum, sem leiðir til rangra jákvæða eða falska neikvæða vegna litarefna.
  2. Gögnin sem kerfið er þjálfað á innihalda oft og misleitt dreifðan eiginleika sem er ekki tengdur fólki og hefur ekkert greiningargildi: reglustiku í ljósmyndum af húðkrabbameini eða gras í ljósmyndum af sauðfé. Í þessu tilviki verður niðurstaðan önnur ef kerfið finnur punkta í myndinni af einhverju sem mannsaugað greinir sem „reglustiku“.
  3. Gögnin innihalda einkenni þriðja aðila sem einstaklingur getur ekki séð þó hann leiti eftir því.

Hvað þýðir það? Við vitum fyrirfram að gögn geta táknað mismunandi hópa fólks á mismunandi hátt og að minnsta kosti getum við áætlað að leita að slíkum undantekningum. Með öðrum orðum, það eru fullt af félagslegum ástæðum til að ætla að gögn um hópa fólks innihaldi nú þegar einhverja hlutdrægni. Ef við skoðum myndina með reglustikunni munum við sjá þessa reglustiku - við hunsuðum hana einfaldlega áður, vitandi að það skiptir ekki máli, og gleymdum að kerfið veit ekki neitt.

En hvað ef allar myndirnar þínar af óheilbrigðri húð væru teknar á skrifstofu undir glóandi ljósi og heilbrigð húð þín væri tekin undir flúrljósi? Hvað ef þú uppfærðir stýrikerfið í símanum þínum, eftir að þú hefur lokið við að mynda heilbrigða húð, áður en þú tekur óheilbrigða húð, og Apple eða Google breyttu hljóðminnkun reikniritinu lítillega? Maður getur ekki tekið eftir þessu, sama hversu mikið hann leitar að slíkum eiginleikum. En vélanotkunarkerfið mun strax sjá og nota þetta. Hún veit ekki neitt.

Hingað til höfum við talað um falskar fylgnir, en það gæti líka verið að gögnin séu nákvæm og niðurstöðurnar réttar, en þú vilt ekki nota þau af siðferðilegum, lagalegum eða stjórnunarástæðum. Sum lögsagnarumdæmi, til dæmis, leyfa konum ekki að fá afslátt af tryggingum sínum, jafnvel þó konur séu öruggari ökumenn. Við getum auðveldlega ímyndað okkur kerfi sem, þegar söguleg gögn eru greind, myndi úthluta lægri áhættustuðli fyrir kvenmannsnöfn. Allt í lagi, við skulum fjarlægja nöfn úr valinu. En mundu Amazon dæmið: kerfið getur ákvarðað kyn út frá öðrum þáttum (jafnvel þó það viti ekki hvað kyn er, eða jafnvel hvað bíll er), og þú munt ekki taka eftir þessu fyrr en eftirlitsaðilinn greinir afturvirkt gjaldskrána sem þú tilboð og rukkar þig þú verður sektaður.

Að lokum er oft gert ráð fyrir að við notum slík kerfi eingöngu í verkefni sem fela í sér fólk og félagsleg samskipti. Þetta er rangt. Ef þú býrð til gasturbínur, muntu líklega vilja beita vélanámi á fjarmælinguna sem send er af tugum eða hundruðum skynjara á vörunni þinni (hljóð, mynd, hitastig og allir aðrir skynjarar búa til gögn sem auðvelt er að aðlaga til að búa til vél. námslíkan). Í tilgátu gætirðu sagt: „Hér eru gögn frá þúsund hverflum sem biluðu áður en þær biluðu, og hér eru gögn frá þúsund hverflum sem biluðu ekki. Búðu til líkan til að segja hver munurinn er á þeim.“ Jæja, ímyndaðu þér nú að Siemens skynjarar séu settir upp á 75% slæmra hverfla og aðeins 12% góðra (það er engin tenging við bilanir). Kerfið mun byggja líkan til að finna hverfla með Siemens skynjara. Úps!

Um gervigreindarhlutdrægni
Mynd — Moritz Hardt, UC Berkeley

Stjórna AI hlutdrægni

Hvað getum við gert í því? Þú getur nálgast málið frá þremur hliðum:

  1. Aðferðafræðileg nákvæmni við söfnun og stjórnun gagna til að þjálfa kerfið.
  2. Tæknileg verkfæri til að greina og greina líkanahegðun.
  3. Þjálfðu, fræddu og vertu varkár þegar þú innleiðir vélanám í vörur.

Það er brandari í bók Molières „Borgarinn í aðalsmannastétt“: einum manni var sagt að bókmenntir skiptust í prósa og ljóð, og það gladdi hann að uppgötva að hann hafði talað á prósa allt sitt líf, án þess að vita af því. Þetta er líklega hvernig tölfræðingum líður í dag: án þess að gera sér grein fyrir því hafa þeir helgað feril sinn gervigreind og sýnatökuvillur. Að leita að sýnatökuvillum og hafa áhyggjur af því er ekki nýtt vandamál, við þurfum bara að nálgast lausn þess markvisst. Eins og getið er hér að ofan er í sumum tilfellum auðveldara að gera þetta með því að rannsaka vandamál sem tengjast gögnum fólks. Við gerum fyrirfram ráð fyrir að við gætum haft fordóma varðandi mismunandi hópa fólks, en það er erfitt fyrir okkur að ímynda okkur fordóma um Siemens skynjara.

Það sem er auðvitað nýtt við þetta allt saman er að fólk gerir ekki lengur tölfræðilega greiningu beint. Það er framkvæmt af vélum sem búa til stór, flókin líkön sem erfitt er að skilja. Gagnsæismálið er einn af meginþáttum hlutdrægnivandans. Við óttumst að kerfið sé ekki bara hlutdrægt heldur að engin leið sé til að greina hlutdrægni þess og að vélanám sé frábrugðið öðrum gerðum sjálfvirkni, sem á að samanstanda af skýrum rökréttum skrefum sem hægt er að prófa.

Hér eru tvö vandamál. Við gætum samt framkvæmt einhvers konar úttekt á vélanámskerfum. Og endurskoðun á öðru kerfi er í raun ekki auðveldara.

Í fyrsta lagi er ein af stefnum nútímarannsókna á sviði vélanáms að leita að aðferðum til að bera kennsl á mikilvæga virkni vélanámskerfa. Sem sagt, vélanám (í núverandi ástandi) er alveg nýtt vísindasvið sem er að breytast hratt, svo ekki halda að hlutir sem eru ómögulegir í dag geti ekki fljótlega orðið alveg raunverulegir. Verkefni OpenAI - áhugavert dæmi um þetta.

Í öðru lagi er hugmyndin um að þú getir prófað og skilið ákvarðanatökuferli núverandi kerfa eða stofnana góð í orði, en svo sem svo í reynd. Það er ekki auðvelt að skilja hvernig ákvarðanir eru teknar í stórum stofnunum. Jafnvel þótt um formlegt ákvarðanatökuferli sé að ræða, endurspeglar það ekki hvernig fólk hefur í raun og veru samskipti og þeir sjálfir hafa oft ekki rökrétta, kerfisbundna nálgun við að taka ákvarðanir sínar. Eins og kollegi minn sagði Vijay Pande, fólk er líka svartir kassar.

Taktu þúsund manns í nokkrum fyrirtækjum og stofnunum sem skarast og vandamálið verður enn flóknara. Við vitum eftir að geimferjan átti að hætta við heimkomuna og einstaklingar innan NASA höfðu upplýsingar sem gáfu þeim ástæðu til að halda að eitthvað slæmt gæti gerst, en kerfið almennt Ég vissi þetta ekki. NASA fór meira að segja í gegnum svipaða úttekt eftir að hafa misst fyrri skutlu sína, en samt missti hún aðra af svipaðri ástæðu. Það er auðvelt að halda því fram að stofnanir og fólk fylgi skýrum, rökréttum reglum sem hægt er að prófa, skilja og breyta – en reynslan sýnir annað. þetta"Gosplans blekking'.

Ég ber oft vélanám saman við gagnagrunna, sérstaklega gagnagrunna - ný grundvallartækni sem hefur breytt getu tölvunarfræðinnar og umheimsins, sem er orðin hluti af öllu, sem við notum stöðugt án þess að gera okkur grein fyrir því. Gagnasöfn eiga líka við vandamál að stríða og eru af svipuðum toga: Kerfið getur verið byggt á slæmum forsendum eða slæmum gögnum, en erfitt verður að taka eftir því og fólkið sem notar kerfið gerir það sem það segir þeim án þess að spyrja spurninga. Það er fullt af gömlum brandara um skattafólk sem einu sinni stafsett nafnið þitt vitlaust og að sannfæra þá um að leiðrétta mistökin er miklu erfiðara en að breyta nafninu þínu í raun og veru. Það eru margar leiðir til að hugsa um þetta, en það er ekki ljóst hvort er betra: sem tæknilegt vandamál í SQL, eða sem villa í Oracle útgáfu, eða sem bilun í skrifræðisstofnunum? Hversu erfitt er að finna villu í ferli sem hefur leitt til þess að kerfið hefur ekki prentvilluleiðréttingareiginleika? Hefði verið hægt að átta sig á þessu áður en fólk fór að kvarta?

Þetta vandamál skýrist enn frekar af sögum þegar ökumenn keyra út í ár vegna gamaldags gagna í stýrikerfinu. Allt í lagi, kort þarf að uppfæra stöðugt. En hversu mikið á TomTom að kenna um að bíllinn þinn hafi verið sprengdur út á haf?

Ástæðan fyrir því að ég segi þetta er sú að já, hlutdrægni í vélanámi mun skapa vandamál. En þessi vandamál verða svipuð þeim sem við höfum staðið frammi fyrir í fortíðinni og hægt er að taka eftir þeim og leysa (eða ekki) um það bil eins vel og við gátum áður. Þess vegna er ólíklegt að atburðarás þar sem hlutdrægni í gervigreind veldur skaða gerist hjá háttsettum vísindamönnum sem starfa í stórri stofnun. Líklegast mun einhver óverulegur tækniverktaki eða hugbúnaðarsali skrifa eitthvað á hnén með því að nota opinn hugbúnað, bókasöfn og verkfæri sem þeir skilja ekki. Og óheppni viðskiptavinurinn mun kaupa setninguna „gervigreind“ í vörulýsingunni og, án þess að spyrja spurninga, dreifa því til láglauna starfsmanna sinna og skipa þeim að gera það sem gervigreindin segir. Þetta er nákvæmlega það sem gerðist með gagnagrunna. Þetta er ekki gervigreindarvandamál, eða jafnvel hugbúnaðarvandamál. Þetta er mannlegi þátturinn.

Ályktun

Vélnám getur gert allt sem þú getur kennt hundi - en þú getur aldrei verið viss um hvað nákvæmlega þú kenndir hundinum.

Mér finnst oft eins og hugtakið „gervigreind“ komi aðeins í veg fyrir samtöl sem þessi. Þetta hugtak gefur ranga mynd af því að við höfum í raun búið það til - þessa greind. Að við séum á leiðinni til HAL9000 eða Skynet - eitthvað sem reyndar skilur. En nei. Þetta eru bara vélar og það er miklu nákvæmara að bera þær saman við td þvottavél. Hún þvo þvott mun betur en manneskja, en ef þú setur upp í hana í staðinn fyrir þvott þá... þvoir hún þá. Diskarnir verða jafnvel hreinir. En þetta verður ekki það sem þú bjóst við og þetta mun ekki gerast vegna þess að kerfið hefur einhverja fordóma varðandi rétti. Þvottavélin veit ekki hvað diskar eru eða hvað föt eru - hún er bara dæmi um sjálfvirkni, hugmyndalega ekkert frábrugðin því hvernig ferlar voru sjálfvirkir áður.

Hvort sem við erum að tala um bíla, flugvélar eða gagnagrunna, þá verða þessi kerfi bæði mjög öflug og mjög takmörkuð. Þeir munu algjörlega ráðast af því hvernig fólk notar þessi kerfi, hvort fyrirætlanir þeirra eru góðar eða slæmar og hversu mikið þeir skilja hvernig þeir virka.

Þess vegna er það algjörlega rangt að segja að „gervigreind sé stærðfræði, svo hún getur ekki haft hlutdrægni“. En það er jafn rangt að segja að vélanám sé „huglægt í eðli sínu“. Vélanám finnur mynstur í gögnum og hvaða mynstur það finnur fer eftir gögnunum og gögnin eru háð okkur. Alveg eins og við gerum við þá. Vélnám gerir suma hluti miklu betur en við getum - en hundar, til dæmis, eru mun áhrifaríkari en menn við að greina fíkniefni, sem er ekki ástæða til að nota þá sem vitni og dæma út frá framburði þeirra. Og hundar, við the vegur, eru miklu snjallari en öll vélanámskerfi.

Þýðing: Díana Letskaya.
Breyting: Aleksey Ivanov.
Samfélag: @PonchikNews.

Heimild: www.habr.com

Bæta við athugasemd