Konsènan Bias entèlijans atifisyèl

Konsènan Bias entèlijans atifisyèl

tl; DR:

  • Aprantisaj machin chèche modèl nan done yo. Men, entèlijans atifisyèl ka "partizal"-sa vle di, jwenn modèl ki mal. Pou egzanp, yon sistèm deteksyon kansè po ki baze sou foto ka peye atansyon espesyal sou imaj yo pran nan biwo yon doktè. Aprantisaj machin pa kapab konprann: algoritm li yo sèlman idantifye modèl nan nimewo, epi si done yo pa reprezante, se konsa rezilta a nan pwosesis li yo. Ak pwan pinèz sa yo ka difisil akòz mekanik yo nan aprantisaj machin.
  • Zòn pwoblèm ki pi evidan ak redoutable se divèsite moun. Gen anpil rezon ki fè done sou moun ka pèdi objektivite menm nan etap koleksyon an. Men, pa panse ke pwoblèm sa a sèlman afekte moun: egzakteman menm difikilte yo rive lè w ap eseye detekte yon inondasyon nan yon depo oswa yon turbine gaz ki echwe. Gen kèk sistèm ki ka patipri nan direksyon pou koulè po, lòt moun yo pral patipri nan direksyon pou detèktè Siemens.
  • Pwoblèm sa yo pa nouvo nan aprantisaj machin, epi yo pa inik nan li. Yo fè move sipozisyon nan nenpòt estrikti konplèks, epi konprann poukisa yo te pran yon desizyon an patikilye toujou difisil. Nou bezwen konbat sa a nan yon fason konplè: kreye zouti ak pwosesis pou verifikasyon - ak edike itilizatè yo pou yo pa avèg swiv rekòmandasyon AI. Aprantisaj machinn fè kèk bagay pi byen pase nou kapab - men chen, pou egzanp, pi efikas pase moun nan detekte dwòg, ki se pa yon rezon ki fè yo sèvi ak yo kòm temwen epi fè jijman ki baze sou temwayaj yo. Ak chen, nan chemen an, yo pi entelijan pase nenpòt sistèm aprantisaj machin.

Aprantisaj machin se youn nan tandans teknoloji fondamantal ki pi enpòtan jodi a. Sa a se youn nan pi gwo fason teknoloji pral chanje mond lan bò kote nou nan pwochen deseni. Gen kèk aspè nan chanjman sa yo ki lakòz enkyetid. Pou egzanp, enpak potansyèl nan aprantisaj machin sou mache travay la, oswa itilizasyon li pou rezon ki pa etik (pa egzanp, pa rejim otoritè). Gen yon lòt pwoblèm ke pòs sa a adrese: patipri entèlijans atifisyèl.

Sa a se pa yon istwa fasil.

Konsènan Bias entèlijans atifisyèl
AI Google a ka jwenn chat. Nouvèl sa a soti nan 2012 te yon bagay espesyal lè sa a.

Ki sa ki "AI Bias"?

"Done kri" se tou de yon oksimòn ak yon move lide; done yo dwe prepare byen ak anpil atansyon. — Geoffrey Bocker

Yon kote anvan 2013, yo nan lòd yo fè yon sistèm ki, di, rekonèt chat nan foto, ou te oblije dekri etap lojik. Ki jan yo jwenn kwen nan yon imaj, rekonèt je, analize teksti pou fouri, konte grif, ak sou sa. Lè sa a, mete tout eleman yo ansanm epi dekouvri ke li pa reyèlman travay. Anpil tankou yon chwal mekanik - teyorikman li ka fèt, men nan pratik li twò konplèks pou dekri. Rezilta final la se dè santèn (oswa menm dè milye) règ ekri alamen. E pa yon sèl modèl k ap travay.

Avèk avenman aprantisaj machin, nou sispann sèvi ak règ "manyèl" pou rekonèt yon objè patikilye. Olye de sa, nou pran mil echantiyon "sa", X, mil echantiyon "lòt", Y, epi fè òdinatè a bati yon modèl ki baze sou analiz estatistik yo. Lè sa a, nou bay modèl sa a kèk echantiyon done epi li detèmine ak kèk presizyon si li adapte youn nan seri yo. Aprantisaj machin jenere yon modèl soti nan done olye ke nan yon moun ekri li. Rezilta yo enpresyonan, espesyalman nan domèn rekonesans imaj ak modèl, e se pou sa tout endistri teknoloji a ap deplase kounye a nan aprantisaj machin (ML).

Men, li pa senp konsa. Nan mond reyèl la, plizyè milye egzanp ou yo nan X oswa Y genyen tou A, B, J, L, O, R, e menm L. Sa yo ka pa menm distribye, ak kèk ka rive tèlman souvan ke sistèm nan ap peye plis. atansyon sou yo pase nan objè ki enterese w.

Ki sa sa vle di nan pratik? Egzanp pi renmen mwen an se lè sistèm rekonesans imaj gade yon ti mòn zèb epi di, "mouton". Li klè poukisa: pi fò nan egzanp foto "mouton" yo pran nan savann kote yo rete a, ak nan imaj sa yo zèb la pran pi plis espas pase ti duve blan yo, epi li se zèb la ke sistèm nan konsidere pi enpòtan. .

Gen egzanp ki pi grav. Youn resan pwojè pou detekte kansè po nan foto yo. Li te tounen soti ke dèrmatolog souvan foto règ la ansanm ak manifestasyon yo nan kansè po pou anrejistre gwosè a nan fòmasyon yo. Pa gen okenn règ nan foto egzanp po an sante. Pou yon sistèm AI, règ sa yo (pi jisteman, piksèl ke nou defini kòm yon "règ") te vin youn nan diferans ki genyen ant seri egzanp, epi pafwa pi enpòtan pase yon ti gratèl sou po a. Se konsa, yon sistèm ki te kreye pou idantifye kansè po pafwa rekonèt chèf olye.

Pwen kle isit la se ke sistèm nan pa gen okenn konpreyansyon semantik sou sa li ap gade. Nou gade nan yon seri piksèl epi wè nan yo yon mouton, po oswa règ, men sistèm nan se sèlman yon liy nimewo. Li pa wè espas ki genyen twa dimansyon, li pa wè objè, teksti, oswa mouton. Li tou senpleman wè modèl nan done yo.

Difikilte pou dyagnostik pwoblèm sa yo se ke rezo neral la (modèl ki te pwodwi pa sistèm aprantisaj machin ou a) konsiste de dè milye de santèn de milye de nœuds. Pa gen okenn fason fasil pou gade nan yon modèl ak wè ki jan li pran yon desizyon. Èske w gen yon fason sa a ta vle di ke pwosesis la se senp ase yo dekri tout règ yo manyèlman, san yo pa itilize aprantisaj machin. Moun yo enkyete ke aprantisaj machin te vin yon bagay nan yon bwat nwa. (Mwen pral eksplike yon ti kras pita poukisa konparezon sa a toujou twòp.)

Sa a, an tèm jeneral, se pwoblèm nan nan patipri nan entèlijans atifisyèl oswa aprantisaj machin: yon sistèm pou jwenn modèl nan done ka jwenn modèl yo mal, epi ou ka pa remake li. Sa a se yon karakteristik fondamantal nan teknoloji a, epi li evidan pou tout moun ki travay avèk li nan inivèsite ak nan gwo konpayi teknoloji. Men, konsekans li yo konplèks, epi tou solisyon posib nou pou konsekans sa yo.

Ann pale sou konsekans yo an premye.

Konsènan Bias entèlijans atifisyèl
AI ka, implicitement pou nou, fè yon chwa an favè sèten kategori moun, ki baze sou yon gwo kantite siyal insansibl.

Senaryo patipri AI

Sa ki pi evidan ak pè, pwoblèm sa a ka manifeste tèt li lè li rive divèsite moun. Dènyèman te gen yon rimèke Amazon te eseye bati yon sistèm aprantisaj machin pou premye tès depistaj kandida travay yo. Depi gen plis gason nan mitan travayè Amazon yo, egzanp "anbochaj siksè" yo tou pi souvan gason, e te gen plis gason nan seleksyon an nan rezime sijere pa sistèm nan. Amazon remake sa epi li pa lage sistèm nan nan pwodiksyon an.

Bagay ki pi enpòtan nan egzanp sa a se ke sistèm nan te gen rimè pou favorize aplikan gason, malgre lefèt ke sèks pa te espesifye sou rezime a. Sistèm nan te wè lòt modèl nan egzanp "bon anbochaj": pou egzanp, fanm ka itilize mo espesyal pou dekri reyalizasyon, oswa gen pastan espesyal. Natirèlman, sistèm nan pa t 'konnen ki sa "Hockey" te, oswa ki moun ki te "moun", oswa ki sa "siksè" te - li tou senpleman te fè yon analiz estatistik nan tèks la. Men, modèl li te wè yo ta gen plis chans ale inapèsi pa imen, ak kèk nan yo (pa egzanp, lefèt ke moun ki gen diferan sèks dekri siksè yon fason diferan) ta pwobableman difisil pou nou wè menm si nou gade yo.

Pli lwen - vin pi mal. Yon sistèm aprantisaj machin ki trè bon nan jwenn kansè sou po pal ka pa fè kòm byen sou po nwa, oswa vis vèrsa. Pa nesesèman paske nan patipri, men paske pwobableman ou bezwen bati yon modèl separe pou yon koulè po diferan, chwazi karakteristik diferan. Sistèm aprantisaj machin yo pa ka ranplase menm nan yon zòn etwat tankou rekonesans imaj. Ou bezwen ajiste sistèm nan, pafwa jis atravè esè ak erè, pou jwenn yon bon manch sou karakteristik yo ki nan done yo ki enterese nan jiskaske ou reyalize presizyon ou vle a. Men, sa ou ka pa remake se ke sistèm nan egzat 98% nan tan an ak yon gwoup, ak sèlman 91% (menm pi egzak pase analiz imen) ak lòt la.

Jiskaprezan mwen te itilize sitou egzanp ki gen rapò ak moun ak karakteristik yo. Diskisyon sou pwoblèm sa a sitou konsantre sou sijè sa a. Men, li enpòtan pou w konprann ke patipri anvè moun se sèlman yon pati nan pwoblèm nan. Nou pral sèvi ak aprantisaj machin pou anpil bagay, ak erè echantiyon yo pral enpòtan pou tout nan yo. Nan lòt men an, si w ap travay ak moun, patipri a nan done yo ka pa gen rapò ak yo.

Pou w konprann sa, ann retounen nan egzanp kansè po a epi konsidere twa posiblite ipotetik pou echèk sistèm.

  1. Distribisyon etewojèn moun: yon nimewo dezekilib nan foto nan diferan ton po, ki mennen nan fo pozitif oswa fo negatif akòz pigmantèr.
  2. Done yo fòme sistèm nan genyen yon karakteristik ki souvan rive ak distribye ki pa asosye ak moun epi ki pa gen okenn valè dyagnostik: yon règ nan foto kansè po oswa zèb nan foto mouton. Nan ka sa a, rezilta a pral diferan si sistèm nan jwenn piksèl nan imaj la nan yon bagay ke je imen an idantifye kòm yon "règ".
  3. Done yo gen yon karakteristik twazyèm pati ke yon moun pa ka wè menm si li gade pou li.

Sa sa vle di? Nou konnen a priori ke done yo ka reprezante diferan gwoup moun yon fason diferan, epi nan yon minimòm nou ka planifye pou chèche eksepsyon sa yo. Nan lòt mo, gen anpil rezon sosyal yo asime ke done sou gwoup moun deja gen kèk patipri. Si nou gade nan foto a ak règ la, nou pral wè règ sa a - nou tou senpleman inyore li anvan, konnen ke li pa gen pwoblèm, ak bliye ke sistèm nan pa konnen anyen.

Men, e si tout foto ou nan po malsen yo te pran nan yon biwo anba limyè enkandesan, epi po an sante ou te pran anba limyè fliyoresan? E si, apre ou fin tire po an sante, anvan ou tire po malsen, ou mete ajou sistèm operasyon an sou telefòn ou, ak Apple oswa Google yon ti kras chanje algorithm rediksyon bri a? Yon moun pa ka remake sa a, kèlkeswa kantite li gade pou karakteristik sa yo. Men, sistèm nan machin-itilize pral imedyatman wè epi sèvi ak sa a. Li pa konn anyen.

Jiskaprezan nou te pale sou korelasyon fo, men li ta ka tou ke done yo egzat ak rezilta yo kòrèk, men ou pa vle sèvi ak yo pou rezon etik, legal, oswa jesyon. Gen kèk jiridiksyon, pou egzanp, pa pèmèt fanm yo resevwa yon rabè sou asirans yo, menm si fanm yo ka chofè ki pi an sekirite. Nou ka byen fasil imajine yon sistèm ki, lè nou analize done istorik, ta bay yon faktè risk ki pi ba nan non fi. Oke, ann retire non yo nan seleksyon an. Men, sonje egzanp Amazon an: sistèm nan ka detèmine sèks ki baze sou lòt faktè (menm si li pa konnen ki sèks yo ye, oswa menm ki sa yon machin ye), epi ou pa pral remake sa jiskaske regilatè a analize retwoaktif tarif ou yo. òf ak chaj ou pral peye amann.

Finalman, li souvan sipoze ke nou pral sèlman itilize sistèm sa yo pou pwojè ki enplike moun ak entèraksyon sosyal. Sa a se mal. Si ou fè turbin gaz, ou pral pwobableman vle aplike aprantisaj machin nan telemetri a transmèt pa dè dizèn oswa dè santèn de detèktè sou pwodwi ou (odyo, videyo, tanperati, ak nenpòt lòt detèktè jenere done ki ka trè fasil adapte yo kreye yon machin. modèl aprantisaj). Ipotetikman, ou ta ka di, “Men done ki soti nan mil turbin ki echwe anvan yo echwe, ak isit la se done ki soti nan mil turbin ki pa t echwe. Bati yon modèl pou di ki diferans ki genyen ant yo." Oke, kounye a imajine ke detèktè Siemens yo enstale sou 75% nan turbin move, ak sèlman 12% nan sa ki bon (pa gen okenn koneksyon ak echèk). Sistèm nan pral konstwi yon modèl pou jwenn turbin ak detèktè Siemens. Oups!

Konsènan Bias entèlijans atifisyèl
Foto — Moritz Hardt, UC Berkeley

Jere AI Bias

Kisa nou ka fè sou li? Ou ka apwoche pwoblèm nan nan twa ang:

  1. Rigid metodolojik nan kolekte ak jere done pou fòmasyon sistèm nan.
  2. Zouti teknik pou analize ak dyagnostik konpòtman modèl.
  3. Antrene, edike, epi fè atansyon lè w ap aplike aprantisaj machin nan pwodwi yo.

Gen yon blag nan liv Molière "Boujwa nan Noblès la": yon nonm te di ke literati divize an pwoz ak pwezi, li te kontan dekouvri ke li te pale nan pwoz tout lavi li, san yo pa konnen li. Sa a se pwobableman ki jan statistikisyen yo santi jodi a: san yo pa reyalize li, yo te dedye karyè yo nan entèlijans atifisyèl ak erè echantiyon. Kap chèche erè echantiyon ak enkyete sou li se pa yon nouvo pwoblèm, nou jis bezwen sistematik apwòch solisyon li yo. Kòm mansyone pi wo a, nan kèk ka li se aktyèlman pi fasil fè sa pa etidye pwoblèm ki gen rapò ak done moun. Nou a priori sipoze ke nou ka gen prejije konsènan diferan gwoup moun, men li difisil pou nou menm imajine yon prejije sou detèktè Siemens.

Sa ki nouvo nan tout sa a, nan kou, se ke moun pa fè analiz estatistik ankò dirèkteman. Li se te pote soti nan machin ki kreye gwo, modèl konplèks ki difisil a konprann. Pwoblèm transparans se youn nan aspè prensipal yo nan pwoblèm nan patipri. Nou pè ke sistèm nan se pa sèlman patipri, men ke pa gen okenn fason yo detekte patipri li yo, e ke aprantisaj machin diferan de lòt fòm automatisation, ki sipoze konpoze de etap lojik klè ki ka teste.

Gen de pwoblèm isit la. Nou ka toujou kapab fè kèk kalite odit nan sistèm aprantisaj machin. Ak odit nenpòt lòt sistèm aktyèlman pa pi fasil.

Premyèman, youn nan direksyon rechèch modèn nan domèn aprantisaj machin se rechèch pou metòd pou idantifye fonksyonalite enpòtan nan sistèm aprantisaj machin. Sa te di, aprantisaj machin (nan eta aktyèl li) se yon domèn syans konplètman nouvo ki chanje byen vit, kidonk pa panse ke bagay ki enposib jodi a pa ka byento vin byen reyèl. Pwojè OpenAI - yon egzanp enteresan nan sa a.

Dezyèmman, lide ke yon moun ka teste ak konprann pwosesis pou pran desizyon sistèm oswa òganizasyon ki egziste deja se yon bon bagay nan teyori, men se konsa konsa nan pratik. Konprann ki jan desizyon yo pran nan yon gwo òganizasyon pa fasil. Menm si gen yon pwosesis pou pran desizyon fòmèl, li pa reflete ki jan moun aktyèlman kominike, epi yo menm yo souvan pa gen yon apwòch lojik, sistematik pou pran desizyon yo. Parey mon koleg in dir Vijay Pande, moun yo tou bwat nwa.

Pran yon mil moun nan plizyè konpayi sipèpoze ak enstitisyon, ak pwoblèm nan vin menm pi konplèks. Nou konnen apre lefèt ke navèt espasyal la te destine kraze lè retounen, e moun ki nan NASA te gen enfòmasyon ki te ba yo rezon pou panse yon move bagay ta ka rive, men sistèm nan. jeneralman Mwen pa t 'konnen sa a. NASA menm jis te pase yon odit menm jan an apre li te pèdi navèt anvan li a, e ankò li te pèdi yon lòt pou yon rezon ki sanble anpil. Li fasil pou diskite ke òganizasyon ak moun swiv règ klè, ki lojik ki ka teste, konprann, ak chanje-men eksperyans pwouve otreman. Sa a"Dezi Gosplan'.

Mwen souvan konpare aprantisaj machin ak baz done, espesyalman relasyon yo - yon nouvo teknoloji fondamantal ki te chanje kapasite yo nan syans enfòmatik ak mond lan alantou li, ki te vin tounen yon pati nan tout bagay, ke nou itilize toujou ap san yo pa reyalize li. Baz done yo gen pwoblèm tou, epi yo gen yon nati menm jan an: sistèm nan ka bati sou move sipozisyon oswa move done, men li pral difisil a remake, ak moun ki sèvi ak sistèm nan pral fè sa li di yo san yo pa poze kesyon. Genyen anpil vye blag sou moun taks yo ki yon fwa eple non ou mal, ak konvenk yo pou yo korije erè a pi difisil pase aktyèlman chanje non ou. Gen plizyè fason yo panse sou sa, men li pa klè ki pi bon: kòm yon pwoblèm teknik nan SQL, oswa kòm yon ensèk nan yon lage Oracle, oswa kòm yon echèk nan enstitisyon biwokratik? Ki jan li difisil pou jwenn yon ensèk nan yon pwosesis ki te mennen nan sistèm nan pa gen yon karakteristik koreksyon typo? Èske sa a te ka kalkile anvan moun te kòmanse plenyen?

Pwoblèm sa a ilistre menm plis tou senpleman pa istwa lè chofè kondwi nan rivyè akòz done demode nan navigatè a. Oke, kat yo bezwen mete ajou toujou. Men, konbyen TomTom te blame pou machin ou te soufle nan lanmè?

Rezon ki fè mwen di sa a se wi, patipri aprantisaj machin ap kreye pwoblèm. Men, pwoblèm sa yo pral sanble ak sa nou te fè fas nan tan lontan an, epi yo ka remake ak rezoud (oswa ou pa) sou osi byen ke nou te kapab nan tan lontan an. Se poutèt sa, yon senaryo kote patipri AI lakòz domaj pa gen anpil chans rive chèchè ansyen k ap travay nan yon gwo òganizasyon. Gen plis chans, kèk kontraktè teknoloji ensiyifyan oswa vandè lojisyèl pral ekri yon bagay sou jenou yo, lè l sèvi avèk konpozan sous louvri, bibliyotèk ak zouti ke yo pa konprann. Ak kliyan an malheureux pral achte fraz "entèlijans atifisyèl" nan deskripsyon pwodwi a epi, san yo pa poze okenn kesyon, distribye li bay anplwaye ki ba li yo, kòmande yo fè sa AI a di. Sa a se egzakteman sa ki te pase ak baz done. Sa a se pa yon pwoblèm entèlijans atifisyèl, oswa menm yon pwoblèm lojisyèl. Sa a se faktè imen an.

Konklizyon

Aprantisaj machin ka fè nenpòt bagay ou ka anseye yon chen - men ou pa janm ka sèten ki sa egzakteman ou te anseye chen an.

Mwen souvan santi ke tèm "entelijans atifisyèl la" sèlman vin nan chemen an nan konvèsasyon tankou sa a. Tèm sa a bay fo enpresyon ke nou aktyèlman kreye li - entelijans sa a. Ke nou ap sou wout nou nan HAL9000 oswa Skynet - yon bagay ki aktyèlman konprann. Men non. Sa yo se jis machin, epi li se pi plis egzak konpare yo ak, di, yon machin lave. Li fè lesiv pi byen pase yon moun, men si ou mete asyèt nan li olye pou yo lesiv, li... ap lave yo. Asyèt yo pral menm vin pwòp. Men, sa a pa pral sa ou te espere, epi sa a pa pral rive paske sistèm nan gen nenpòt prejije konsènan asyèt. Machin lave a pa konnen ki sa ki asyèt yo oswa ki sa ki rad yo - li se jis yon egzanp nan automatisation, konseptyèlman pa diferan de fason pwosesis yo te otomatize anvan.

Kit nou ap pale de machin, avyon, oswa baz done, sistèm sa yo pral tou de trè pwisan ak trè limite. Yo pral depann antyèman sou fason moun sèvi ak sistèm sa yo, si entansyon yo bon oswa move, ak konbyen yo konprann ki jan yo travay.

Se poutèt sa, di ke "entelijans atifisyèl se matematik, kidonk li pa ka gen patipri" se konplètman fo. Men, li se egalman fo yo di ke aprantisaj machin se "subjektif nan nati." Aprantisaj machinn jwenn modèl nan done, e ki modèl li jwenn depann sou done yo, epi done yo depann de nou. Jis tankou sa nou fè ak yo. Aprantisaj machinn fè kèk bagay pi byen pase nou kapab - men chen, pou egzanp, pi efikas pase moun nan detekte dwòg, ki se pa yon rezon ki fè yo sèvi ak yo kòm temwen epi fè jijman ki baze sou temwayaj yo. Ak chen, nan chemen an, yo pi entelijan pase nenpòt sistèm aprantisaj machin.

Creole: Diana Letskaya.
Modification: Aleksey Ivanov.
Kominote: @PonchikNews.

Sous: www.habr.com

Add nouvo kòmantè