MIT ferwidere Tiny Images-kolleksje nei it identifisearjen fan rasistyske en misogynistyske termen

Massachusetts Institute of Technology wiske dataset Tiny Images, mei in annotearre kolleksje fan 80 miljoen lytse 32x32-ôfbyldings. De set waard ûnderhâlden troch in groep dy't technologyen foar komputerfisy ûntwikkele en is sûnt 2008 brûkt troch ferskate ûndersikers om objektherkenning te trainen en te testen yn masine-learsystemen.

De reden foar it fuortheljen wie detection it brûken fan rasistyske en misogynistyske termen yn etiketten dy't de objekten beskriuwe op 'e foto's, en ek de oanwêzigens fan bylden dy't as beledigend waarden ûnderfûn. Bygelyks, der wiene bylden fan geslachtsdielen mei slang termen, bylden fan guon froulju waarden karakterisearre as "hoeren," en termen dy't wiene net akseptabel yn 'e moderne maatskippij foar swarten en Aziaten waarden brûkt.

Lykwols, it dokumint oanhelle troch MIT ek identifisearret mear serieuze problemen mei sokke kolleksjes: kompjûter fyzje technologyen kinne brûkt wurde om te ûntwikkeljen facial erkenning systemen te sykjen foar fertsjintwurdigers fan befolkingsgroepen dy't ferbean binne foar guon reden; in neural netwurk foar ôfbylding generaasje kin rekonstruearje it orizjineel út anonymisearre gegevens.

De reden foar it ferskinen fan ûnjildige wurden wie it gebrûk fan in automatisearre proses dat semantyske relaasjes brûkt út 'e Ingelske leksikale databank om te klassifisearjen WordNet, makke yn 'e jierren 1980 oan Princeton University. Om't it net mooglik is om de oanwêzigens fan offensive taal yn 80 miljoen lytse foto's mei de hân te kontrolearjen, waard besletten om tagong ta de databank folslein te blokkearjen. MIT drong ek oare ûndersikers oan om op te hâlden mei it brûken fan de kolleksje en kopyen derfan te ferwiderjen. Soartgelikense problemen wurde waarnommen yn 'e grutste annotearre ôfbyldingsdatabase IMAGEnet, dy't ek ankers fan WordNet brûkt.

MIT ferwidere Tiny Images-kolleksje nei it identifisearjen fan rasistyske en misogynistyske termen

MIT ferwidere Tiny Images-kolleksje nei it identifisearjen fan rasistyske en misogynistyske termen

Boarne: opennet.ru

Add a comment