Anthropic hefur tilkynnt fyrstu niðurstöður prófana á bráðabirgðaútgáfu sinni af Mythos AI líkaninu, sem eykur verulega getu þess til að finna villur, bera kennsl á veikleika og skrifa tilbúnar hugbúnaðargalla. Með því að nota Mythos AI líkanið skannaði Anthropic yfir þúsund mikilvæg opin hugbúnaðarverkefni og greindi 23019 veikleika. 6202 af þessum veikleikum voru metnir sem alvarlegir eða alvarlegir.
Af þeim 6202 veikleikum sem Mythos AI líkanið flokkaði sem hættulegar voru 1752 staðfestar af óháðum öryggisrannsóknarmönnum. Í 1587 tilfellum (90.6%) var veikleikinn staðfestur og í 1094 tilfellum (62.4%) var alvarleikastigið áfram hátt eða gagnrýnt. Miðað við núverandi hlutfall falskra jákvæðra niðurstaðna er búist við að af þeim 6202 hættulegu veikleikum sem AI líkanið greindi muni um það bil 3900 (62.4%) halda háu alvarleikastigi líkansins, að undanskildum þeim hættulegu veikleikum sem 50 þátttakendur í Glasswing verkefninu greindu sérstaklega.
Fulltrúar þeirra fyrirtækja sem voru að fara yfir gögnin deildu upplýsingum um 467 staðfesta veikleika með viðhaldsaðilum opins hugbúnaðarverkefna. Að beiðni þeirra deildu starfsmenn Anthropic upplýsingum um 1129 óstaðfest vandamál beint með viðhaldsaðilum. Alls fengu viðhaldsaðilar 281 opins hugbúnaðarverkefna upplýsingar um 1596 vandamál og staðfestu tilvist 1451 veikleika. Hins vegar hafa aðeins 97 vandamál verið lagfærð í kóðagrunnunum hingað til og 88 opinberar skýrslur um veikleika hafa verið gefnar út.
Þar að auki greindu 50 þátttakendur í Glasswing verkefninu, sem fengu snemmbúinn aðgang að Mythos líkaninu, yfir 10 hættulegar veikleikar í kóðagrunnum sínum. Til dæmis fann Cloudflare yfir 2000 villur með Mythos, þar af voru 400 metnar sem alvarlegar og alvarlegar. Tíðni falskra jákvæðra niðurstaðna hjá Cloudflare var lægri en í prófunum á mönnum. Mozilla fann 271 veikleika með Mythos þegar Firefox 150 var prófaður, sem er 10 sinnum meira en fjöldi þeirra sem fannst þegar Firefox 148 var prófaður með Claude Opus 4.6 líkaninu.
Dæmi um alvarlegt vandamál sem þegar hefur verið lagað er hér að neðan:
Öryggisbrestur (CVE-2026-5194) í dulritunarbókasafninu wolfSSL. Mythos tókst að útbúa árásargalla sem gerir árásarmanni kleift að búa til falsa ECDSA vottorð fyrir vefsíður og tölvupóstreikninga. netþjónum, sem var unnið úr sem gild þegar wolfSSL bókasafninu var staðfest. Vandamálið stafaði af því að kjötkássastærð og OID-prófun vantaði í kóðann, sem gerði kleift að tilgreina minni en leyfilega kjötkássastærð í skírteininu.
Heimild: opennet.ru
