Anthropic je napovedal projekt Glasswing, ki bo omogočil dostop do predhodne različice njihovega modela umetne inteligence Claude Mythos za namene prepoznavanja ranljivosti in izboljšanja varnosti kritične programske opreme. Med udeleženci projekta so Linux Foundation, Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Microsoft, NVIDIA in Palo Alto Networks. Povabila k sodelovanju je prejelo tudi približno 40 dodatnih organizacij.
Model umetne inteligence Claude Opus 4.6, ki je bil izdan februarja, je dosegel nove ravni zmogljivosti na področjih, kot so odkrivanje ranljivosti, odkrivanje in odpravljanje napak, pregled sprememb in ustvarjanje kode. Poskusi s tem modelom umetne inteligence so omogočili identifikacijo več kot 500 ranljivosti v projektih odprte kode in ustvarjanje prevajalnika C, ki je sposoben zgraditi jedro Linuxa. Vendar pa se je Claude Opus 4.6 slabo odrezal pri ustvarjanju delujočih izkoriščanj.
Po podatkih Anthropica model naslednje generacije »Claude Mythos« bistveno prekaša Claude Opus 4.6 pri ustvarjanju izkoriščanj, ki so pripravljena za uporabo. Od več sto poskusov ustvarjanja izkoriščanj za ranljivosti, odkrite v Firefoxovem JavaScript mehanizmu, sta bila s Claude Opus 4.6 uspešna le dva. Pri ponovitvi poskusa z uporabo predhodne različice modela Mythos so bila delujoča izkoriščanja ustvarjena 181-krat – stopnja uspešnosti se je povečala s skoraj nič na 72.4 %.

Poleg tega Claude Mythos znatno širi svoje zmogljivosti za odkrivanje ranljivosti in hroščev. To, skupaj z njegovo primernostjo za razvoj izkoriščanja ranljivosti, ustvarja nova tveganja za industrijo: izkoriščanje nepopravljenih ranljivosti nič-day lahko v nekaj urah ustvarijo tudi nestrokovnjaki. Omeniti velja, da so zmogljivosti za odkrivanje in izkoriščanje ranljivosti Mythos dosegle profesionalno raven in zaostajajo le za najbolj izkušenimi strokovnjaki.
Ker odprtje neomejenega dostopa do modela umetne inteligence s takimi zmogljivostmi zahteva pripravo industrije, je bilo odločeno, da se predhodna različica sprva odpre izbrani skupini strokovnjakov, ki bodo izvajali odkrivanje ranljivosti in odpravljanje popravkov v kritičnih programskih izdelkih in programski opremi z odprto kodo. Za financiranje pobude je bila dodeljena subvencija v obliki žetonov v višini 100 milijonov dolarjev, 4 milijone dolarjev pa bodo podarjeni organizacijam, ki podpirajo varnost projektov z odprto kodo.
V primerjalnem testu CyberGym, ki ocenjuje zmožnosti modelov za zaznavanje ranljivosti, je model Mythos dosegel rezultat 83.1 %, medtem ko je Opus 4.6 dosegel rezultat 66.6 %. V testih kakovosti kode so modeli pokazali naslednjo zmogljivost:
Med poskusom je Anthropic z uporabo modela umetne inteligence Mythos v samo nekaj tednih odkril več tisoč prej neznanih (0-day) ranljivosti, od katerih so bile mnoge ocenjene kot kritične. Med njimi so odkrili ranljivost v skladu OpenBSD TCP, ki je ostala neodkrita 27 let in je omogočala oddaljene sesutja sistema. Odkrili so tudi 16 let staro ranljivost v implementaciji kodeka H.264 v projektu FFmpeg, pa tudi ranljivosti v kodekih H.265 in av1, ki so bile izkoriščene pri obdelavi posebej izdelane vsebine.
V jedru Linuxa so odkrili več ranljivosti, ki so lahko neprivilegiranemu uporabniku omogočile pridobitev root pravic. Združevanje teh ranljivosti je omogočilo ustvarjanje izkoriščanja, ki je lahko pridobilo root pravice z odpiranjem posebnih strani v spletnem brskalniku. Ustvarjeno je bilo tudi izkoriščanje, ki je omogočalo izvajanje kode s root pravicami s pošiljanjem posebej oblikovanih omrežnih paketov na strežnik FreeBSD NFS.
V sistemu za virtualizacijo, napisanem v jeziku, ki zagotavlja orodja za varno upravljanje pomnilnika, je bila odkrita ranljivost. Ta ranljivost potencialno omogoča izvajanje kode na strani gostitelja z manipulacijo gostujočega sistema (ranljivost ni imenovana, ker še ni bila odpravljena, vendar se zdi, da je prisotna v nevarnem bloku v kodi Rust). Ranljivosti so bile najdene v vseh priljubljenih spletnih brskalnikih in kriptografskih knjižnicah. Ranljivosti SQL injection so bile odkrite v različnih spletnih aplikacijah.
Vir: opennet.ru
