Anthropic anonse Claude Mythos, yon modèl IA ki kapab kreye exploit ki fonksyone.

Anthropic te anonse pwojè Glasswing la, ki pral bay aksè a yon vèsyon preliminè nan modèl IA Claude Mythos li a pou idantifye vilnerabilite yo epi amelyore sekirite lojisyèl kritik yo. Patisipan nan pwojè a gen ladan Linux Foundation, Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Microsoft, NVIDIA, ak Palo Alto Networks. Apeprè 40 lòt òganizasyon te resevwa envitasyon tou pou patisipe.

Lage an fevriye, modèl IA Claude Opus 4.6 la te rive nan nouvo nivo pèfòmans nan domèn tankou deteksyon vilnerabilite, deteksyon ak koreksyon pinèz, revizyon chanjman, ak jenerasyon kòd. Eksperyans ak modèl IA sa a te pèmèt idantifikasyon plis pase 500 vilnerabilite nan pwojè sous ouvè ak jenerasyon yon konpilatè C ki kapab konstwi nwayo Linux la. Sepandan, Claude Opus 4.6 pa t fè anpil efò nan kreye eksplwatasyon ki fonksyone.

Dapre Anthropic, modèl "Claude Mythos" pwochen jenerasyon an pi pèfòman pase Claude Opus 4.6 nan pwodiksyon exploit ki pare pou itilize. Sou plizyè santèn tantativ pou kreye exploit pou vilnerabilite yo idantifye nan motè JavaScript Firefox la, se sèlman de ki te reyisi ak Claude Opus 4.6. Lè yo te repete eksperyans lan avèk yon vèsyon preliminè modèl Mythos la, yo te kreye exploit ki fonksyone 181 fwa—pousantaj siksè a te ogmante soti nan prèske zewo pou rive nan 72.4%.

Anthropic anonse Claude Mythos, yon modèl IA ki kapab kreye exploit ki fonksyone.

Anplis, Claude Mythos elaji kapasite li pou detekte vilnerabilite ak pinèz anpil. Sa a, ansanm ak kapasite li pou devlope exploit, kreye nouvo risk pou endistri a: eksplwa pou vilnerabilite zero-day ki pa korije ka kreye pa moun ki pa pwofesyonèl nan kèk èdtan. Li enpòtan pou note ke kapasite deteksyon ak eksplwatasyon vilnerabilite Mythos yo rive nan nivo pwofesyonèl, e kounye a yo sèlman depase kapasite pwofesyonèl ki gen plis eksperyans yo.

Piske pou ouvè aksè san restriksyon a yon modèl IA ak kapasite sa yo, endistri a bezwen yon preparasyon, yo te deside pou premye ouvri yon vèsyon preliminè bay yon gwoup ekspè chwazi pou fè travay idantifikasyon vilnerabilite ak koreksyon nan pwodwi lojisyèl kritik ak lojisyèl sous ouvè. Pou finanse inisyativ la, yo te bay yon sibvansyon jeton 100 milyon dola, epi yo pral bay 4 milyon dola bay òganizasyon k ap sipòte sekirite pwojè sous ouvè yo.

Nan tès depistaj CyberGym nan, ki evalye kapasite deteksyon vilnerabilite modèl yo, modèl Mythos la te rive jwenn yon nòt 83.1%, alòske Opus 4.6 te rive jwenn yon nòt 66.6%. Nan tès kalite kòd yo, modèl yo te demontre pèfòmans sa yo:

TèsMythosOpus 4.6 SWE-bench Pro 77.8% 53.4% ​​​​Terminal-Bench 2.0 82.0% 65.4% SWE-bench Multimodal 59% 27.1% SWE-bench Miltileng 87.3% 77.8% SWE-bench Verifye 93.9% 80.8%

Pandan eksperyans lan, Anthropic, lè l sèvi avèk modèl IA Mythos la, te kapab idantifye plizyè milye vilnerabilite ki te enkoni anvan (0-jou) nan jis kèk semèn, anpil ladan yo te klase kòm kritik. Pami yo, yo te dekouvri yon vilnerabilite nan pil TCP OpenBSD a ki te rete san detekte pandan 27 ane, sa ki te pèmèt sistèm aksidan a distans. Yo te dekouvri tou yon vilnerabilite ki gen 16 ane nan aplikasyon kodek H.264 pwojè FFmpeg la, ansanm ak vilnerabilite nan kodek H.265 ak av1 yo, ki te eksplwate lè y ap trete kontni ki fèt espesyalman.

Yo te dekouvri plizyè vilnerabilite nan kernel Linux la ki te kapab pèmèt yon itilizatè ki pa gen privilèj jwenn privilèj root. Lè yo te mete vilnerabilite sa yo an chenn, sa te pèmèt yo kreye exploit ki te kapab jwenn privilèj root lè yo te louvri paj espesyal nan yon navigatè entènèt. Yo te kreye tou yon exploit ki te pèmèt ekzekisyon kòd ak privilèj root lè yo te voye pake rezo espesyalman kreye bay yon sèvè NFS FreeBSD.

Yo idantifye yon vilnerabilite nan yon sistèm vityalizasyon ki ekri nan yon langaj ki bay zouti jesyon memwa an sekirite. Vilnerabilite sa a potansyèlman pèmèt ekzekisyon kòd bò lame a atravè manipilasyon sistèm envite a (vilnerabilite a pa nonmen paske li poko korije, men li sanble prezan nan yon blòk ki pa an sekirite nan kòd Rust la). Yo jwenn vilnerabilite nan tout navigatè entènèt popilè yo ak bibliyotèk kriptografik yo. Yo idantifye vilnerabilite enjeksyon SQL nan divès aplikasyon entènèt.

Sous: opennet.ru

Add nouvo kòmantè