Anthropic projeya Glasswing ragihand, ku dê gihîştina guhertoyek pêşîn a modela xwe ya AI ya Claude Mythos peyda bike da ku qelsiyên kêmasiyan tespît bike û ewlehiya nermalava krîtîk baştir bike. Beşdarên projeyê Linux Foundation, Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Microsoft, NVIDIA, û Palo Alto Networks in. Nêzîkî 40 rêxistinên din jî vexwendin ji bo beşdarbûnê wergirtine.
Modela AI ya Claude Opus 4.6 ku di meha Sibatê de hate weşandin, di warên wekî tespîtkirina lawaziyan, tespîtkirin û rastkirina xeletiyan, nirxandina guhertinan û çêkirina kodê de astên nû yên performansê bi dest xist. Ceribandinên bi vê modela AI re rê dan ku di projeyên çavkaniya vekirî de zêdetirî 500 lawaziyan werin destnîşankirin û kompîlerek C were çêkirin ku dikare kernela Linux-ê ava bike. Lêbelê, Claude Opus 4.6 di afirandina îstismarên xebitandinê de performansek xirab nîşan da.
Li gorî Anthropic, modela "Claude Mythos" a nifşa din di hilberîna exploitên amade-ji-bo-karanînê de ji Claude Opus 4.6 pir çêtir performansê dike. Ji çend sed hewldanên afirandina exploitan ji bo qelsiyên ku di motora JavaScript a Firefoxê de hatine destnîşankirin, tenê du bi Claude Opus 4.6 serketî bûn. Dema ku ceribandin bi karanîna guhertoyek pêşîn a modela Mythos hate dubarekirin, exploitên xebatkar 181 caran hatin afirandin - rêjeya serkeftinê ji nêzîkî sifirê zêde bû 72.4%.

Herwiha, Claude Mythos şiyanên xwe yên tespîtkirina lawazî û xeletiyan bi girîngî berfireh dike. Ev, digel guncawbûna wê ji bo pêşxistina îstismarê, ji bo pîşesaziyê xetereyên nû diafirîne: îstismarên ji bo lawaziyên sifir-roj ên nepatchkirî dikarin ji hêla ne-pisporan ve di nav çend demjimêran de werin afirandin. Tê destnîşankirin ku şiyanên tespîtkirin û bikaranîna lawaziyên Mythos gihîştine astên profesyonel, û niha tenê ji şiyanên pisporên herî xwedî ezmûn wêdetir in.
Ji ber ku vekirina gihîştina bêsînor bo modelek AI bi şiyanên weha amadekariya pîşesaziyê hewce dike, biryar hat dayîn ku di destpêkê de guhertoyek pêşîn ji bo komek pisporên bijartî were vekirin da ku xebata tespîtkirina qelsiyan û sererastkirina wan di hilberên nermalava krîtîk û nermalava çavkaniya vekirî de bikin. Ji bo fînansekirina înîsiyatîfê, 100 mîlyon dolar subvansyonek nîşanek hatiye veqetandin, û 4 mîlyon dolar dê ji rêxistinên ku piştgiriyê didin ewlehiya projeyên çavkaniya vekirî re were bexşandin.
Di testa CyberGym de, ku şiyanên tespîtkirina qelsiyên modelan dinirxîne, modela Mythos xala 83.1%, di heman demê de Opus 4.6 xala 66.6% bi dest xist. Di testên kalîteya kodê de, modelan performansa jêrîn nîşan dan:
Di dema ceribandinê de, Anthropic, bi karanîna modela AI ya Mythos, di nav çend hefteyan de karî çend hezar kêmasiyên berê nenas (0-rojî) tespît bike, ku gelek ji wan wekî krîtîk hatine nirxandin. Di nav wan de, wan kêmasiyek di stûna TCP ya OpenBSD de keşf kir ku 27 salan nehatibû tespîtkirin, ku rê li ber têkçûna pergalê ji dûr ve vekiribû. Wan her wiha kêmasiyek 16 salî di pêkanîna kodeka H.264 a projeya FFmpeg de, û her weha kêmasiyên di kodeka H.265 û av1 de, ku dema pêvajoya naveroka bi taybetî hatî çêkirin de têne bikar anîn, keşf kirin.
Çend kêmasî di kernela Linuxê de hatin keşifkirin ku dikarin rê bidin bikarhênerekî bêmaf mafên root bi dest bixe. Zincîra van kêmasiyan bi hev re rê da ku îstîsna werin afirandin ku dikarin bi vekirina rûpelên taybetî di gerokek webê de mafên root bi dest bixin. Her wiha îstîsnayek hate afirandin ku rê da bicîhanîna kodê bi mafên root bi şandina pakêtên torê yên taybetî hatine çêkirin bo serverek NFS ya FreeBSD.
Di pergaleke virtualîzasyonê de ku bi zimanekî hatiye nivîsandin û amûrên rêveberiya bîranînê yên ewle peyda dike, lawaziyek hatiye tespîtkirin. Ev lawazî bi potansiyelî dihêle ku koda aliyê mêvandar bi rêya manîpulekirina pergala mêvan were bicîhanîn (lawazî nehatiye navandin ji ber ku hîn nehatiye rastkirin, lê xuya ye ku di blokek ne ewle de di koda Rust de heye). Lawazî di hemî gerokên webê yên populer û pirtûkxaneyên krîptografîk de hatine dîtin. Lawazîyên derzîkirina SQL di gelek sepanên webê de hatine tespîtkirin.
Source: opennet.ru
