UtvÀrdering av AI-verktygs effektivitet visar pÄ en avmattning, inte en acceleration, av utvecklingen

Forskargruppen METR (Model Evaluation & Threat Research) har publicerat resultaten av ett experiment för att utvÀrdera effektiviteten av att anvÀnda AI-verktyg för att skriva kod. I motsats till förvÀntningarna visade studien att AI-assistenter inte snabbar upp, utan saktar ner, lösningen av uppgifter, trots att deltagarna i experimentet subjektivt trodde att AI accelererade deras arbete.

Faktum Àr att nÀr man anvÀnde en AI-assistent var den genomsnittliga tiden som spenderades pÄ en uppgift 19 % lÀngre, medan deltagarna trodde att AI hjÀlpte dem att slutföra uppgiften 20 % snabbare, och innan de pÄbörjade uppgiften trodde de att AI skulle hjÀlpa dem att snabba upp uppgiften med 24 %. Resultaten skiljer sig ocksÄ avsevÀrt frÄn förutsÀgelserna frÄn experter inom ekonomi och maskininlÀrning, som förutspÄdde tidsbesparingar pÄ 39 % respektive 38 % vid anvÀndning av AI.

UtvÀrdering av AI-verktygs effektivitet visar pÄ en avmattning, inte en acceleration, av utvecklingen

Under experimentet ombads 16 utvecklare med öppen kÀllkod och genomsnittlig erfarenhet av AI-verktyg att lösa 246 uppgifter relaterade till att ÄtgÀrda buggar och lÀgga till nya funktioner. Uppgifterna genererades baserat pÄ verkliga problem i GitHub-repositorier för projekt som de utvalda utvecklarna hade minst 5 Ärs erfarenhet av. Vissa uppgifter erbjöds slumpmÀssigt att lösas manuellt, och vissa erbjöds att lösas med hjÀlp av valfri AI-assistent efter utvecklarens val (de flesta föredrog Cursor-kodredigeraren med Claude 3.5/3.7 Sonnet-modellen).

Experimentet, som pÄgick frÄn februari till juni 2025, omfattade projekt med öppen kÀllkod som mito, stdlib, ghc, cabal, flair, jsdom, hypothesis, trieve, scikit-learn, gpt-neox och transformers. I genomsnitt hade de inblandade projekten 23 1.1 GitHub-stjÀrnor, 20 miljoner kodrader, 710 XNUMX commits och XNUMX bidragsgivare.

UtvÀrdering av AI-verktygs effektivitet visar pÄ en avmattning, inte en acceleration, av utvecklingen

Följande möjliga orsaker till lÄngsam problemlösning vid anvÀndning av AI nÀmns:

  • LĂ„g kvalitet pĂ„ AI-rekommendationer – utvecklare accepterade mindre Ă€n 44 % av AI-genererade förslag och lade ner mycket tid pĂ„ att rensa och kontrollera dem.
  • Överdriven optimism om AI:s anvĂ€ndbarhet och uppblĂ„sta förvĂ€ntningar pĂ„ AI-verktygens kapacitet.
  • Deltagarna hade omfattande erfarenhet av att arbeta med de repositories som uppgifterna löstes för. Utvecklarna var mycket vĂ€l insatta i projekten och AI-hjĂ€lp var inte av vĂ€rde i denna situation.
  • Experimentet anvĂ€nde för stora och komplexa databaser, vilket AI:n inte fungerar bra med.
  • Implicit databaskontext – AI förstod inte det sammanhang den arbetade i.

Slutsats: utvecklare lÀgger mindre tid pÄ att skriva kod, söka efter information och lÀsa dokumentation nÀr de anvÀnder AI-verktyg, men dessa besparingar uppvÀgs av den ökade tiden som lÀggs pÄ att generera AI-frÄgor, analysera prompter, vÀnta pÄ resultat, granska förslag och inte göra nÄgonting alls. IstÀllet för att generera kod lÀggs tid pÄ att interagera med AI:n, studera resultaten och kontrollera den föreslagna koden. Det Àr möjligt att om mindre erfarna utvecklare, som Àr mindre ansvariga för kodgranskning eller arbetar med en okÀnd kodbas, hade deltagit i experimentet, skulle andra utvecklingseffektivitetsmÄtt ha erhÄllits.

Dessutom genomförde Qodo en undersökning av 609 utvecklare som anvÀnder AI i sin kodning. 78 % rapporterade en ökad produktivitet efter att ha anvÀnt AI, 60 % rapporterade en ökning av den totala kodkvaliteten tack vare AI och 20 % rapporterade en minskning av kodkvaliteten efter att ha anvÀnt AI. Samtidigt noterade 76 % att de inte anvÀnder AI-kod utan föregÄende manuell granskning. Artikeln noterar ocksÄ att enskilda utvecklare kÀnner sig betydligt bÀttre nÀr de anvÀnder AI, eftersom de kan tillhandahÄlla mer kod, men pÄ bekostnad av ökad arbetsbelastning för dem som ansvarar för att acceptera kod i projekt, granska Àndringar och kontrollera kvalitet.

KĂ€lla: opennet.ru

Köp pĂ„litlig hosting för webbplatser med DDoS-skydd, VPS VDS-servrar đŸ”„ Köp pĂ„litlig webbhotell med DDoS-skydd, VPS VDS-servrar | ProHoster