Forskargruppen METR (Model Evaluation & Threat Research) har publicerat resultaten av ett experiment för att utvÀrdera effektiviteten av att anvÀnda AI-verktyg för att skriva kod. I motsats till förvÀntningarna visade studien att AI-assistenter inte snabbar upp, utan saktar ner, lösningen av uppgifter, trots att deltagarna i experimentet subjektivt trodde att AI accelererade deras arbete.
Faktum Àr att nÀr man anvÀnde en AI-assistent var den genomsnittliga tiden som spenderades pÄ en uppgift 19 % lÀngre, medan deltagarna trodde att AI hjÀlpte dem att slutföra uppgiften 20 % snabbare, och innan de pÄbörjade uppgiften trodde de att AI skulle hjÀlpa dem att snabba upp uppgiften med 24 %. Resultaten skiljer sig ocksÄ avsevÀrt frÄn förutsÀgelserna frÄn experter inom ekonomi och maskininlÀrning, som förutspÄdde tidsbesparingar pÄ 39 % respektive 38 % vid anvÀndning av AI.

Under experimentet ombads 16 utvecklare med öppen kÀllkod och genomsnittlig erfarenhet av AI-verktyg att lösa 246 uppgifter relaterade till att ÄtgÀrda buggar och lÀgga till nya funktioner. Uppgifterna genererades baserat pÄ verkliga problem i GitHub-repositorier för projekt som de utvalda utvecklarna hade minst 5 Ärs erfarenhet av. Vissa uppgifter erbjöds slumpmÀssigt att lösas manuellt, och vissa erbjöds att lösas med hjÀlp av valfri AI-assistent efter utvecklarens val (de flesta föredrog Cursor-kodredigeraren med Claude 3.5/3.7 Sonnet-modellen).
Experimentet, som pÄgick frÄn februari till juni 2025, omfattade projekt med öppen kÀllkod som mito, stdlib, ghc, cabal, flair, jsdom, hypothesis, trieve, scikit-learn, gpt-neox och transformers. I genomsnitt hade de inblandade projekten 23 1.1 GitHub-stjÀrnor, 20 miljoner kodrader, 710 XNUMX commits och XNUMX bidragsgivare.

Följande möjliga orsaker till lÄngsam problemlösning vid anvÀndning av AI nÀmns:
- LĂ„g kvalitet pĂ„ AI-rekommendationer â utvecklare accepterade mindre Ă€n 44 % av AI-genererade förslag och lade ner mycket tid pĂ„ att rensa och kontrollera dem.
- Ăverdriven optimism om AI:s anvĂ€ndbarhet och uppblĂ„sta förvĂ€ntningar pĂ„ AI-verktygens kapacitet.
- Deltagarna hade omfattande erfarenhet av att arbeta med de repositories som uppgifterna löstes för. Utvecklarna var mycket vÀl insatta i projekten och AI-hjÀlp var inte av vÀrde i denna situation.
- Experimentet anvÀnde för stora och komplexa databaser, vilket AI:n inte fungerar bra med.
- Implicit databaskontext â AI förstod inte det sammanhang den arbetade i.
Slutsats: utvecklare lÀgger mindre tid pÄ att skriva kod, söka efter information och lÀsa dokumentation nÀr de anvÀnder AI-verktyg, men dessa besparingar uppvÀgs av den ökade tiden som lÀggs pÄ att generera AI-frÄgor, analysera prompter, vÀnta pÄ resultat, granska förslag och inte göra nÄgonting alls. IstÀllet för att generera kod lÀggs tid pÄ att interagera med AI:n, studera resultaten och kontrollera den föreslagna koden. Det Àr möjligt att om mindre erfarna utvecklare, som Àr mindre ansvariga för kodgranskning eller arbetar med en okÀnd kodbas, hade deltagit i experimentet, skulle andra utvecklingseffektivitetsmÄtt ha erhÄllits.
Dessutom genomförde Qodo en undersökning av 609 utvecklare som anvÀnder AI i sin kodning. 78 % rapporterade en ökad produktivitet efter att ha anvÀnt AI, 60 % rapporterade en ökning av den totala kodkvaliteten tack vare AI och 20 % rapporterade en minskning av kodkvaliteten efter att ha anvÀnt AI. Samtidigt noterade 76 % att de inte anvÀnder AI-kod utan föregÄende manuell granskning. Artikeln noterar ocksÄ att enskilda utvecklare kÀnner sig betydligt bÀttre nÀr de anvÀnder AI, eftersom de kan tillhandahÄlla mer kod, men pÄ bekostnad av ökad arbetsbelastning för dem som ansvarar för att acceptera kod i projekt, granska Àndringar och kontrollera kvalitet.
KĂ€lla: opennet.ru
