Google kynnti Gemini 3 Deep Think, öfluga gervigreind fyrir vísindi sem aðlagar enn vandamál að svarinu.

Google hefur gefið út stóra uppfærslu. Gemini 3 Djúp hugsun — vettvangur byggður á gervigreind, hannaður til að leysa núverandi vandamál á sviði vísinda og verkfræði.

Google kynnti Gemini 3 Deep Think, öfluga gervigreind fyrir vísindi sem aðlagar enn vandamál að svarinu.

Nýja útgáfan af Google Gemini 3, Deep Think, var þróuð í samstarfi við vísindamenn. Þjónustan er hönnuð til að leysa flókin rannsóknarvandamál þar sem þættir þeirra kunna að skortir skýrar skorður eða eina rétta lausn, og þar sem tengd gögn geta verið ófullkomin eða ókerfisbundin. Uppfærða Deep Think kerfið er tilraun til að fara út fyrir abstrakt kenningar og inn á svið hagnýtrar notkunar. Nýja stillingin er í boði beint í Gemini appinu, en er aðeins í boði fyrir áskrifendur að Google AI Ultra. Fyrirtækið mun einnig opna aðgang að þjónustunni í fyrsta skipti í gegnum Gemini API - verkfræðingar, vísindamenn og fyrirtæki þurfa að senda inn beiðni.

Í síðasta prófi mannkynsins fékk Google Gemini 3 Deep Think kerfið 48,4% einkunn án þess að nota verkfæri frá þriðja aðila; í ARC-AGI-2 viðmiðunarprófinu náði það fordæmalausu 84,6%. Í Codeforces forritunarprófinu náði kerfið ELO einkunn upp á 3455; í dæmum Alþjóðlegu stærðfræðiólympíuleikanna 2025 náði kerfið gullverðlaunastigi, sem og gullverðlaunastöðum í efnafræði- og eðlisfræðiólympíudæmum. Í CMT-viðmiðunarprófinu sýndi Google Gemini 3 Deep Think stillingin fram á mikla færni í kennilegri eðlisfræði með einkunn upp á 50,5%.

Google kynnti Gemini 3 Deep Think, öfluga gervigreind fyrir vísindi sem aðlagar enn vandamál að svarinu.

Gemini 3 Deep Think líkanið var grunnurinn að gervigreindarforriti sem Google nefndi DeepMind. AletheiaÞað inniheldur tól til að prófa tilgátur sem settar eru fram á náttúrulegu máli til að bera kennsl á galla í lausnum sem lagðar eru til; endurtekin lausnaframleiðsla og fínpússun er í boði. Mikilvægt er að umboðsmaðurinn getur viðurkennt vanhæfni sína til að svara fyrirspurn. Til að takast á við flóknar rannsóknir notar hann Google leit og vefleiðsögnartól - þegar hann útbýr samantektir á birtum ritum forðast hann að búa til ónákvæmar tilvitnanir og leitast við að forðast ónákvæmni í útreikningum.

Forritarar Google flokkuðu raunverulegan og hugsanlegan árangur Aletheia í fimm stig. Í nánast sjálfvirkum ham kortlagði gervigreindarforritið lausnir á þremur opnum vandamálum sem stærðfræðingurinn Pál Erdős setti fram - þessi rannsókn var metin á stigi 0, sem samsvarar „lítil nýjung“. Í sama ham lagði það til lausn á öðru vandamáli úr sama mengi og náði stigi 1, eða „lágmarks nýjung“. Á stigi 2, „birtingarhæft“, sýndi Aletheia fram á niðurstöður í sjálfvirkum ham, samvinnuham manna og hjálpartólham. Gervigreindarforritið hefur ekki enn náð stigum 3 („mikilvæg bylting“) og 4 („árangursrík bylting“).

Að beiðni forritara sinna greindi Aletheia 700 óleyst stærðfræðidæmi eftir Erdős og leysti 13 þeirra. Hins vegar höfðu níu þeirra fyrirliggjandi lausnir, en aðeins fjögur virtust hafa verið leyst í fyrsta skipti. Ennfremur, af þeim 212 lausnum sem gervigreindin bjó til, voru aðeins 6,5% „í meginatriðum réttar“. Hinar höfðu annað hvort grundvallargalla (68,5%) eða leystu útgáfur af upprunalegu vandamálunum sem umboðsmaðurinn hafði misskilið (31,5%).

Þar af leiðandi voru forritararnir sammála um að gervigreind þeirra sýni „tilhneigingu til að misskilja spurningar á þann hátt að þær séu auðveldari að svara“ og sé „mjög villugjarnari en í mönnum.“ Með öðrum orðum getur gervigreind ekki enn komið í stað stærðfræðinga.

Heimildir:


Heimild: 3dnews.ru
Kauptu áreiðanlega hýsingu fyrir síður með DDoS vernd, VPS VDS netþjónum 🔥 Kauptu áreiðanlega vefhýsingu með DDoS vörn, VPS VDS netþjónum | ProHoster