Google zbuloi Gemini 3 Deep Think, një inteligjencë artificiale të fuqishme për shkencën që ende i përshtat problemet me përgjigjen.

Google ka publikuar një përditësim të rëndësishëm. Binjakët 3 Mendim i Thellë — një platformë e bazuar në inteligjencën artificiale të arsyetimit, e projektuar për të zgjidhur problemet aktuale në fushat e shkencës dhe inxhinierisë.

Google zbuloi Gemini 3 Deep Think, një inteligjencë artificiale të fuqishme për shkencën që ende i përshtat problemet me përgjigjen.

Versioni i ri i Google Gemini 3, Deep Think, u zhvillua në bashkëpunim me shkencëtarë. Shërbimi është projektuar për të zgjidhur probleme komplekse kërkimore, aspekteve të të cilave mund t'u mungojnë kufizime të qarta ose një zgjidhje e vetme e saktë, dhe të dhënat e shoqëruara të të cilave mund të jenë të paplota ose josistematike. Platforma e përditësuar Deep Think është një përpjekje për të kaluar përtej teorisë abstrakte dhe për të hyrë në sferën e zbatimit praktik. Modaliteti i ri është i disponueshëm direkt në aplikacionin Gemini, por është i disponueshëm vetëm për abonentët e Google AI Ultra. Kompania gjithashtu do të hapë aksesin në shërbim për herë të parë përmes Gemini API - inxhinierët, studiuesit dhe bizneset do të duhet të paraqesin një kërkesë.

Në Provimin e Fundit të Njerëzimit, platforma Google Gemini 3 Deep Think shënoi 48,4% pa përdorur mjete të palëve të treta; në testin ARC-AGI-2, arriti një rezultat të paprecedentë prej 84,6%. Në testin e programimit Codeforces, sistemi arriti një vlerësim ELO prej 3455; në problemet e Olimpiadës Ndërkombëtare të Matematikës 2025, sistemi arriti nivelin e medaljes së artë, si dhe rezultate të medaljes së artë në problemet e olimpiadave të kimisë dhe fizikës. Në CMT-Benchmark, modaliteti Google Gemini 3 Deep Think demonstroi një nivel të lartë aftësie në fizikën teorike, me një rezultat prej 50,5%.

Google zbuloi Gemini 3 Deep Think, një inteligjencë artificiale të fuqishme për shkencën që ende i përshtat problemet me përgjigjen.

Modeli Gemini 3 Deep Think formoi bazën e një agjenti të inteligjencës artificiale që Google DeepMind e quajti AletheiaPërfshin një mjet për testimin e hipotezave të paraqitura në gjuhë natyrore për të identifikuar të metat në zgjidhjet e propozuara; ofrohet gjenerim dhe përsosje iterative e zgjidhjeve. Është e rëndësishme të theksohet se agjenti mund të pranojë pamundësinë e tij për t'iu përgjigjur një pyetjeje. Për të trajtuar kërkime komplekse, ai përdor mjetet e kërkimit në Google dhe navigimit në internet - kur përgatit përmbledhje të literaturës së botuar, shmang gjenerimin e citimeve që nuk ekzistojnë dhe përpiqet të shmangë pasaktësitë llogaritëse.

Zhvilluesit e Google i kategorizuan arritjet aktuale dhe të mundshme të Aletheia-s në pesë nivele. Në një mënyrë pothuajse autonome, agjenti i IA-së hartëzoi zgjidhje për tre probleme me fund të hapur të paraqitura nga matematikani Pál Erdős - ky hulumtim u vlerësua në nivelin 0, që korrespondon me "risi të vogël". Në të njëjtën mënyrë, ai propozoi një zgjidhje për një problem tjetër nga i njëjti grup, duke arritur nivelin 1, ose "risi minimale". Në nivelin 2, "i publikueshëm", Aletheia demonstroi rezultate në mënyrën autonome, mënyrën e bashkëpunimit njerëzor dhe mënyrën e mjeteve ndihmëse. Agjenti i IA-së nuk ka arritur ende nivelet 3 ("zbulim i rëndësishëm") dhe 4 ("zbulim i rëndësishëm").

Me kërkesë të zhvilluesve të saj, Aletheia analizoi 700 probleme matematikore të pazgjidhura të Erdős dhe zgjidhi 13 prej tyre. Megjithatë, nëntë prej tyre kishin zgjidhje paraprake, ndërsa vetëm katër dukeshin se ishin zgjidhur për herë të parë. Për më tepër, nga 212 zgjidhjet e gjeneruara nga IA, vetëm 6,5% ishin "në thelb të sakta". Pjesa tjetër ose kishte të meta themelore (68,5%) ose versione të zgjidhura të problemeve origjinale që agjenti i kishte keqinterpretuar (31,5%).

Si rezultat, zhvilluesit ranë dakord që inteligjenca artificiale e tyre shfaq një "prirje për të keqkuptuar pyetjet në mënyra që i bëjnë ato më të lehta për t'u përgjigjur" dhe mbetet "jashtëzakonisht e prirur ndaj gabimeve krahasuar me njerëzit". Me fjalë të tjera, inteligjenca artificiale nuk mund t'i zëvendësojë ende matematikanët.

Burimet:


Burimi: 3dnews.ru
Bleni një host të besueshëm për faqet me mbrojtje DDoS, serverë VPS VDS 🔥 Bleni hosting të besueshëm të faqeve të internetit me mbrojtje DDoS, servera VPS VDS | ProHoster