گوگل هڪ اهم اپڊيٽ جاري ڪئي آهي. جيمنائي 3 گهرو سوچ - هڪ پليٽ فارم جيڪو استدلال جي مصنوعي ذهانت تي ٻڌل آهي، جيڪو سائنس ۽ انجنيئرنگ جي شعبن ۾ موجوده مسئلن کي حل ڪرڻ لاءِ ٺهيل آهي.

گوگل جيمنائي 3 جو نئون نسخو، ڊيپ ٿنڪ، سائنسدانن جي تعاون سان تيار ڪيو ويو آهي. هي سروس پيچيده تحقيقي مسئلن کي حل ڪرڻ لاءِ ٺهيل آهي جن جا پهلو واضح رڪاوٽون يا هڪ صحيح حل جي کوٽ ٿي سگهن ٿا، ۽ جن جو لاڳاپيل ڊيٽا نامڪمل يا غير منظم ٿي سگهي ٿو. اپڊيٽ ٿيل ڊيپ ٿنڪ پليٽ فارم تجريدي نظريي کان اڳتي وڌڻ ۽ عملي استعمال جي دائري ۾ وڃڻ جي ڪوشش آهي. نئون موڊ سڌو سنئون جيمنائي ايپ ۾ موجود آهي، پر صرف گوگل اي آءِ الٽرا سبسڪرائبرز لاءِ موجود آهي. ڪمپني پهريون ڀيرو جيمنائي API ذريعي سروس تائين رسائي پڻ کوليندي - انجنيئرن، محققن ۽ ڪاروبارن کي درخواست جمع ڪرائڻ جي ضرورت پوندي.
هيومنٽي جي آخري امتحان ۾، گوگل جيمنائي 3 ڊيپ ٿنڪ پليٽ فارم ٽئين پارٽي ٽولز استعمال ڪرڻ کان سواءِ 48,4٪ اسڪور ڪيو؛ ARC-AGI-2 بينچ مارڪ ۾، ان بي مثال 84,6٪ حاصل ڪيو. ڪوڊفورسس پروگرامنگ ٽيسٽ ۾، سسٽم 3455 جي ELO ريٽنگ حاصل ڪئي؛ 2025 جي انٽرنيشنل ميٿميٽيڪل اولمپياڊ مسئلن ۾، سسٽم گولڊ ميڊل ليول حاصل ڪيو، انهي سان گڏ ڪيمسٽري ۽ فزڪس اولمپياڊ مسئلن ۾ گولڊ ميڊل جا نتيجا حاصل ڪيا. CMT-بينچ مارڪ ۾، گوگل جيمنائي 3 ڊيپ ٿنڪ موڊ 50,5٪ جي اسڪور سان، نظرياتي فزڪس ۾ اعليٰ سطح جي مهارت جو مظاهرو ڪيو.

جيمينائي 3 ڊيپ ٿنڪ ماڊل هڪ اي آءِ ايجنٽ جو بنياد بڻيو جنهن کي گوگل ڊيپ مائنڊ نالو ڏنو. ايليٽياان ۾ تجويز ڪيل حلن ۾ خامين جي سڃاڻپ لاءِ قدرتي ٻولي ۾ پيش ڪيل مفروضن جي جانچ لاءِ هڪ اوزار شامل آهي؛ ٻيهر حل پيدا ڪرڻ ۽ سڌارو مهيا ڪيو ويو آهي. اهم طور تي، ايجنٽ هڪ سوال جو جواب ڏيڻ جي پنهنجي ناڪامي کي تسليم ڪري سگهي ٿو. پيچيده تحقيق کي سنڀالڻ لاءِ، اهو گوگل سرچ ۽ ويب نيويگيشن ٽولز استعمال ڪري ٿو - شايع ٿيل ادب جا خلاصا تيار ڪرڻ وقت، اهو غير موجود حوالن کي پيدا ڪرڻ کان پاسو ڪري ٿو ۽ ڪمپيوٽيشنل غلطين کان بچڻ جي ڪوشش ڪري ٿو.
گوگل ڊولپرز اليٿيا جي حقيقي ۽ امڪاني ڪاميابين کي پنجن درجن ۾ ورهايو. تقريبن خودمختيار موڊ ۾، AI ايجنٽ رياضي دان پال اردس پاران پيش ڪيل ٽن کليل مسئلن جي حلن جو نقشو ٺاهيو - هن تحقيق کي سطح 0 تي درجه بندي ڪيو ويو، "معمولي نوانيت" جي مطابق. ساڳئي موڊ ۾، ان ساڳئي سيٽ مان ٻئي مسئلي جو حل پيش ڪيو، سطح 1 حاصل ڪرڻ، يا "گهٽ ۾ گهٽ نوانيت". سطح 2 تي، "اشاعت جي قابل،" اليٿيا خودمختيار موڊ، انساني تعاون موڊ، ۽ معاون اوزار موڊ ۾ نتيجا ڏيکاريا. AI ايجنٽ اڃا تائين سطح 3 ("اهم پيش رفت") ۽ 4 ("زميندار پيش رفت") حاصل نه ڪيو آهي.
پنهنجي ڊولپرز جي درخواست تي، اليٿيا 700 غير حل ٿيل ايردوس رياضي مسئلن جو تجزيو ڪيو ۽ انهن مان 13 کي حل ڪيو. تاهم، انهن مان نو ۾ اڳ ۾ موجود حل هئا، جڏهن ته صرف چار اصل ۾ پهريون ڀيرو حل ٿيل نظر آيا. وڌيڪ، AI پاران پيدا ڪيل 212 حلن مان، صرف 6,5٪ "خاص طور تي صحيح" هئا. باقي يا ته بنيادي خاميون هيون (68,5٪) يا اصل مسئلن جا حل ٿيل نسخا جيڪي ايجنٽ غلط تشريح ڪئي هئي (31,5٪).
نتيجي طور، ڊولپرز ان ڳالهه تي متفق ٿيا ته انهن جي AI "سوالن کي غلط سمجهڻ جي رجحان کي اهڙي طريقي سان ظاهر ڪري ٿي جيڪا انهن کي جواب ڏيڻ آسان بڻائي ٿي" ۽ "انسانن جي مقابلي ۾ انتهائي غلطي جو شڪار" رهي ٿي. ٻين لفظن ۾، AI اڃا تائين رياضي دانن جي جاءِ نٿو وٺي سگهي.
ذريعن:
جو ذريعو: 3dnews.ru
