1 million token kontekst oynasiga ega multimodal AI modeli DeepSeek-V4 aprel oyida chiqariladi.

DeepSeek o'tgan yilning yanvar oyida keng e'tirof etilgan sun'iy intellekt modeli DeepSeek-R1 ni chiqarganidan beri hech qanday katta yangilanishlar bo'lmadi. Yangi DeepSeek AI modeli haqidagi mish-mishlar vaqti-vaqti bilan internetda shov-shuvga sabab bo'ladi, ammo kelasi oyda avvalgi versiyasiga nisbatan sezilarli yaxshilanishlarga ega bo'lgan multimodal DeepSeek-V4 modeli chiqarilishi ehtimoli katta.

1 million token kontekst oynasiga ega multimodal AI modeli DeepSeek-V4 aprel oyida chiqariladi.

Manbaga ko'ra, so'nggi olti oy davomida hammuassis Liang Venfeng boshchiligidagi DeepSeek ishlab chiqish guruhi DeepSeekning vizual kontentni qayta ishlashdagi kamchiliklarini bartaraf etish va uning sun'iy intellekt qidiruv imkoniyatlarini yaxshilash ustida ish olib bormoqda. Kompaniya shuningdek, sun'iy intellekt modelining kod yaratish imkoniyatlarini oshirishga va kontekstual oynasini kengaytirishga intildi. Ushbu maqsadlarga erishish uchun DeepSeek o'tgan yili Baidu bilan hamkorlik qila boshladi.

Dunyo bo'ylab professional platformalar foydalanuvchilari DeepSeekning yangi versiyasining belgilarini aniqlash uchun tinimsiz harakat qilmoqdalar. Bir necha kun oldin, AI modellari uchun eng katta API agregatori bo'lgan OpenRouter’da Healer Alpha va Hunter Alpha algoritmlari chiqarildi. Healer Alpha - bu vizual va eshitish ma'lumotlarini idrok etish, o'zaro modal mulohaza yuritish va ko'p bosqichli vazifalarni yuqori aniqlikda bajarishga qodir multimodal til modeli. Algoritmning kontekst oynasi atigi 260 000 tokendan iborat. Hunter Alpha agentga asoslangan ilovalar uchun maxsus ishlab chiqilgan. U trillionlab parametrlarga va 1 million tokendan iborat kontekst oynasiga ega. Tavsifda algoritm uzoq muddatli rejalashtirish, murakkab mulohaza yuritish va ko'p bosqichli vazifalarni uzluksiz bajarishda yaxshi ekanligi aytilgan. U ko'rsatmalarga aniq amal qila oladi, bu sizga AI agentlarini yaratishga imkon beradigan OpenClaw kabi freymvorklar bilan ishlashda muhimdir.

1 million token kontekst oynasiga ega multimodal AI modeli DeepSeek-V4 aprel oyida chiqariladi.

Ushbu ikki til modeli chiqarilgandan so'ng, X ijtimoiy tarmog'ida DeepSeek-V4 ning yaqinda chiqarilishi haqidagi munozaralar yana bir bor avj oldi. Biroq, DeepSeek-V4 haqidagi avvalgi ommaviy e'lonlarga qaraganda, model o'nlab trillionlab parametrlarga, 1 million tokendan iborat kontekst oynasiga va multimodal ma'lumotlarni tushunish va yaratish, ya'ni matn, tasvirlar va videolarni qayta ishlash va yaratish qobiliyatiga ega. Bu shuni anglatadiki, yaqinda OpenRouterda chiqarilgan algoritmlarning xususiyatlari DeepSeek-V4 ning kutilgan parametrlariga to'liq mos kelmaydi.

Manbaga ko'ra, DeepSeekning keyingi versiyasini ishlab chiqish yo'nalishi til modellarining eng muhim xususiyatlaridan biri hisoblangan uzoq muddatli xotirani yaxshilashga qaratilgan. So'nggi olti oy ichida Liang Venfeng uchta tadqiqot ishining hammuallifligida, jumladan, til modellarining uzoq muddatli xotirasini kengaytirish imkoniyatlarini o'rganishga oid maqolalar ham bor.

Wenfeng va uning jamoasining tadqiqot natijalari texnologik evolyutsiyaning aniq yo'nalishini ham ko'rsatadi. DeepSeek-R1 da fikrlash uchun mustahkamlovchi o'rganish paradigmasini yaratgan holda, ishlab chiquvchilar asosiy arxitekturada keyingi yangiliklarni o'rganmoqdalar. Xususan, "shartli xotira" kabi yangi modullar orqali ular xotira va hisoblash quvvati nuqtai nazaridan an'anaviy arxitekturalar bilan bog'liq ma'lum muammolarni hal qilish orqali algoritmning ishlashini yaxshilashga harakat qilmoqdalar. Ushbu ish, shuningdek, DeepSeek-V4 ni ishga tushirish uchun texnologik tayyorgarlik vazifasini ham bajaradi. Bundan tashqari, yangi algoritm Xitoy AI tezlatgichlariga chuqur moslashtiriladi va "mahalliy hisoblash ekotizimi" doirasida to'liq ishlaydigan birinchi AI modeliga aylanishi mumkin.

Aprel oyida Xitoyning AI modellari bozorida sezilarli faollik kuzatilishi kutilmoqda. DeepSeekning yangi versiyasidan tashqari, Tencent 30 milliard parametrga ega yana bir AI modelini ham ishga tushirishi kutilmoqda.

Manba:


Manba: 3dnews.ru
DDoS himoyasi, VPS VDS serverlari bo'lgan saytlar uchun ishonchli hosting sotib oling 🔥 DDoS himoyasi, VPS VDS serverlari bilan ishonchli veb-sayt xostingini sotib oling | ProHoster