Frá því að DeepSeek gaf út hið vinsæla gervigreindarlíkan sitt, DeepSeek-R1, í janúar síðastliðnum hafa engar stórar uppfærslur verið gerðar. Sögusagnir um nýtt gervigreindarlíkan frá DeepSeek vekja stundum athygli á netinu, en það virðist líklegt að næsta mánuði komi fjölþátta líkanið DeepSeek-V4 út, sem mun innihalda verulegar úrbætur frá fyrri útgáfu.

Samkvæmt heimildinni hefur þróunarteymi DeepSeek, undir forystu Liang Wenfeng, meðstofnanda, unnið að því að bæta úr göllum DeepSeek í sjónrænni efnisvinnslu og bæta leitarmöguleika þess með gervigreind undanfarna sex mánuði. Fyrirtækið hefur einnig leitast við að bæta kóðaframleiðslugetu gervigreindarlíkansins og stækkað samhengisgluggann. Til að ná þessum markmiðum hóf DeepSeek samstarf við Baidu á síðasta ári.
Notendur faglegra verkvanga um allan heim eru að keppast við að finna merki um nýja útgáfu af DeepSeek. Fyrir nokkrum dögum voru reikniritin Healer Alpha og Hunter Alpha gefin út á OpenRouter, stærsta API-safnaranum fyrir gervigreindarlíkön. Healer Alpha er fjölþátta tungumálalíkan sem getur skynjað sjónrænar og hljóðrænar upplýsingar, framkvæmt rökhugsun á milli þátta og framkvæmt verkefni í mörgum skrefum með mikilli nákvæmni. Samhengisgluggi reikniritsins er aðeins 260 tákn. Hunter Alpha er hannað sérstaklega fyrir forrit sem byggja á umboðsmönnum. Það hefur trilljónir breytna og samhengisglugga upp á 1 milljón tákn. Í lýsingunni segir að reikniritið sé gott í langtímaáætlunum, flókinni rökhugsun og samfelldri framkvæmd verkefna í mörgum skrefum. Það getur fylgt leiðbeiningum nákvæmlega, sem er mikilvægt þegar unnið er með ramma eins og OpenClaw, sem gerir þér kleift að búa til gervigreindarumboðsmenn.

Eftir útgáfu þessara tveggja tungumálamódela hefur umræða á samfélagsmiðlinum X um yfirvofandi útgáfu DeepSeek-V4 aukist enn á ný. Hins vegar, miðað við fyrri opinberar tilkynningar um DeepSeek-V4, hefur líkanið tugi trilljóna af breytum, samhengisglugga með 1 milljón táknum og getu til að skilja og búa til fjölþætt gögn, þ.e. vinna úr og búa til texta, myndir og myndbönd. Þetta þýðir að eiginleikar reiknirita sem nýlega voru gefnir út á OpenRouter passa ekki að fullu við væntanlegar breytur DeepSeek-V4.
Samkvæmt heimildinni beinist þróun næstu útgáfu af DeepSeek að því að bæta langtímaminni, sem er talið einn mikilvægasti eiginleiki tungumálamódela. Á síðustu sex mánuðum hefur Liang Wenfeng verið meðhöfundur þriggja rannsóknargreina, þar á meðal þeirra sem tengjast könnun á möguleikum á að auka langtímaminni tungumálamódela.
Rannsóknarniðurstöður Wenfeng og teymis hans sýna einnig skýra þróunarferil tækninnar. Eftir að hafa komið á fót styrkingarnámslíkani fyrir rökfræði í DeepSeek-R1 eru forritararnir að kanna frekari nýjungar í undirliggjandi arkitektúr. Sérstaklega, með nýjum einingum eins og „skilyrtu minni“, eru þeir að reyna að bæta afköst reikniritsins með því að taka á þekktum vandamálum með hefðbundna arkitektúr hvað varðar minni og reikniafl. Þessi vinna þjónar einnig sem tæknilegur undirbúningur fyrir útgáfu DeepSeek-V4. Ennfremur verður nýja reikniritið aðlagað að kínverskum gervigreindarhröðlum og gæti orðið fyrsta gervigreindarlíkanið sem verður að fullu starfhæft innan „innlends tölvuvistkerfis“.
Búist er við mikilli virkni á kínverska markaðinum fyrir gervigreindarlíkön í apríl. Auk nýrrar útgáfu af DeepSeek er einnig búist við að Tencent muni kynna aðra gervigreindarlíkan með 30 milljörðum breytum.
Heimild:
Heimild: 3dnews.ru
