OpenChatKit, qalab loogu talagalay abuurista chatbots, ayaa la daabacay

Xirmada isha furan ee OpenChatKit waa la soo bandhigay, ujeedaduna tahay in la fududeeyo abuurista chatbots ee isticmaalka gaarka ah iyo guud ahaan. Nidaamku waxa loo habeeyey si uu u qabto hawlo ay ka mid yihiin ka jawaabista su'aalaha, qabashada wada-hadallada marxaladaha badan, soo koobidda, soo saarista macluumaadka, iyo kala saaridda qoraalka. Nambarku wuxuu ku qoran yahay Python waxaana lagu qaybiyaa shatiga Apache 2.0. Mashruucu waxa ku jira qaab diyaarsan, koodh lagu tababbaro qaabkaaga, agabka lagu tijaabiyo natiijada tusaalaha, agabka lagu kabo tusaalaha macnaha guud ee tusmada dibadda iyo la qabsiga qaabka saldhiga si aad u xalliso dhibaatooyinkaaga.

Botku wuxuu ku salaysan yahay qaabka barashada mashiinka aasaasiga ah (GPT-NeoXT-Chat-Base-20B), oo la dhisay iyadoo la adeegsanayo qaab luqadeed oo daboolaya qiyaastii 20 bilyan oo loo hagaajiyay isgaarsiinta wada hadalka. Si loo tababaro qaabka, xogta laga helay ururinta mashruuca LAION, Together iyo Ontocord.ai ayaa la isticmaalay.

Si loo balaadhiyo saldhigga aqoonta ee jira, waxaa la soo jeediyay nidaam ka soo saari kara macluumaad dheeraad ah kaydka dibadda, API-yada iyo ilo kale. Tusaale ahaan, waa suurtagal in la cusboonaysiiyo macluumaadka iyadoo la adeegsanayo xogta Wikipedia iyo quudinta wararka. Qaab dhexdhexaadin ikhtiyaari ah ayaa diyaar ah, oo lagu tababaray 6 bilyan oo cabbir kuna salaysan qaabka GPT-JT, si loo shaandheeyo su'aalaha aan habboonayn ama lagu xaddido dooda mawduucyo gaar ah.

Si gooni ah, waxaan u xusi karnaa mashruuca ChatLLaMA, kaas oo bixisa maktabad loogu talagalay abuurista caawiyeyaal caqli badan oo la mid ah ChatGPT. Mashruuca waxaa lagu horumarinayaa iyadoo isha lagu hayo suurtagalnimada in aad ku shaqeyso qalabkaaga iyo abuurista xalal shakhsi ahaaneed oo loogu talagalay in lagu daboolo meelaha cidhiidhiga ah ee aqoonta (tusaale, daawada, sharciga, ciyaaraha, cilmi-baarista sayniska, iwm.). Koodhka ChatLLaMA waxa uu shati ku leeyahay hoos GPLv3.

Mashruucu waxa uu taageerayaa isticmaalka moodooyinka ku salaysan LLMA (Model Large Language Model Meta AI) oo ay soo jeedisay Meta. Qaabka LLama oo buuxa waxa uu daboolayaa 65 bilyan oo xuduudo ah, laakiin ChatLLaMA waxa lagu talinayaa in la isticmaalo ikhtiyaarrada leh 7 iyo 13 bilyan oo cabbir ama GPTJ (6 bilyan), GPTNeoX (1.3 bilyan), 20BOPT (13 bilyan), BLOOM (7.1 bilyan) iyo Galactica (6.7 bilyan) moodooyinka . Markii hore, moodooyinka LLAMA waxaa la siiyay kaliya cilmi-baarayaasha codsi gaar ah, laakiin maadaama durdurrada loo adeegsaday bixinta xogta, xamaasadu waxay diyaariyeen qoraal u oggolaanaya qof kasta inuu soo dejiyo moodalka.

Source: opennet.ru

Add a comment