OpenChatKit, zana ya kuunda chatbots, imechapishwa

Zana ya programu huria ya OpenChatKit imewasilishwa, inayolenga kurahisisha uundaji wa chatbots kwa matumizi maalum na ya jumla. Mfumo huu umebadilishwa ili kufanya kazi kama vile kujibu maswali, kufanya mazungumzo ya hatua nyingi, muhtasari, kutoa habari, na kuainisha maandishi. Nambari hiyo imeandikwa kwa Python na kusambazwa chini ya leseni ya Apache 2.0. Mradi unajumuisha kielelezo kilichotengenezwa tayari, msimbo wa kufunza kielelezo chako, huduma za kupima matokeo ya modeli, zana za kuongezea modeli na muktadha kutoka faharasa ya nje na kurekebisha muundo msingi ili kutatua matatizo yako mwenyewe.

Kijibu hiki kinatokana na muundo msingi wa kujifunza kwa mashine (GPT-NeoXT-Chat-Base-20B), iliyoundwa kwa kutumia muundo wa lugha unaojumuisha takribani vigezo bilioni 20 na kuboreshwa kwa mawasiliano ya mazungumzo. Ili kutoa mafunzo kwa modeli, data iliyopatikana kutoka kwa makusanyo ya mradi wa LAION, Pamoja na Ontocord.ai ilitumiwa.

Ili kupanua msingi wa maarifa uliopo, mfumo unapendekezwa ambao unaweza kupata maelezo ya ziada kutoka kwa hazina za nje, API na vyanzo vingine. Kwa mfano, inawezekana kusasisha taarifa kwa kutumia data kutoka Wikipedia na mipasho ya habari. Muundo wa hiari wa udhibiti unapatikana, umefunzwa kwa vigezo bilioni 6 na kulingana na muundo wa GPT-JT, ili kuchuja maswali yasiyofaa au kudhibiti mijadala kwa mada mahususi.

Kando, tunaweza kutaja mradi wa ChatLLaMA, ambao hutoa maktaba ya kuunda wasaidizi mahiri sawa na ChatGPT. Mradi unaendelezwa kwa jicho la uwezekano wa kukimbia kwenye vifaa vyako mwenyewe na kuunda ufumbuzi wa kibinafsi iliyoundwa ili kufikia maeneo finyu ya ujuzi (kwa mfano, dawa, sheria, michezo, utafiti wa kisayansi, nk). Msimbo wa ChatLLaMA umepewa leseni chini ya GPLv3.

Mradi huu unasaidia utumizi wa miundo kulingana na usanifu wa LLaMA (Lugha Kubwa Meta AI) uliopendekezwa na Meta. Mfano kamili wa LLaMA unashughulikia vigezo bilioni 65, lakini kwa ChatLLaMA inashauriwa kutumia chaguzi zilizo na vigezo bilioni 7 na 13 au GPTJ (bilioni 6), GPTNeoX (bilioni 1.3), 20BOPT (bilioni 13), BLOOM (bilioni 7.1) na Galactica (bilioni 6.7) mifano ). Hapo awali, mifano ya LLaMA ilitolewa kwa watafiti tu kwa ombi maalum, lakini kwa kuwa mito ilitumiwa kutoa data, wapendaji walitayarisha hati ambayo iliruhusu mtu yeyote kupakua mfano huo.

Chanzo: opennet.ru

Kuongeza maoni