OpenChatKit, zana ya kuunda chatbots, imechapishwa

OpenChatKit, zana huria ya zana iliyoundwa ili kurahisisha uundaji wa chatbots kwa programu maalum na madhumuni ya jumla, inawasilishwa. Mfumo huu umebadilishwa kwa ajili ya kazi kama vile kujibu maswali, kufanya mazungumzo ya hatua nyingi, muhtasari, kutoa taarifa, na kuainisha maandishi. Nambari hiyo imeandikwa kwa Python na kusambazwa chini ya leseni ya Apache 2.0. Mradi huu unajumuisha kielelezo kilichotengenezwa tayari, msimbo wa kufunza kielelezo chako mwenyewe, huduma za kupima utendakazi wa kielelezo, zana za kuongeza kielelezo na muktadha kutoka faharasa ya nje, na kurekebisha muundo msingi ili kutatua matatizo mahususi.

Kijibu hiki kinatokana na muundo wa msingi wa kujifunza kwa mashine (GPT-NeoXT-Chat-Base-20B), iliyoundwa kwa kutumia muundo wa lugha unaojumuisha takriban vigezo bilioni 20 na kuboreshwa kwa mawasiliano ya mazungumzo. Data kutoka kwa miradi ya LAION, Pamoja, na Ontocord.ai ilitumiwa kutoa mafunzo kwa modeli.

Ili kupanua msingi uliopo wa maarifa, mfumo unapendekezwa ambao unaweza kutoa maelezo ya ziada kutoka kwa hazina za nje, API na vyanzo vingine. Kwa mfano, habari inaweza kusasishwa kwa kutumia data kutoka Wikipedia na mipasho ya habari. Muundo wa ukadiriaji, uliofunzwa kwa kutumia vigezo bilioni 6 na kulingana na muundo wa GPT-JT, unapatikana pia, iliyoundwa ili kuchuja maswali yasiyofaa au kudhibiti mijadala kwa mada mahususi.

Cha muhimu zaidi ni mradi wa ChatLLaMA, ambao hutoa maktaba ya kuunda wasaidizi mahiri sawa na ChatGPT. Mradi huu unatayarishwa kwa lengo la kutumia maunzi maalum na kuunda suluhu za kibinafsi zilizoundwa kushughulikia maeneo mahususi ya utaalam (k.m., dawa, sheria, michezo ya kubahatisha, utafiti wa kisayansi, n.k.). Msimbo wa ChatLLaMA umepewa leseni chini ya leseni ya GPLv3.

Mradi huu unasaidia utumizi wa miundo kulingana na usanifu wa LLaMA (Lugha Kubwa Meta AI) uliopendekezwa na Meta. Muundo kamili wa LLaMA unashughulikia vigezo bilioni 65, lakini kwa ChatLLaMA, chaguzi zinazopendekezwa ni lahaja za vigezo vya 7- na 13-bilioni, au GPTJ (bilioni 6), GPTNeoX (bilioni 1.3), 20BOPT (bilioni 13), BLOOM (bilioni 7.1), na mifano ya Galactica (bilioni 6.7). Hapo awali, mifano ya LLaMA ilipatikana tu kwa watafiti kwa ombi maalum, lakini kwa kuwa mito ilitumiwa kwa uwasilishaji wa data, wapendaji wametayarisha hati inayomruhusu mtu yeyote kupakua muundo huo.

Chanzo: opennet.ru

Kuongeza maoni