Prezantohet OpenChatKit, një set mjetesh me burim të hapur i projektuar për të thjeshtuar krijimin e chatbot-eve për aplikacione të specializuara dhe me qëllim të përgjithshëm. Sistemi është përshtatur për detyra të tilla si përgjigjja e pyetjeve, kryerja e dialogëve me shumë hapa, përmbledhja, nxjerrja e informacionit dhe klasifikimi i tekstit. Kodi është shkruar në Python dhe shpërndahet sipas licencës Apache 2.0. Projekti përfshin një model të gatshëm, kod për trajnimin e modelit tuaj, shërbime për testimin e performancës së modelit, mjete për plotësimin e modelit me kontekst nga një indeks i jashtëm dhe përshtatjen e modelit bazë për të zgjidhur probleme specifike.
Boti bazohet në një model bazë të të mësuarit automatik (GPT-NeoXT-Chat-Base-20B), i ndërtuar duke përdorur një model gjuhësor që përfshin afërsisht 20 miliardë parametra dhe është i optimizuar për komunikim bisedor. Të dhënat nga projektet LAION, Together dhe Ontocord.ai u përdorën për të trajnuar modelin.
Për të zgjeruar bazën ekzistuese të njohurive, propozohet një sistem që mund të nxjerrë informacione shtesë nga depot e jashtme, API-të dhe burime të tjera. Për shembull, informacioni mund të përditësohet duke përdorur të dhëna nga Wikipedia dhe burimet e lajmeve. Një model moderimi, i trajnuar duke përdorur 6 miliardë parametra dhe i bazuar në modelin GPT-JT, është gjithashtu i disponueshëm, i projektuar për të filtruar pyetje të papërshtatshme ose për të kufizuar diskutimet në tema specifike.
Vlen të përmendet veçanërisht projekti ChatLLaMA, i cili ofron një bibliotekë për krijimin e asistentëve inteligjentë të ngjashëm me ChatGPT. Projekti po zhvillohet me synimin për të funksionuar në pajisje të personalizuara dhe për të krijuar zgjidhje të personalizuara të dizajnuara për të mbuluar fusha specifike të ekspertizës (p.sh., mjekësi, drejtësi, lojëra, kërkim shkencor, etj.). Kodi i ChatLLaMA është i licencuar sipas licencës GPLv3.
Projekti mbështet përdorimin e modeleve të bazuara në arkitekturën LLaMA (Large Language Model Meta AI) të propozuar nga Meta. Modeli i plotë LLaMA mbulon 65 miliardë parametra, por për ChatLLaMA, opsionet e rekomanduara janë variantet me 7 dhe 13 miliardë parametra, ose modelet GPTJ (6 miliardë), GPTNeoX (1.3 miliardë), 20BOPT (13 miliardë), BLOOM (7.1 miliardë) dhe Galactica (6.7 miliardë). Fillimisht, modelet LLaMA ishin të disponueshme për studiuesit vetëm me kërkesë të veçantë, por meqenëse torrentët u përdorën për shpërndarjen e të dhënave, entuziastët kanë përgatitur një skript që i lejon kujtdo ta shkarkojë modelin.
Burimi: opennet.ru
