Megjelent az OpenChatKit, a chatbotok létrehozására szolgáló eszközkészlet

Bemutatjuk az OpenChatKit nyílt forráskódú eszközkészletet, amelynek célja a speciális és általános felhasználású chatbotok létrehozásának egyszerűsítése. A rendszer alkalmas olyan feladatok elvégzésére, mint a kérdések megválaszolása, többlépcsős párbeszédek lebonyolítása, összegzés, információk kinyerése és szövegek osztályozása. A kód Pythonban íródott, és az Apache 2.0 licenc alatt terjeszthető. A projekt tartalmaz egy kész modellt, kódot a modell betanításához, segédprogramokat a modell eredményeinek teszteléséhez, eszközöket a modell kiegészítéséhez egy külső indexből származó kontextussal és az alapmodell adaptálásával a saját problémák megoldására.

A bot egy alapvető gépi tanulási modellen (GPT-NeoXT-Chat-Base-20B) alapul, amelyet egy körülbelül 20 milliárd paramétert lefedő nyelvi modell segítségével építettek fel, és társalgási kommunikációra optimalizálták. A modell betanításához a LAION, a Together és az Ontocord.ai projektgyűjteményekből származó adatokat használtuk fel.

A meglévő tudásbázis bővítésére olyan rendszert javasolnak, amely további információkat tud lekérni külső adattárakból, API-kból és egyéb forrásokból. Lehetőség van például az információk frissítésére a Wikipédiából és a hírfolyamokból származó adatok segítségével. Opcionális moderációs modell áll rendelkezésre, amely 6 milliárd paraméterre van kiképezve, és a GPT-JT modellen alapul, hogy kiszűrje a nem megfelelő kérdéseket, vagy korlátozza a megbeszéléseket meghatározott témákra.

Külön megemlíthetjük a ChatLLaMA projektet, amely a ChatGPT-hez hasonló intelligens asszisztensek létrehozására kínál könyvtárat. A projekt kidolgozása során figyelembe veszik a saját felszerelésen való futtatás lehetőségét, és személyre szabott megoldások létrehozását, amelyek a tudás szűk területeire (például orvostudomány, jog, játékok, tudományos kutatás stb.) vonatkoznak. A ChatLLaMA kód a GPLv3 licenc alatt van.

A projekt támogatja a Meta által javasolt LLaMA (Large Language Model Meta AI) architektúrán alapuló modellek használatát. A teljes LLaMA modell 65 milliárd paramétert fed le, de a ChatLLaMA esetében 7 és 13 milliárd paraméteres opciók vagy a GPTJ (6 milliárd), GPTNeoX (1.3 milliárd), 20BOPT (13 milliárd), BLOOM (7.1 milliárd) ill. Galactica (6.7 milliárd) modellek). Kezdetben a LLaMA modelleket csak külön kérésre bocsátották a kutatók rendelkezésére, de mivel torrenteket használtak az adatok szállítására, a rajongók elkészítettek egy szkriptet, amely lehetővé tette a modell letöltését.

Forrás: opennet.ru

Hozzászólás