Çatbotlar yaratmaq üçün alətlər dəsti olan OpenChatKit nəşr olundu

Xüsusi və ümumi tətbiqlər üçün chatbotların yaradılmasını sadələşdirməyə yönəlmiş OpenChatKit açıq alətlər dəsti təqdim olunur. Sistem suallara cavab vermək, çoxmərhələli dialoqlar aparmaq, ümumiləşdirmək, məlumat çıxarmaq, mətni təsnif etmək kimi vəzifələri yerinə yetirmək üçün uyğunlaşdırılıb. Kod Python-da yazılmışdır və Apache 2.0 lisenziyası altında paylanmışdır. Layihəyə hazır model, modelinizi öyrətmək üçün kod, modelin nəticələrini yoxlamaq üçün yardım proqramları, xarici indeksdən kontekstlə modeli əlavə etmək və öz problemlərinizi həll etmək üçün baza modeli uyğunlaşdırmaq üçün alətlər daxildir.

Bot təxminən 20 milyard parametri əhatə edən dil modelindən istifadə etməklə qurulmuş və danışıq ünsiyyəti üçün optimallaşdırılmış əsas maşın öyrənmə modelinə (GPT-NeoXT-Chat-Base-20B) əsaslanır. Model LAION, Together və Ontocord.ai layihələrinin kolleksiyalarından əldə edilən məlumatlardan istifadə etməklə öyrədilib.

Mövcud bilik bazasını genişləndirmək üçün xarici repozitoriyalardan, API-lərdən və digər mənbələrdən əlavə məlumat çıxarmağa qadir olan sistem təklif olunur. Məsələn, Vikipediya məlumatlarından və xəbər lentlərindən istifadə etməklə məlumatları yeniləmək mümkündür. Əlavə olaraq, GPT-JT modelinə əsaslanan 6 milyard parametrlə öyrədilmiş və uyğun olmayan sualları filtrləmək və ya müzakirələri müəyyən mövzularla məhdudlaşdırmaq üçün nəzərdə tutulmuş moderasiya modeli mövcuddur.

ChatGPT-yə bənzər ağıllı köməkçilər yaratmaq üçün kitabxana təklif edən ChatLLaMA layihəsini ayrıca qeyd edə bilərik. Layihə öz avadanlığı ilə işləmək və dar bilik sahələrini (məsələn, tibb, hüquq, oyunlar, elmi tədqiqatlar və s.) əhatə etmək üçün hazırlanmış fərdi həllər yaratmaq imkanlarını nəzərə alaraq inkişaf edir. ChatLLaMA kodu GPLv3 altında lisenziyalaşdırılıb.

Layihə Meta tərəfindən təklif olunan LLaMA (Large Language Model Meta AI) arxitekturasına əsaslanan modellərin istifadəsini dəstəkləyir. Tam LLaMA modeli 65 milyard parametri əhatə edir, lakin ChatLLaMA üçün 7 və 13 milyard parametrli variantlardan və ya GPTJ (6 milyard), GPTNeoX (1.3 milyard), 20BOPT (13 milyard), BLOOM (7.1 milyard) variantlarından istifadə etmək tövsiyə olunur. və Galactica (6.7 milyard) modelləri). Əvvəlcə LLaMA modelləri yalnız xüsusi sorğu əsasında tədqiqatçılara verilir, lakin məlumatların çatdırılması üçün torrentlərdən istifadə edildiyi üçün həvəskarlar modeli hər kəsə yükləmək imkanı verən skript hazırlayıblar.

Mənbə: opennet.ru

Добавить комментарий