Chatbotlar yaratish uchun asboblar to'plami bo'lgan OpenChatKit nashr etildi

Ixtisoslashgan va umumiy foydalanish uchun chatbotlarni yaratishni soddalashtirishga qaratilgan OpenChatKit ochiq manbali asboblar to'plami taqdim etilgan. Tizim savollarga javob berish, ko‘p bosqichli dialoglar o‘tkazish, umumlashtirish, ma’lumotlarni ajratib olish, matnni tasniflash kabi vazifalarni bajarishga moslashtirilgan. Kod Python-da yozilgan va Apache 2.0 litsenziyasi ostida tarqatiladi. Loyiha tayyor modelni, modelingizni o'rgatish uchun kodni, model natijalarini sinab ko'rish uchun yordamchi dasturlarni, modelni tashqi indeksdan kontekst bilan to'ldirish va o'z muammolaringizni hal qilish uchun asosiy modelni moslashtirish vositalarini o'z ichiga oladi.

Bot 20 milliardga yaqin parametrlarni qamrab oluvchi til modelidan foydalangan holda yaratilgan va so‘zlashuv muloqoti uchun optimallashtirilgan asosiy mashinani o‘rganish modeliga (GPT-NeoXT-Chat-Base-20B) asoslangan. Modelni o'qitish uchun LAION, Together va Ontocord.ai loyiha to'plamlaridan olingan ma'lumotlardan foydalanilgan.

Mavjud bilimlar bazasini kengaytirish uchun tashqi omborlar, API va boshqa manbalardan qo'shimcha ma'lumotlarni olish mumkin bo'lgan tizim taklif etiladi. Masalan, Vikipediya ma'lumotlari va yangiliklar tasmalari yordamida ma'lumotlarni yangilash mumkin. Nomaqbul savollarni filtrlash yoki munozaralarni muayyan mavzular bilan cheklash uchun 6 milliard parametr bo‘yicha o‘qitiladigan va GPT-JT modeliga asoslangan ixtiyoriy moderatsiya modeli mavjud.

ChatGPT-ga o'xshash aqlli yordamchilarni yaratish uchun kutubxonani taklif qiluvchi ChatLLaMA loyihasini alohida qayd etishimiz mumkin. Loyiha o'z uskunangizda ishlash va tor bilim sohalarini (masalan, tibbiyot, huquq, o'yinlar, ilmiy tadqiqotlar va boshqalar) qamrab olish uchun mo'ljallangan shaxsiylashtirilgan echimlarni yaratish imkoniyatini hisobga olgan holda ishlab chiqilmoqda. ChatLLaMA kodi GPLv3 ostida litsenziyalangan.

Loyiha Meta tomonidan taklif etilgan LLaMA (Large Language Model Meta AI) arxitekturasi asosidagi modellardan foydalanishni qo‘llab-quvvatlaydi. To'liq LLaMA modeli 65 milliard parametrni qamrab oladi, lekin ChatLLaMA uchun 7 va 13 milliard parametrli variantlardan yoki GPTJ (6 milliard), GPTNeoX (1.3 milliard), 20BOPT (13 milliard), BLOOM (7.1 milliard) va Galactica (6.7 milliard) modellari). Dastlab, LLaMA modellari faqat tadqiqotchilarga maxsus so‘rov bo‘yicha yetkazib berildi, biroq ma’lumotlarni yetkazib berish uchun torrentlardan foydalanilgani uchun ishqibozlar har kimga modelni yuklab olish imkonini beruvchi skript tayyorladilar.

Manba: opennet.ru

a Izoh qo'shish