OpenChatKit-г хэвлүүлсэн, чатбот бүтээх хэрэгсэл

OpenChatKit нээлттэй эхийн хэрэглүүрийг танилцуулж байна, энэ нь тусгай болон ерөнхий хэрэглээнд зориулсан чатбот үүсгэх ажлыг хялбарчлахад чиглэгддэг. Асуултанд хариулах, олон үе шаттай харилцан яриа өрнүүлэх, нэгтгэн дүгнэх, мэдээлэл задлах, текстийг ангилах зэрэг ажлуудыг гүйцэтгэхэд уг систем зохицсон. Код нь Python дээр бичигдсэн бөгөөд Apache 2.0 лицензийн дагуу түгээгддэг. Төсөлд бэлэн загвар, загвараа сургах код, загварын үр дүнг турших хэрэгслүүд, гадаад индексийн контекстээр загвар нэмэх, өөрийн асуудлыг шийдвэрлэх үндсэн загварыг тохируулах хэрэгслүүд орно.

Энэхүү робот нь 20 тэрбум орчим параметрийг хамарсан хэлний загвар ашиглан бүтээгдсэн, харилцан ярианы харилцаанд оновчтой болгосон үндсэн машин сургалтын загвар (GPT-NeoXT-Chat-Base-20B) дээр суурилдаг. Загварыг сургахын тулд LAION, Together, Ontocord.ai төслийн цуглуулгаас авсан өгөгдлийг ашигласан.

Одоо байгаа мэдлэгийн баазыг өргөжүүлэхийн тулд гадаад хадгалах газар, API болон бусад эх сурвалжаас нэмэлт мэдээлэл авах боломжтой системийг санал болгож байна. Жишээлбэл, Википедиа болон мэдээний мэдээллийн сувгийн өгөгдлийг ашиглан мэдээллийг шинэчлэх боломжтой. Зохисгүй асуултуудыг шүүж эсвэл тодорхой сэдвүүдээр хэлэлцүүлгийг хязгаарлахын тулд 6 тэрбум параметр дээр бэлтгэгдсэн, GPT-JT загварт суурилсан нэмэлт зохицуулалтын загвар байдаг.

ChatGPT-тэй төстэй ухаалаг туслахуудыг бий болгох номын санг санал болгодог ChatLLaMA төслийг тусад нь дурдаж болно. Төслийг өөрийн төхөөрөмж дээр ажиллуулж, нарийн мэдлэгийн салбарыг (жишээлбэл, анагаах ухаан, хууль эрх зүй, тоглоом, шинжлэх ухааны судалгаа гэх мэт) хамрахад зориулагдсан хувийн шийдлүүдийг бий болгох боломжийг харгалзан боловсруулж байна. ChatLLaMA код нь GPLv3 дагуу лицензтэй.

Төсөл нь Метагийн санал болгосон LLaMA (Large Language Model Meta AI) архитектурт суурилсан загваруудыг ашиглахыг дэмждэг. LLaMA-ийн бүрэн загвар нь 65 тэрбум параметрийг хамардаг боловч ChatLLaMA-ийн хувьд 7 ба 13 тэрбум параметртэй сонголтууд эсвэл GPTJ (6 тэрбум), GPTNeoX (1.3 тэрбум), 20BOPT (13 тэрбум), BLOOM (7.1 тэрбум) болон Галактика (6.7 тэрбум) загварууд). Эхэндээ LLaMA загваруудыг зөвхөн судлаачдад тусгай хүсэлтээр нийлүүлдэг байсан ч өгөгдөл дамжуулахад торрент ашигладаг байсан тул сонирхогчид загвараа хэн ч татаж авах боломжтой скрипт бэлтгэсэн.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх