Nai-publish ang OpenChatKit, isang toolkit para sa pagbuo ng mga chatbot

Ang OpenChatKit open source toolkit ay ipinakita, na naglalayong pasimplehin ang paglikha ng mga chatbot para sa dalubhasa at pangkalahatang paggamit. Ang sistema ay iniangkop upang magsagawa ng mga gawain tulad ng pagsagot sa mga tanong, pagsasagawa ng mga multi-stage na dialogue, pagbubuod, pagkuha ng impormasyon, at pag-uuri ng teksto. Ang code ay nakasulat sa Python at ipinamahagi sa ilalim ng lisensya ng Apache 2.0. Kasama sa proyekto ang isang yari na modelo, code para sa pagsasanay ng iyong modelo, mga kagamitan para sa pagsubok sa mga resulta ng modelo, mga tool para sa pagdaragdag sa modelo ng konteksto mula sa isang panlabas na index at pag-adapt sa batayang modelo upang malutas ang iyong sariling mga problema.

Nakabatay ang bot sa isang basic machine learning model (GPT-NeoXT-Chat-Base-20B), na binuo gamit ang isang modelo ng wika na sumasaklaw sa humigit-kumulang 20 bilyong parameter at na-optimize para sa pakikipag-usap sa pakikipag-usap. Upang sanayin ang modelo, ginamit ang data na nakuha mula sa mga koleksyon ng proyekto ng LAION, Together at Ontocord.ai.

Upang palawakin ang umiiral na base ng kaalaman, iminungkahi ang isang sistema na maaaring kumuha ng karagdagang impormasyon mula sa mga panlabas na repositoryo, mga API at iba pang mga mapagkukunan. Halimbawa, posibleng i-update ang impormasyon gamit ang data mula sa Wikipedia at mga news feed. Available ang opsyonal na modelo ng pagmo-moderate, sinanay sa 6 bilyong mga parameter at batay sa modelong GPT-JT, upang i-filter ang mga hindi naaangkop na tanong o limitahan ang mga talakayan sa mga partikular na paksa.

Hiwalay, maaari naming banggitin ang proyekto ng ChatLLaMA, na nag-aalok ng library para sa paglikha ng mga matatalinong katulong na katulad ng ChatGPT. Ang proyekto ay binuo na may mata sa posibilidad na tumakbo sa iyong sariling kagamitan at lumikha ng mga personalized na solusyon na idinisenyo upang masakop ang makitid na mga lugar ng kaalaman (halimbawa, medisina, batas, laro, siyentipikong pananaliksik, atbp.). Ang ChatLLaMA code ay lisensyado sa ilalim ng GPLv3.

Sinusuportahan ng proyekto ang paggamit ng mga modelo batay sa arkitektura ng LLaMA (Large Language Model Meta AI) na iminungkahi ng Meta. Ang buong modelo ng LLaMA ay sumasaklaw sa 65 bilyong mga parameter, ngunit para sa ChatLLaMA inirerekumenda na gumamit ng mga opsyon na may 7 at 13 bilyong mga parameter o ang GPTJ (6 bilyon), GPTNeoX (1.3 bilyon), 20BOPT (13 bilyon), BLOOM (7.1 bilyon) at Galactica (6.7 bilyon) na mga modelo ). Sa una, ang mga modelo ng LLaMA ay ibinibigay lamang sa mga mananaliksik sa espesyal na kahilingan, ngunit dahil ginamit ang mga torrent upang maghatid ng data, naghanda ang mga mahilig sa isang script na nagpapahintulot sa sinuman na mag-download ng modelo.

Pinagmulan: opennet.ru

Magdagdag ng komento