Ua paʻi ʻia ʻo OpenChatKit, kahi mea hana no ka hana ʻana i nā chatbots

Hōʻike ʻia ka OpenChatKit open source toolkit, i manaʻo ʻia e maʻalahi i ka hana ʻana i nā chatbots no ka hoʻohana kūikawā a me ka maʻamau. Hoʻololi ʻia ka ʻōnaehana no ka hana ʻana i nā hana e like me ka pane ʻana i nā nīnau, ke alakaʻi ʻana i nā kamaʻilio lehulehu, ka hōʻuluʻulu ʻana, ka unuhi ʻana i ka ʻike, a me ka hoʻokaʻawale ʻana i nā kikokikona. Ua kākau ʻia ke code ma Python a māhele ʻia ma lalo o ka laikini Apache 2.0. Aia i loko o ka papahana kahi kŘkohu i ho'omākaukau 'ia, code no ka ho'oma'ama'a 'ana i kāu kŘkohu, nā mea pono no ka ho'ā'o 'ana i nā hopena o ke kŘkohu, nā mea hana no ka ho'ohui 'ana i ke kŘkohu me ka pō'aiapili mai ka papa kuhikuhi waho a me ka ho'ololi 'ana i ke kŘkohu kumu e ho'oholo i kou mau pilikia pono'ī.

Hoʻokumu ʻia ka bot ma kahi kumu hoʻohālike aʻo mīkini maʻamau (GPT-NeoXT-Chat-Base-20B), i kūkulu ʻia me ka hoʻohana ʻana i kahi kumu hoʻohālike ʻōlelo e uhi ana ma kahi o 20 billion mau ʻāpana a i hoʻopaʻa ʻia no ke kamaʻilio kamaʻilio. No ke aʻo ʻana i ke kumu hoʻohālike, ua hoʻohana ʻia nā ʻikepili i loaʻa mai ka LAION, Together a me Ontocord.ai hōʻiliʻili papahana.

No ka hoʻonui ʻana i ka waihona ʻike e kū nei, ua manaʻo ʻia kahi ʻōnaehana hiki ke kiʻi hou i ka ʻike hou mai nā waihona waho, nā API a me nā kumu ʻē aʻe. No ka laʻana, hiki ke hōʻano hou i ka ʻike me ka hoʻohana ʻana i ka ʻikepili mai Wikipedia a me nā hānai nūhou. Loaʻa kahi ʻano hoʻohālikelike koho, hoʻomaʻamaʻa ʻia ma nā ʻāpana 6 biliona a ma muli o ke kumu hoʻohālike GPT-JT, e kānana i nā nīnau kūpono ʻole a i ʻole e kaupalena i nā kūkākūkā i nā kumuhana kikoʻī.

Ma kahi kaʻawale, hiki iā mākou ke haʻi i ka papahana ChatLLaMA, e hāʻawi ana i kahi waihona no ka hana ʻana i nā mea kōkua akamai e like me ChatGPT. Ke hoʻomohala ʻia nei ka papahana me ka maka i ka hiki ke holo ma kāu mau lako ponoʻī a hana i nā hoʻonā pilikino i hoʻolālā ʻia e uhi i nā wahi haiki o ka ʻike (e laʻa, lāʻau lapaʻau, kānāwai, pāʻani, noiʻi ʻepekema, etc.). Ua laikini ʻia ka code ChatLLaMA ma lalo o GPLv3.

Kākoʻo ka pāhana i ka hoʻohana ʻana i nā hiʻohiʻona e pili ana i ka LLaMA (Large Language Model Meta AI) i hoʻolālā ʻia e Meta. Hoʻopili ʻia ka hiʻohiʻona LLaMA piha i 65 biliona mau ʻāpana, akā no ChatLLaMA ua manaʻo ʻia e hoʻohana i nā koho me 7 a me 13 biliona mau palena a i ʻole ka GPTJ (6 biliona), GPTNeoX (1.3 biliona), 20BOPT (13 biliona), BLOOM (7.1 biliona) a Galactica (6.7 biliona) mau hiʻohiʻona ). I ka hoʻomaka ʻana, hāʻawi ʻia nā hiʻohiʻona LLaMA i nā mea noiʻi wale nō ma ke noi kūikawā, akā no ka hoʻohana ʻana o nā kahawai e hāʻawi i ka ʻikepili, ua hoʻomākaukau ka poʻe hoihoi i kahi palapala e hiki ai i kekahi ke hoʻoiho i ke kumu hoʻohālike.

Source: opennet.ru

Pākuʻi i ka manaʻo hoʻopuka