Ippubblikat OpenChatKit, sett ta' għodda għall-bini ta' chatbots

Jiġi ppreżentat is-sett ta' għodod open source OpenChatKit, immirat biex jissimplifika l-ħolqien ta' chatbots għal użu speċjalizzat u ġenerali. Is-sistema hija adattata biex twettaq kompiti bħal twieġeb mistoqsijiet, twettaq djalogi f'diversi stadji, tiġbor fil-qosor, tiġbed l-informazzjoni, u tikklassifika t-test. Il-kodiċi huwa miktub f'Python u mqassam taħt il-liċenzja Apache 2.0. Il-proġett jinkludi mudell lest, kodiċi għat-taħriġ tal-mudell tiegħek, utilitajiet għall-ittestjar tar-riżultati tal-mudell, għodod biex jissupplimentaw il-mudell b'kuntest minn indiċi estern u jadattaw il-mudell bażi biex issolvi l-problemi tiegħek stess.

Il-bot huwa bbażat fuq mudell bażiku ta’ tagħlim tal-magni (GPT-NeoXT-Chat-Base-20B), mibni bl-użu ta’ mudell tal-lingwa li jkopri madwar 20 biljun parametru u ottimizzat għal komunikazzjoni konversazzjonali. Biex jitħarreġ il-mudell, intużat data miksuba mill-kollezzjonijiet tal-proġetti LAION, Together u Ontocord.ai.

Biex tespandi l-bażi ta 'għarfien eżistenti, hija proposta sistema li tista' tirkupra informazzjoni addizzjonali minn repożitorji esterni, APIs u sorsi oħra. Pereżempju, huwa possibbli li taġġorna l-informazzjoni billi tuża data mill-Wikipedija u aħbarijiet. Mudell ta' moderazzjoni fakultattiv huwa disponibbli, imħarreġ fuq 6 biljun parametru u bbażat fuq il-mudell GPT-JT, biex jiġu ffiltrati mistoqsijiet mhux xierqa jew jillimitaw id-diskussjonijiet għal suġġetti speċifiċi.

Separatament, nistgħu nsemmu l-proġett ChatLLaMA, li joffri librerija għall-ħolqien ta 'assistenti intelliġenti simili għal ChatGPT. Il-proġett qed jiġi żviluppat b'ħarsa lejn il-possibbiltà li taħdem fuq it-tagħmir tiegħek stess u li toħloq soluzzjonijiet personalizzati mfassla biex ikopru oqsma dejqa ta' għarfien (pereżempju, mediċina, liġi, logħob, riċerka xjentifika, eċċ.). Il-kodiċi ChatLLaMA huwa liċenzjat taħt GPLv3.

Il-proġett jappoġġja l-użu ta’ mudelli bbażati fuq l-arkitettura LLaMA (Large Language Model Meta AI) proposta minn Meta. Il-mudell LLaMA sħiħ ikopri 65 biljun parametru, iżda għal ChatLLaMA huwa rakkomandat li tuża għażliet b'7 u 13-il biljun parametri jew il-GPTJ (6 biljun), GPTNeoX (1.3 biljun), 20BOPT (13 biljun), BLOOM (7.1 biljun) u Mudelli Galactica (6.7 biljun). Inizjalment, il-mudelli LLaMA ġew fornuti biss lir-riċerkaturi fuq talba speċjali, iżda peress li t-torrenti ntużaw biex iwasslu d-dejta, id-dilettanti ħejjew skript li ppermetta lil xi ħadd tniżżel il-mudell.

Sors: opennet.ru

Żid kumment