ප්‍රකාශිත OpenChatKit, chatbots ගොඩනැගීම සඳහා මෙවලම් කට්ටලයක්

OpenChatKit විවෘත මූලාශ්‍ර මෙවලම් කට්ටලය ඉදිරිපත් කර ඇත, විශේෂිත සහ සාමාන්‍ය භාවිතය සඳහා chatbots නිර්මාණය කිරීම සරල කිරීම අරමුණු කර ගෙන ඇත. ප්‍රශ්නවලට පිළිතුරු සැපයීම, බහු-අදියර සංවාද පැවැත්වීම, සාරාංශ කිරීම, තොරතුරු උකහා ගැනීම සහ පෙළ වර්ගීකරණය වැනි කාර්යයන් ඉටු කිරීමට පද්ධතිය අනුගත වේ. කේතය Python වලින් ලියා Apache 2.0 බලපත්‍රය යටතේ බෙදා හැර ඇත. මෙම ව්‍යාපෘතියට සූදානම් කළ ආකෘතියක්, ඔබේ ආකෘතිය පුහුණු කිරීම සඳහා කේතයක්, ආකෘතියේ ප්‍රතිඵල පරීක්ෂා කිරීම සඳහා උපයෝගිතා, බාහිර දර්ශකයකින් ආකෘතියට අනුපූරක කිරීම සඳහා මෙවලම් සහ ඔබේම ගැටළු විසඳීම සඳහා මූලික ආකෘතිය අනුවර්තනය කිරීම ඇතුළත් වේ.

බොට් මූලික යන්ත්‍ර ඉගෙනුම් ආකෘතියක් (GPT-NeoXT-Chat-Base-20B) මත පදනම් වී ඇති අතර, පරාමිති බිලියන 20ක් පමණ ආවරණය වන පරිදි භාෂා ආකෘතියක් භාවිතයෙන් ගොඩනගා ඇති අතර සංවාද සන්නිවේදනය සඳහා ප්‍රශස්ත කර ඇත. ආකෘතිය පුහුණු කිරීම සඳහා, LAION, Together සහ Ontocord.ai ව්‍යාපෘති එකතුවෙන් ලබාගත් දත්ත භාවිතා කරන ලදී.

පවතින දැනුම් පදනම පුළුල් කිරීම සඳහා, බාහිර ගබඩා, API සහ වෙනත් මූලාශ්‍රවලින් අමතර තොරතුරු ලබා ගත හැකි පද්ධතියක් යෝජනා කෙරේ. උදාහරණයක් ලෙස, විකිපීඩියා සහ ප්‍රවෘත්ති සංග්‍රහවල දත්ත භාවිතයෙන් තොරතුරු යාවත්කාලීන කළ හැකිය. නුසුදුසු ප්‍රශ්න පෙරීමට හෝ විශේෂිත මාතෘකා වෙත සාකච්ඡා සීමා කිරීමට, GPT-JT ආකෘතිය මත පදනම්ව, පරාමිති බිලියන 6ක් මත පුහුණු කරන ලද විකල්ප මධ්‍යස්ථ ආකෘතියක් තිබේ.

වෙනමම, අපට ChatLLaMA ව්‍යාපෘතිය සඳහන් කළ හැකිය, එය ChatGPT හා සමාන බුද්ධිමත් සහායකයින් නිර්මාණය කිරීම සඳහා පුස්තකාලයක් සපයයි. ඔබේම උපකරණ මත ධාවනය කිරීමේ හැකියාව සහ දැනුමේ පටු ක්ෂේත්‍ර (උදාහරණයක් ලෙස, වෛද්‍ය විද්‍යාව, නීතිය, ක්‍රීඩා, විද්‍යාත්මක පර්යේෂණ ආදිය) ආවරණය කිරීම සඳහා නිර්මාණය කර ඇති පුද්ගලාරෝපිත විසඳුම් නිර්මාණය කිරීමේ හැකියාව පිළිබඳව මෙම ව්‍යාපෘතිය සංවර්ධනය වෙමින් පවතී. ChatLLaMA කේතය GPLv3 යටතේ බලපත්‍ර ලබා ඇත.

මෙටා විසින් යෝජනා කරන ලද LLaMA (විශාල භාෂා ආකෘතිය Meta AI) ගෘහ නිර්මාණ ශිල්පය මත පදනම් වූ ආකෘති භාවිතය සඳහා ව්‍යාපෘතිය සහාය දක්වයි. සම්පූර්ණ LLaMA ආකෘතිය පරාමිති බිලියන 65ක් ආවරණය කරයි, නමුත් ChatLLaMA සඳහා බිලියන 7 සහ 13 පරාමිති හෝ GPTJ (බිලියන 6), GPTNeoX (බිලියන 1.3), 20BOPT (බිලියන 13), BLOOM (බිලියන 7.1) සහ විකල්ප භාවිතා කිරීම නිර්දේශ කෙරේ. Galactica (බිලියන 6.7) ආකෘති ). මුලදී, LAMA මාදිලි විශේෂ ඉල්ලීමක් මත පර්යේෂකයන්ට පමණක් සපයන ලදී, නමුත් දත්ත බෙදා හැරීම සඳහා ටොරන්ට් භාවිතා කළ බැවින්, උනන්දුවක් දක්වන අය ඕනෑම කෙනෙකුට ආකෘතිය බාගත කිරීමට ඉඩ සලසන පිටපතක් සකස් කළහ.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න