የታተመ OpenChatKit፣ የቻት ቦቶች ግንባታ መሣሪያ

የክፍት ቻት ኪት የክፍት ምንጭ መሣሪያ ስብስብ ቀርቧል፣ ዓላማውም የቻትቦቶችን ፈጠራ ለልዩ እና ለአጠቃላይ ጥቅም ለማቃለል ነው። ስርዓቱ እንደ ጥያቄዎችን መመለስ፣ ባለብዙ ደረጃ ውይይቶችን ማድረግ፣ ማጠቃለል፣ መረጃ ማውጣት እና ጽሑፍን መመደብ ያሉ ተግባራትን ለማከናወን ተስተካክሏል። ኮዱ በፓይዘን የተፃፈ እና በ Apache 2.0 ፍቃድ ስር ይሰራጫል። ፕሮጀክቱ ዝግጁ የሆነ ሞዴል ፣ ሞዴልዎን ለማሰልጠን ኮድ ፣ የአምሳያው ውጤቶችን ለመፈተሽ መገልገያዎች ፣ ሞዴሉን ከውጫዊ መረጃ ጠቋሚ ጋር ለመሙላት እና የእራስዎን ችግሮች ለመፍታት መሰረታዊ ሞዴልን ማስተካከልን ያካትታል ።

ቦት ወደ 20 ቢሊዮን የሚጠጉ መለኪያዎችን የሚሸፍን የቋንቋ ሞዴል በመጠቀም እና ለውይይት ግንኙነት የተመቻቸ በመሠረታዊ የማሽን መማሪያ ሞዴል (GPT-NeoXT-Chat-Base-20B) ላይ የተመሰረተ ነው። ሞዴሉን ለማሰልጠን ከLAION፣ Together እና Ontocord.ai የፕሮጀክት ስብስቦች የተገኘው መረጃ ጥቅም ላይ ውሏል።

ያለውን የእውቀት መሰረት ለማስፋት ተጨማሪ መረጃ ከውጭ ማከማቻዎች፣ ኤፒአይዎች እና ሌሎች ምንጮች ሰርስሮ ማውጣት የሚችል ስርዓት ቀርቧል። ለምሳሌ ከዊኪፔዲያ እና የዜና ምግቦች መረጃን በመጠቀም መረጃን ማዘመን ይቻላል። በ6 ቢሊየን መለኪያዎች የሰለጠነ እና በጂፒቲ-ጄቲ ሞዴል ላይ በመመስረት፣ ተገቢ ያልሆኑ ጥያቄዎችን ለማጣራት ወይም በተወሰኑ ርዕሰ ጉዳዮች ላይ ውይይቶችን ለመገደብ የአማራጭ የአወያይ ሞዴል አለ።

ለየብቻ፣ ከ ChatGPT ጋር ተመሳሳይ የሆኑ የማሰብ ችሎታ ያላቸው ረዳቶችን ለመፍጠር ቤተ-መጽሐፍት የሚሰጠውን የChatLLaMA ፕሮጀክት መጥቀስ እንችላለን። ፕሮጀክቱ በራስዎ መሳሪያ ለመስራት እና ጠባብ የእውቀት ዘርፎችን (ለምሳሌ ህክምና፣ ህግ፣ ጨዋታ፣ ሳይንሳዊ ጥናትና ምርምር ወዘተ) ለመሸፈን የተነደፉ ግላዊ መፍትሄዎችን ለመፍጠር በአይን እየተዘጋጀ ነው። የChatLLaMA ኮድ በGPLv3 ፍቃድ ተሰጥቶታል።

ፕሮጀክቱ በሜታ የቀረበውን LLMA (ትልቅ የቋንቋ ሞዴል ሜታ AI) አርክቴክቸር መሰረት በማድረግ ሞዴሎችን መጠቀምን ይደግፋል። ሙሉው የኤልኤምኤ ሞዴል 65 ቢሊዮን መለኪያዎችን ይሸፍናል ነገር ግን ለ ChatLLaMA በ 7 እና 13 ቢሊዮን መለኪያዎች ወይም GPTJ (6 ቢሊዮን), GPTNeoX (1.3 ቢሊዮን), 20BOPT (13 ቢሊዮን), BLOOM (7.1 ቢሊዮን) እና አማራጮችን መጠቀም ይመከራል. ጋላክቲካ (6.7 ቢሊዮን) ሞዴሎች ). መጀመሪያ ላይ የኤልኤምኤ ሞዴሎች ለተመራማሪዎች በልዩ ጥያቄ ብቻ ይቀርቡ ነበር፣ ነገር ግን ጅረቶች መረጃን ለማድረስ ጥቅም ላይ ስለሚውሉ አድናቂዎች ማንም ሰው ሞዴሉን እንዲያወርድ የሚፈቅድ ስክሪፕት አዘጋጅተው ነበር።

ምንጭ: opennet.ru

አስተያየት ያክሉ