சாட்போட்களை உருவாக்குவதற்கான கருவித்தொகுப்பான OpenChatKit வெளியிடப்பட்டது

ஓபன் சாட்கிட் திறந்த மூல கருவித்தொகுப்பு வழங்கப்படுகிறது, இது சிறப்பு மற்றும் பொதுவான பயன்பாட்டிற்கான சாட்போட்களை உருவாக்குவதை எளிதாக்கும் நோக்கத்துடன் உள்ளது. கேள்விகளுக்குப் பதிலளிப்பது, பல கட்ட உரையாடல்களை நடத்துவது, சுருக்கமாக, தகவல்களைப் பிரித்தெடுத்தல் மற்றும் உரையை வகைப்படுத்துவது போன்ற பணிகளைச் செய்வதற்கு இந்த அமைப்பு மாற்றியமைக்கப்பட்டுள்ளது. குறியீடு பைத்தானில் எழுதப்பட்டு அப்பாச்சி 2.0 உரிமத்தின் கீழ் விநியோகிக்கப்படுகிறது. திட்டத்தில் ஒரு ஆயத்த மாதிரி, உங்கள் மாதிரியைப் பயிற்றுவிப்பதற்கான குறியீடு, மாதிரியின் முடிவுகளைச் சோதிப்பதற்கான பயன்பாடுகள், வெளிப்புறக் குறியீட்டிலிருந்து மாதிரியை கூடுதலாகச் செய்வதற்கான கருவிகள் மற்றும் உங்கள் சொந்த பிரச்சினைகளைத் தீர்க்க அடிப்படை மாதிரியை மாற்றியமைத்தல் ஆகியவை அடங்கும்.

போட் ஒரு அடிப்படை இயந்திர கற்றல் மாதிரியை (GPT-NeoXT-Chat-Base-20B) அடிப்படையாகக் கொண்டது, சுமார் 20 பில்லியன் அளவுருக்களை உள்ளடக்கிய மொழி மாதிரியைப் பயன்படுத்தி உருவாக்கப்பட்டு உரையாடல் தொடர்புக்கு உகந்ததாக உள்ளது. மாதிரியைப் பயிற்றுவிக்க, LAION, Together மற்றும் Ontocord.ai திட்ட சேகரிப்புகளிலிருந்து பெறப்பட்ட தரவு பயன்படுத்தப்பட்டது.

தற்போதுள்ள அறிவுத் தளத்தை விரிவுபடுத்த, வெளிப்புற களஞ்சியங்கள், APIகள் மற்றும் பிற ஆதாரங்களில் இருந்து கூடுதல் தகவல்களைப் பெறக்கூடிய ஒரு அமைப்பு முன்மொழியப்பட்டது. எடுத்துக்காட்டாக, விக்கிபீடியா மற்றும் செய்தி ஊட்டங்களில் இருந்து தரவைப் பயன்படுத்தி தகவலைப் புதுப்பிக்க முடியும். பொருத்தமற்ற கேள்விகளை வடிகட்ட அல்லது குறிப்பிட்ட தலைப்புகளுக்கு விவாதங்களை மட்டுப்படுத்த, 6 பில்லியன் அளவுருக்கள் மற்றும் GPT-JT மாதிரியின் அடிப்படையில் பயிற்சியளிக்கப்பட்ட ஒரு விருப்பமான மிதமான மாதிரி உள்ளது.

தனித்தனியாக, ChatLLaMA திட்டத்தைக் குறிப்பிடலாம், இது ChatGPT போன்ற அறிவார்ந்த உதவியாளர்களை உருவாக்குவதற்கான நூலகத்தை வழங்குகிறது. உங்கள் சொந்த உபகரணங்களில் இயங்குவதற்கான சாத்தியக்கூறுகள் மற்றும் அறிவின் குறுகிய பகுதிகளை (உதாரணமாக, மருத்துவம், சட்டம், விளையாட்டுகள், அறிவியல் ஆராய்ச்சி போன்றவை) உள்ளடக்கும் வகையில் வடிவமைக்கப்பட்ட தனிப்பயனாக்கப்பட்ட தீர்வுகளை உருவாக்குவதற்கான சாத்தியக்கூறுகளை கருத்தில் கொண்டு இந்த திட்டம் உருவாக்கப்படுகிறது. ChatLLaMA குறியீடு GPLv3 இன் கீழ் உரிமம் பெற்றது.

மெட்டாவால் முன்மொழியப்பட்ட LAMA (Large Language Model Meta AI) கட்டமைப்பின் அடிப்படையில் மாடல்களைப் பயன்படுத்துவதை இந்தத் திட்டம் ஆதரிக்கிறது. முழு LAMA மாடல் 65 பில்லியன் அளவுருக்களை உள்ளடக்கியது, ஆனால் ChatLLaMA க்கு 7 மற்றும் 13 பில்லியன் அளவுருக்கள் அல்லது GPTJ (6 பில்லியன்), GPTNeoX (1.3 பில்லியன்), 20BOPT (13 பில்லியன்), BLOOM (7.1 பில்லியன்) மற்றும் கேலக்டிகா (6.7 பில்லியன்) மாதிரிகள் ). ஆரம்பத்தில், LAMA மாதிரிகள் சிறப்பு கோரிக்கையின் பேரில் ஆராய்ச்சியாளர்களுக்கு மட்டுமே வழங்கப்பட்டன, ஆனால் தரவை வழங்க டோரண்ட்கள் பயன்படுத்தப்பட்டதால், ஆர்வலர்கள் ஒரு ஸ்கிரிப்டைத் தயாரித்தனர், இது மாதிரியை யாரையும் பதிவிறக்க அனுமதிக்கிறது.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்