ืคืจืืืงื ืฉืืชืืคื ืฉื RedPajama ืืืฆื ืืืฆืืจืช ืืืืืื ืฉื ืืืืืช ืืืื ื ืคืชืืื ืืชืฉืืืืช ืืืืื ื ืืืืช ืฉื ืืชื ืืืฉืชืืฉ ืืื ืืื ืืืช ืขืืืจืื ืืื ืืืืื ืืืื ืฉืืชืืจืื ืืืืฆืจืื ืืกืืจืืื ืืืื ChatGPT. ืฆืคืื ืื ื ืืืืืชื ืฉื ื ืชืื ื ืงืื ืคืชืื ืืืืืืื ืฉื ืฉืคืืช ืืืืืื ืชืกืืจ ืืช ืืืืืืืช ืฉื ืฆืืืชืื ืขืฆืืืืื ืืขืืกืงืื ืืืืงืจ ืืชืืื ืืืืืช ืืืื ื, ืืชืคืฉื ืืช ืืฆืืจืช ืืขืจืืืช ืืืืืื ืืืืืืืช. ืืจืืื ืื ืืงืืืืืช ืืื Together, Ontocord.ai, ETH DS3Lab, Stanford CRFM, Hazy Research ื-MILA Quรฉbec AI Institute ืืฆืืจืคื ืืขืืืื ืขื ืืคืจืืืงื.
ืืฆืขื ืืจืืฉืื ืืื ืคืจืกืื ืืขืจื ืื ืชืื ืื RedPajama-Data-1T ืื ืคื 1.2 ืืจืืืืื ืืกืืืื ืืืืืื ืืืืืื ืฉื ืฉืืื. ืขืจืืช RedPajama ืืฉืืคืืช ื ืชืื ืื ืืืงืืจืืช ืฆืืืืจืืื ืฉืฉืืืฉื ืืช ืคืืืกืืืง ืืืฆืืจืช ืืืื ื-LAMA ืฉืื (ืกื"ื 1.25 ืืจืืืืื ืืกืืืื ืื), ืื ืืกืืคืงืช ืืจืืฉืืื ืคืชืื ืฉืืื ื ืืืืื ืืช ืืืงืฃ ืืฉืืืืฉ (ื ืชืื ื LLaMA ืืืืืืื ืกืืคืงื ืจืง ืืืืงืจืื ืขื ืืื ืืืืืืื ืืงืฉื ืืฉืืืืฉ ืื ืืกืืจื). ืืกื ืืืืจืื RedPajama-Data-1T ืืื 2.67 TB ืืืืื ืืืืข ืืืคื ืืื ืืจื ื ืฉื ืืกืคื ืืืื ืืงืก Common Crawl, ืืจืืืื ื ืืืงืืคืืื, ืงืื ืืงืืจ ื-GitHub, ืกืคืจืื ืฆืืืืจืืื ืืกืคืจืืืช ืืืื ืืจื, ืืืืจืื ืืืขืืื ืืืจืืืื ArXiv ืืืืื ืื ืขื Stack Overflow ืืฉืืจ Stack Overflow. ืืืืคืช ืืชืจืื.
ืืืืืื ืืืื ืื, ืฉืืืืฉืจื ืขื ืืกืืก ืืขืจื ืื ืชืื ืื ืืืืื ืื ืืขืืจื ืืืคืืืืืืฆืื ืืืืฆืขืืช ืืืืืืืช ืืืื ืืช ืฉื ืืืืืืืื ืืฆืืจื ืฉื ืืืจืื-ืืืฆืืข ืืคืจืืืงืื Alpaca ื-OpenChatKit, ืืชืืื ื ืื ืืืืืืฆืจ ืืฉืืืขืืช ืืงืจืืืื. ืืืืืืช ืืืื ืฉืคื ืืืืืช ืืืืืืช ืืช ืคืจืืืงืื ืืงืื ืืคืชืื ืืืืงื LLaMA, Alpaca, Vicuna ื-Koala, ืืื ืื ืืช ืืืืืืช ืืงืื ืืคืชืื ืืืืืืช Pythia, OpenChatKit, Open Assistant ืืืืื.
ืื ืืกืฃ, ืืฉื ื ืืกืคืจ ืคืจืืืงืืื ืืืฉืื ืืงืฉืืจืื ืืืืืืช ืืืื ื:
- MiniGPT-4 - ืืจืืื ืฆ'ืืืืืืื ืืกืืจืชืืื ืืฉืืื ืขื ืืืืืืช ืฉืืืงืืืช ืืืฉืืื ืืืืข ืืืืชื, ืื ืฉืืืคืฉืจ ืื ืื ืชื ืชืืื ืืช ืืืงืืช ืืืฉืืื ืืงืกื ืืืชื ืื ืืชืืืื ืืืื ืืจืืงืฆืื ืขื ืืืขืจืืช (ืืืืืื, ืืชื ืืืื ืืฉืืื ืืืื ืกืื ืฉื ืืืืืืงื ืืืฆื ืืชืืื ื, ืืงืฉ ืืืืื ืืืชืื ืกืืคืืจ ืขื ืกืื ืื ืฉืืืฆื ืืชืืื ื, ืื ืขื ืกืื ืกืงืืฆื ืกืืืืืช, ืืงืฉ ืืืฆืืจ ืืชืจ ืืื ืืจื ื). ืืืืืืฉ ืฉื MiniGPT-4 ื ืืชื ื-Python ืืืืคืฅ ืชืืช ืจืืฉืืื BSD.
- ืคืืืกืืืง ืคืจืกืื ืขืจืืช ืืืื ืืืืื ืืืืื ืขืฆืืืช (SSL, Self-Supervised Learning, ืืื ื ืืฉืชืืฉ ืืชืืืืืช ืืืขืจืืช ืฉืืืื ื ืขื ืืื ืืื) DINOv2 ืืืื ืจืืืืช ืืืื ื ืืืชืืื ืืคืชืจืื ืืขืืืช ืฉื ืขืืืื ืืืืข ืืืืชื ืืืื (ืกืืืื ืชืืื ื, ืืืืืฅ ืืืืข ืขื ืืืืืืงืืื ื ืชืืื ืืช, ืืื ืช ืื ืงืืจื ืืืืืืื) ืืื ืืคืืืฆืืืช ืืจืืช ืืคืืงืกืืื (ืืืืื ืขืืืง, ืคืืืื). ืืืื ืืืืื ืขื ืืืกืฃ ืฉื 142 ืืืืืื ืชืืื ืืช. ืืืืืืฉ ื ืืชื ื-Python ืืืืคืฅ ืชืืช ืจืืฉืืื Creative Commons Attribution-NonCommercial 4.0 ืืืืคืฉืจ ืฉืืืืฉ ืื ืืกืืจื.
- GPT4All ืืื ืขืจืืช ืืืื ืืืคืขืื ืืืืจื ืฉื ืฆ'ืืืืืืื ืขืฆืืืืื ืขื ืืืืืจื ืฉืืื (ืื ืื ื ืืืฉืื ืืฉืืจืืชืื ืืืฆืื ืืื ืืืฉืชืืฉืื ืืืขืืืื ืขื ืชืืืื ื-AVX2 ืืืืฆืืข). ืืืืืจ ืืืื ืฉืคื ืืืืืื ืืืืืกืกืื ืขื GPT-J ื-LLaMa ื ืชืื. ืืงืื ืืชืื ื-Python ืืืืคืฅ ืชืืช ืจืืฉืืื MIT.
ืืงืืจ: OpenNet.ru