RedPajama рдкрд░рд┐рдпреЛрдЬрдирд╛рд▓реЗ рдХреГрддреНрд░рд┐рдо рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдкреНрд░рдгрд╛рд▓реАрд╣рд░реВрдХреЛ рд▓рд╛рдЧрд┐ рдЦреБрд▓рд╛ рдбрд╛рдЯрд╛рд╕реЗрдЯ рд╡рд┐рдХрд╛рд╕ рдЧрд░реНрджрдЫ

рдПрдЙрдЯрд╛ RedPajama рд╕рд╣рдпреЛрдЧреА рдкрд░рд┐рдпреЛрдЬрдирд╛ рдЦреБрд▓рд╛ рдореЗрд╕рд┐рди рд▓рд░реНрдирд┐рдВрдЧ рдореЛрдбреЗрд▓рд╣рд░реВ рд░ ChatGPT рдЬрд╕реНрддрд╛ рд╡реНрдпрд╛рд╡рд╕рд╛рдпрд┐рдХ рдЙрддреНрдкрд╛рджрдирд╣рд░реВрд╕рдБрдЧ рдкреНрд░рддрд┐рд╕реНрдкрд░реНрдзрд╛ рдЧрд░реНрдиреЗ рдмреМрджреНрдзрд┐рдХ рд╕рд╣рд╛рдпрдХрд╣рд░реВ рдирд┐рд░реНрдорд╛рдг рдЧрд░реНрди рдкреНрд░рдпреЛрдЧ рдЧрд░реНрди рд╕рдХрд┐рдиреЗ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдЗрдирдкреБрдЯрд╣рд░реВ рд╕рд┐рд░реНрдЬрдирд╛ рдЧрд░реНрди рдкреНрд░рд╕реНрддреБрдд рдЧрд░рд┐рдПрдХреЛ рдЫред рдпреЛ рдЖрд╢рд╛ рдЧрд░рд┐рдиреНрдЫ рдХрд┐ рдЦреБрд▓рд╛ рд╕реНрд░реЛрдд рдбрд╛рдЯрд╛ рд░ рдареВрд▓рд╛ рднрд╛рд╖рд╛ рдореЛрдбреЗрд▓рд╣рд░реВрдХреЛ рдЙрдкрд╕реНрдерд┐рддрд┐рд▓реЗ рдореЗрд╕рд┐рди рд▓рд░реНрдирд┐рдВрдЧрдХреЛ рдХреНрд╖реЗрддреНрд░рдорд╛ рдЕрдиреБрд╕рдиреНрдзрд╛рдирдорд╛ рд╕рдВрд▓рдЧреНрди рд╕реНрд╡рддрдиреНрддреНрд░ рдЯреЛрд▓реАрд╣рд░реВрдХреЛ рдкреНрд░рддрд┐рдмрдиреНрдз рд╣рдЯрд╛рдЙрдиреЗрдЫ, рд░ рд╡рд┐рд╢реЗрд╖ рд╕рдВрд╡рд╛рдж рдкреНрд░рдгрд╛рд▓реАрд╣рд░реВрдХреЛ рд╕рд┐рд░реНрдЬрдирд╛рд▓рд╛рдИ рд╕рд░рд▓ рдмрдирд╛рдЙрдиреЗрдЫред рдЯреБрдЧреЗрджрд░, Ontocord.ai, ETH DS3Lab, Stanford CRFM, Hazy Research рд░ MILA Qu├йbec AI Institute рдЬрд╕реНрддрд╛ рд╕рдВрд╕реНрдерд╛ рд░ рд╕рдореБрджрд╛рдпрд╣рд░реВ рдпрд╕ рдкрд░рд┐рдпреЛрдЬрдирд╛рдХреЛ рдХрд╛рдордорд╛ рд╕рд╛рдореЗрд▓ рднрдПрдХрд╛ рдЫрдиреНред

рдкрд╣рд┐рд▓реЛ рдЪрд░рдг 1 рдЯреНрд░рд┐рд▓рд┐рдпрди рдЯреЛрдХрди RedPajama-Data-1.2T рдбрд╛рдЯрд╛рд╕реЗрдЯ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреБрд░рд╛рдХрд╛рдиреА рдореЛрдбреЗрд▓ рдХреЛ рдкреНрд░рдХрд╛рд╢рди рдерд┐рдпреЛред RedPajama рд╕реЗрдЯрд▓реЗ Facebook рджреНрд╡рд╛рд░рд╛ рдпрд╕рдХреЛ LLaMA рдореЛрдбреЗрд▓ (рдХреБрд▓ 1.25 рдЯреНрд░рд┐рд▓рд┐рдпрди рдЯреЛрдХрдирд╣рд░реВ) рд╕рд┐рд░реНрдЬрдирд╛ рдЧрд░реНрди рдкреНрд░рдпреЛрдЧ рдЧрд░рд┐рдиреЗ рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рд╕реНрд░реЛрддрд╣рд░реВрдмрд╛рдЯ рдбреЗрдЯрд╛ рдкреБрди: рдЙрддреНрдкрд╛рджрди рдЧрд░реНрджрдЫ, рддрд░ рдкреНрд░рдпреЛрдЧрдХреЛ рджрд╛рдпрд░рд╛рд▓рд╛рдИ рд╕реАрдорд┐рдд рдирдЧрд░реНрдиреЗ рдЦреБрд▓рд╛ рдЗрдЬрд╛рдЬрддрдкрддреНрд░ рдЕрдиреНрддрд░реНрдЧрдд рдЖрдкреВрд░реНрддрд┐ рдЧрд░рд┐рдиреНрдЫ (LLaMA рдбрд╛рдЯрд╛ рд░ рдореЛрдбреЗрд▓рд╣рд░реВ рд╡рд┐рд╢реЗрд╖ рджреНрд╡рд╛рд░рд╛ рдЕрдиреБрд╕рдиреНрдзрд╛рдирдХрд░реНрддрд╛рд╣рд░реВрд▓рд╛рдИ рдорд╛рддреНрд░ рдЖрдкреВрд░реНрддрд┐ рдЧрд░рд┐рдПрдХреЛ рдерд┐рдпреЛред рдЧреИрд░-рд╡реНрдпрд╛рд╡рд╕рд╛рдпрд┐рдХ рдкреНрд░рдпреЛрдЧрдХреЛ рд▓рд╛рдЧрд┐ рдЕрдиреБрд░реЛрдз)ред рдбрд╛рдЙрдирд▓реЛрдб рдЧрд░реНрди рдорд┐рд▓реНрдиреЗ RedPajama-Data-1T рд╕реЗрдЯ 2.67 TB рд╣реЛ рд░ рдпрд╕рдорд╛ Common Crawl рдЕрдиреБрдХреНрд░рдорд┐рдд рд╡реЗрдм рдкреГрд╖реНрдард╣рд░реВ, Wikipedia рдЕрднрд┐рд▓реЗрдЦрд╣рд░реВ, GitHub рдмрд╛рдЯ рд╕реНрд░реЛрдд рдХреЛрдб, рдЧреБрдЯреЗрдирдмрд░реНрдЧ рдкреБрд╕реНрддрдХрд╛рд▓рдпрдмрд╛рдЯ рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рдкреБрд╕реНрддрдХрд╣рд░реВ, ArXiv рдЕрднрд┐рд▓реЗрдЦрдмрд╛рдЯ рд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рд▓реЗрдЦрд╣рд░реВ, рд░ Stack Overflow рд░ рдЕрдиреНрдп рдЫрд▓рдлрд▓рд╣рд░реВ рд╕рдорд╛рд╡реЗрд╢ рдЫрдиреНред рд╕реНрдЯреНрдпрд╛рдХ рдПрдХреНрд╕рдЪреЗрдВрдЬ рд╕рд╛рдЗрдЯрд╣рд░реВред

рддрдпрд╛рд░ рдЧрд░рд┐рдПрдХрд╛ рдореЛрдбреЗрд▓рд╣рд░реВ, рддрдпрд╛рд░ рдЧрд░рд┐рдПрдХреЛ рдбрд╛рдЯрд╛рд╕реЗрдЯрдХреЛ рдЖрдзрд╛рд░рдорд╛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рд░ рдЕрд▓реНрдкрд╛рдХрд╛ рд░ рдУрдкрдирдЪреНрдпрд╛рдЯрдХрд┐рдЯ рдкрд░рд┐рдпреЛрдЬрдирд╛рд╣рд░реВрдмрд╛рдЯ рдирд┐рд░реНрджреЗрд╢рди-рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрдирдХреЛ рд░реВрдкрдорд╛ рд╕рдВрд╡рд╛рджрд╣рд░реВрдХреЛ рддрдпрд╛рд░ рдЙрджрд╛рд╣рд░рдгрд╣рд░реВ рдкреНрд░рдпреЛрдЧ рдЧрд░реЗрд░ рдЕрдиреБрдХреВрд▓рд┐рдд, рдЖрдЧрд╛рдореА рдХреЗрд╣реА рд╣рдкреНрддрд╛рд╣рд░реВрдорд╛ рдЧрдарди рдЧрд░реНрдиреЗ рдпреЛрдЬрдирд╛ рдЫред рд╕рдорд╛рди рднрд╛рд╖рд╛ рдореЛрдбреЗрд▓ рдкрд╣рд▓рд╣рд░реВрдорд╛ рдЖрдВрд╢рд┐рдХ рд░реВрдкрдорд╛ рдЦреБрд▓рд╛ рд╕реНрд░реЛрдд рдкрд░рд┐рдпреЛрдЬрдирд╛рд╣рд░реВ LLaMA, Alpaca, Vicuna, рд░ Koala, рд╕рд╛рдереИ рдкреВрд░реНрдг рд░реВрдкрдорд╛ рдЦреБрд▓рд╛ рд╕реНрд░реЛрдд рдкрд╣рд▓рд╣рд░реВ Pythia, OpenChatKit, Open Assistant, рд░ Dolly рд╕рдорд╛рд╡реЗрд╢ рдЫрдиреНред

рдердк рд░реВрдкрдорд╛, рдореЗрд╕рд┐рди рд▓рд░реНрдирд┐рдЩрд╕рдБрдЧ рд╕рдореНрдмрдиреНрдзрд┐рдд рдзреЗрд░реИ рдирдпрд╛рдБ рдкрд░рд┐рдпреЛрдЬрдирд╛рд╣рд░реВ рдЫрдиреН:

  • MiniGPT-4 - рдХреНрд╖рдорддрд╛рд╣рд░реВрд╕рдБрдЧ рдкрд░рдореНрдкрд░рд╛рдЧрдд рдХреБрд░рд╛рдХрд╛рдиреАрддреНрдордХ рдЪреНрдпрд╛рдЯрдмрдЯрд╣рд░реВ рд╡рд┐рд╕реНрддрд╛рд░ рдЧрд░реНрджрдЫ рдЬреБрди рджреГрд╢реНрдп рдЬрд╛рдирдХрд╛рд░реАрд▓рд╛рдИ рдЦрд╛рддрд╛рдорд╛ рд▓рд┐рдиреНрдЫ, рдЬрд╕рд▓реЗ рддрдкрд╛рдИрдВрд▓рд╛рдИ рдЫрд╡рд┐рд╣рд░реВ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдЧрд░реНрди рд░ рдкреНрд░рдгрд╛рд▓реАрд╕рдБрдЧ рдЕрдиреНрддрд░рдХреНрд░рд┐рдпрд╛ рдЧрд░реНрдиреЗ рдкреНрд░рдХреНрд░рд┐рдпрд╛рдорд╛ рд╣рд╕реНрддрд▓рд┐рдЦрд┐рдд рдкрд╛рдард▓рд╛рдИ рдЦрд╛рддрд╛рдорд╛ рд▓рд┐рди рдЕрдиреБрдорддрд┐ рджрд┐рдиреНрдЫ (рдЙрджрд╛рд╣рд░рдгрдХрд╛ рд▓рд╛рдЧрд┐, рддрдкрд╛рдЗрдБ рдХреБрди рдкреНрд░рдХрд╛рд░рдХреЛ рд╡рд╕реНрддреБ рджреЗрдЦрд╛рдЗрдПрдХреЛ рдЫ рднрдиреЗрд░ рд╕реЛрдзреНрди рд╕рдХреНрдиреБрд╣реБрдиреНрдЫред рддрд╕реНрдмрд┐рд░рдорд╛, рдмрдЯрд▓рд╛рдИ рдлреЛрдЯреЛрдорд╛ рджреЗрдЦрд╛рдЗрдПрдХреЛ рдХреБрд░рд╛рдорд╛ рдЖрдзрд╛рд░рд┐рдд рдХрдерд╛ рд▓реЗрдЦреНрди рд╕реЛрдзреНрдиреБрд╣реЛрд╕реН, рд╡рд╛ рдпреЛрдЬрдирд╛рдмрджреНрдз рд╕реНрдХреЗрдЪрдорд╛ рдЖрдзрд╛рд░рд┐рдд, рд╡реЗрдмрд╕рд╛рдЗрдЯ рд╕рд┐рд░реНрдЬрдирд╛ рдЧрд░реНрди рд╕реЛрдзреНрдиреБрд╣реЛрд╕реН)ред MiniGPT-4 рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдкрд╛рдЗрдердирдорд╛ рд▓реЗрдЦрд┐рдПрдХреЛ рдЫ рд░ BSD рдЗрдЬрд╛рдЬрддрдкрддреНрд░ рдЕрдиреНрддрд░реНрдЧрдд рд╡рд┐рддрд░рдг рдЧрд░рд┐рдПрдХреЛ рдЫред
  • Facebook рд▓реЗ рдПрдЙрдЯрд╛ рдЯреБрд▓рдХрд┐рдЯ рд░ рд╕реЗрд▓реНрдл-рд▓рд░реНрдирд┐рдЩ (SSL, Self-Spervised Learning, рдорд╛рдирд╡-рддрдпрд╛рд░ рд▓реЗрдмрд▓ рд░ рдПрдиреЛрдЯреЗрд╕рдирд╣рд░реВ рдкреНрд░рдпреЛрдЧ рдЧрд░реНрджреИрди) рдкреНрд░рдХрд╛рд╢рд┐рдд рдЧрд░реЗрдХреЛ рдЫ DINOv2 рдореЗрд╕рд┐рди рднрд┐рдЬрди рдореЛрдбреЗрд▓ рд╕рд╛рдорд╛рдиреНрдпреАрдХреГрдд рднрд┐рдЬреБрдЕрд▓ рдбрд╛рдЯрд╛ рдкреНрд░реЛрд╕реЗрд╕рд┐рдЩ (рдЫрд╡рд┐ рд╡рд░реНрдЧреАрдХрд░рдг, рд╡рд╕реНрддреБрд╣рд░реВрдХреЛ рдмрд╛рд░реЗрдорд╛ рдЬрд╛рдирдХрд╛рд░реА рдирд┐рдХрд╛рд▓реНрдиреЗ) рдХреЛ рд╕рдорд╕реНрдпрд╛рд╣рд░реВ рд╕рдорд╛рдзрд╛рди рдЧрд░реНрдирдХрд╛ рд▓рд╛рдЧрд┐ рдЙрдкрдпреБрдХреНрддред рдЫрд╡рд┐рд╣рд░реВ, рднрд┐рдбрд┐рдпреЛрдорд╛ рдХреЗ рднрдЗрд░рд╣реЗрдХреЛ рдЫ рднрдиреЗрд░ рдмреБрдЭреНрдиреЗ) рд░ рдкрд┐рдХреНрд╕реЗрд▓ рд╕реНрддрд░рдорд╛ рд╣реЗрд░рдлреЗрд░ (рдЧрд╣рд┐рд░рд╛рдЗ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА, рд╡рд┐рднрд╛рдЬрди)ред рдореЛрдбреЗрд▓ 142 рдорд┐рд▓рд┐рдпрди рдЫрд╡рд┐рд╣рд░реВрдХреЛ рд╕рдВрдЧреНрд░рд╣рдорд╛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдЫред рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдкрд╛рдЗрдердирдорд╛ рд▓реЗрдЦрд┐рдПрдХреЛ рдЫ рд░ рдХреНрд░рд┐рдПрдЯрд┐рдн рдХрдордиреНрд╕ рдПрдЯреНрд░рд┐рдмреНрдпреБрд╕рди-рдирди рдХрдорд░реНрд╢рд┐рдпрд▓ 4.0 рдЗрдЬрд╛рдЬрддрдкрддреНрд░ рдЕрдиреНрддрд░реНрдЧрдд рд╡рд┐рддрд░рдг рдЧрд░рд┐рдПрдХреЛ рдЫ рдЬрд╕рд▓реЗ рдЧреИрд░-рд╡реНрдпрд╛рд╡рд╕рд╛рдпрд┐рдХ рдкреНрд░рдпреЛрдЧрд▓рд╛рдИ рдЕрдиреБрдорддрд┐ рджрд┐рдиреНрдЫред
  • GPT4All рдЪрд╛рдБрдбреИ рдЖрдлреНрдиреИ рд╣рд╛рд░реНрдбрд╡реЗрдпрд░рдорд╛ рд╕реНрдЯреНрдпрд╛рдиреНрдб-рдЕрд▓реЛрди рдЪреНрдпрд╛рдЯрдмрдЯрд╣рд░реВ рд╕реБрд░реВ рдЧрд░реНрдирдХрд╛ рд▓рд╛рдЧрд┐ рдПрдЙрдЯрд╛ рдЯреБрд▓рдХрд┐рдЯ рд╣реЛ (рддрд┐рдиреАрд╣рд░реВрд▓реЗ рдмрд╛рд╣реНрдп рд╕реЗрд╡рд╛рд╣рд░реВ рдкрд╣реБрдБрдЪ рдЧрд░реНрджреИрдирдиреН рд░ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдЧрд░реНрди AVX2 рд╕рдорд░реНрдердирдХреЛ рд╕рд╛рде CPU рд╣рд░реВ рдкреНрд░рдпреЛрдЧ рдЧрд░реНрдЫрдиреН)ред GPT-J рд░ LLaMa рдорд╛ рдЖрдзрд╛рд░рд┐рдд рдареВрд▓рд╛ рднрд╛рд╖рд╛ рдореЛрдбреЗрд▓рд╣рд░реВ рдЬрдбрд╛рди рдЧрд░реНрди рд╕рдорд░реНрдерд┐рдд рдЫред рдХреЛрдб Python рдорд╛ рд▓реЗрдЦрд┐рдПрдХреЛ рдЫ рд░ MIT рд▓рд╛рдЗрд╕реЗрдиреНрд╕ рдЕрдиреНрддрд░реНрдЧрдд рд╡рд┐рддрд░рд┐рддред

рд╕реНрд░реЛрдд: opennet.ru

рдПрдХ рдЯрд┐рдкреНрдкрдгреА рдердкреНрди