LAION-communityn (Large-scale Artificial Intelligence Open Network), som utvecklar verktyg, modeller och datasamlingar för att skapa maskininlärningssystem med öppen källkod (till exempel används LAION-samlingen för att träna modeller för bildsyntessystemet Stable Diffusion), har presenterat den första versionen av Open-Assistant-projektet, som utvecklar en chatbot med artificiell intelligens som kan förstå och besvara frågor på naturligt språk, interagera med tredjepartssystem och dynamiskt extrahera nödvändig information.
Projektkoden är skriven i Python och distribueras under Apache 2.0-licensen. OpenAssistants utvecklingar kan användas för att skapa egna intelligenta assistenter och dialogsystem som inte är knutna till externa API:er och tjänster. Vanlig konsumentutrustning räcker för lansering, till exempel kan den användas på en smartphone.
Förutom koden för träning och organisering av botens arbete på dess utrustning erbjuds en samling redan tränade färdiga modeller och en språkmodell tränad baserat på 600 tusen exempel på dialoger i form av en förfrågan-svar (instruktion-exekvering), utarbetad och granskad med deltagande av en gemenskap av entusiaster. En onlinetjänst för att bedöma kvaliteten på chatbotens arbete har också lanserats, som använder kunskapsmodellen OA_SFT_Llama_30B_6, som täcker 30 miljarder parametrar.
För att förbättra systemets effektivitet och undvika behovet av att lagra stora volymer fördefinierade parametrar, ger projektet möjlighet att använda en dynamiskt uppdaterad kunskapsbas som kan extrahera den information som krävs via sökmotorer eller externa tjänster. Till exempel, vid generering av svar kan boten få tillgång till externa API:er för att få ytterligare data. Bland de avancerade funktionerna noteras även stöd för personalisering, d.v.s. möjligheten att anpassa sig till en specifik användare baserat på deras tidigare fraser.
Projektet planerar inte att stanna vid att replikera ChatGPT:s funktioner. Det förväntas att Open-Assistant kommer att stimulera utvecklingen av öppen källkod inom innehållsgenerering och bearbetning av frågespråk i naturligt språk, precis som det öppna källkodsprojektet Stable Diffusion en gång stimulerade utvecklingen av bildgenereringsverktyg.
Källa: opennet.ru
