ఓపెన్చాట్కిట్ ఓపెన్ సోర్స్ టూల్కిట్ అందించబడింది, ప్రత్యేక మరియు సాధారణ ఉపయోగం కోసం చాట్బాట్ల సృష్టిని సరళీకృతం చేయడం లక్ష్యంగా పెట్టుకుంది. ప్రశ్నలకు సమాధానమివ్వడం, బహుళ-దశల సంభాషణలు నిర్వహించడం, సంగ్రహించడం, సమాచారాన్ని సంగ్రహించడం మరియు వచనాన్ని వర్గీకరించడం వంటి పనులను నిర్వహించడానికి సిస్టమ్ అనుకూలీకరించబడింది. కోడ్ పైథాన్లో వ్రాయబడింది మరియు Apache 2.0 లైసెన్స్ క్రింద పంపిణీ చేయబడింది. ప్రాజెక్ట్లో రెడీమేడ్ మోడల్, మీ మోడల్కు శిక్షణ ఇవ్వడానికి కోడ్, మోడల్ ఫలితాలను పరీక్షించడానికి యుటిలిటీలు, బాహ్య సూచిక నుండి సందర్భంతో మోడల్ను భర్తీ చేయడానికి మరియు మీ స్వంత సమస్యలను పరిష్కరించడానికి బేస్ మోడల్ను స్వీకరించడానికి సాధనాలు ఉన్నాయి.
బోట్ ప్రాథమిక మెషీన్ లెర్నింగ్ మోడల్ (GPT-NeoXT-Chat-Base-20B)పై ఆధారపడి ఉంటుంది, ఇది దాదాపు 20 బిలియన్ పారామీటర్లను కవర్ చేసే భాషా నమూనాను ఉపయోగించి నిర్మించబడింది మరియు సంభాషణ కమ్యూనికేషన్ కోసం ఆప్టిమైజ్ చేయబడింది. మోడల్కు శిక్షణ ఇవ్వడానికి, LAION, Together మరియు Ontocord.ai ప్రాజెక్ట్ సేకరణల నుండి పొందిన డేటా ఉపయోగించబడింది.
ఇప్పటికే ఉన్న నాలెడ్జ్ బేస్ను విస్తరించేందుకు, బాహ్య రిపోజిటరీలు, APIలు మరియు ఇతర మూలాధారాల నుండి అదనపు సమాచారాన్ని తిరిగి పొందగల వ్యవస్థ ప్రతిపాదించబడింది. ఉదాహరణకు, వికీపీడియా మరియు వార్తల ఫీడ్ల నుండి సమాచారాన్ని ఉపయోగించి సమాచారాన్ని నవీకరించడం సాధ్యమవుతుంది. అనుచితమైన ప్రశ్నలను ఫిల్టర్ చేయడానికి లేదా నిర్దిష్ట అంశాలకు చర్చలను పరిమితం చేయడానికి 6 బిలియన్ పారామీటర్లపై శిక్షణ పొంది GPT-JT మోడల్ ఆధారంగా ఐచ్ఛిక మోడరేషన్ మోడల్ అందుబాటులో ఉంది.
విడిగా, మేము ChatLLaMA ప్రాజెక్ట్ గురించి ప్రస్తావించవచ్చు, ఇది ChatGPT మాదిరిగానే తెలివైన సహాయకులను సృష్టించడానికి లైబ్రరీని అందిస్తుంది. ప్రాజెక్ట్ మీ స్వంత పరికరాలపై అమలు చేసే అవకాశాన్ని దృష్టిలో ఉంచుకుని అభివృద్ధి చేయబడుతోంది మరియు జ్ఞానం యొక్క ఇరుకైన ప్రాంతాలను (ఉదాహరణకు, ఔషధం, చట్టం, ఆటలు, శాస్త్రీయ పరిశోధన మొదలైనవి) కవర్ చేయడానికి రూపొందించిన వ్యక్తిగతీకరించిన పరిష్కారాలను రూపొందించడం జరిగింది. ChatLLaMA కోడ్ GPLv3 కింద లైసెన్స్ పొందింది.
మెటా ప్రతిపాదించిన LAMA (లార్జ్ లాంగ్వేజ్ మోడల్ మెటా AI) ఆర్కిటెక్చర్ ఆధారంగా మోడల్ల వినియోగానికి ప్రాజెక్ట్ మద్దతు ఇస్తుంది. పూర్తి LAMA మోడల్ 65 బిలియన్ పారామీటర్లను కవర్ చేస్తుంది, అయితే ChatLLaMA కోసం 7 మరియు 13 బిలియన్ పారామీటర్లు లేదా GPTJ (6 బిలియన్), GPTNeoX (1.3 బిలియన్), 20BOPT (13 బిలియన్), BLOOM (7.1 బిలియన్) మరియు గెలాక్టికా (6.7 బిలియన్) నమూనాలు ). ప్రారంభంలో, LAMA మోడల్లు ప్రత్యేక అభ్యర్థనపై పరిశోధకులకు మాత్రమే సరఫరా చేయబడ్డాయి, అయితే డేటాను అందించడానికి టోరెంట్లను ఉపయోగించారు కాబట్టి, ఔత్సాహికులు ఎవరైనా మోడల్ను డౌన్లోడ్ చేసుకోవడానికి అనుమతించే స్క్రిప్ట్ను సిద్ధం చేశారు.
మూలం: opennet.ru