OpenChatKit, చాట్‌బాట్‌లను సృష్టించే టూల్‌కిట్ ప్రచురించబడింది

ఓపెన్‌చాట్‌కిట్ ఓపెన్ సోర్స్ టూల్‌కిట్ అందించబడింది, ప్రత్యేక మరియు సాధారణ ఉపయోగం కోసం చాట్‌బాట్‌ల సృష్టిని సరళీకృతం చేయడం లక్ష్యంగా పెట్టుకుంది. ప్రశ్నలకు సమాధానమివ్వడం, బహుళ-దశల సంభాషణలు నిర్వహించడం, సంగ్రహించడం, సమాచారాన్ని సంగ్రహించడం మరియు వచనాన్ని వర్గీకరించడం వంటి పనులను నిర్వహించడానికి సిస్టమ్ అనుకూలీకరించబడింది. కోడ్ పైథాన్‌లో వ్రాయబడింది మరియు Apache 2.0 లైసెన్స్ క్రింద పంపిణీ చేయబడింది. ప్రాజెక్ట్‌లో రెడీమేడ్ మోడల్, మీ మోడల్‌కు శిక్షణ ఇవ్వడానికి కోడ్, మోడల్ ఫలితాలను పరీక్షించడానికి యుటిలిటీలు, బాహ్య సూచిక నుండి సందర్భంతో మోడల్‌ను భర్తీ చేయడానికి మరియు మీ స్వంత సమస్యలను పరిష్కరించడానికి బేస్ మోడల్‌ను స్వీకరించడానికి సాధనాలు ఉన్నాయి.

బోట్ ప్రాథమిక మెషీన్ లెర్నింగ్ మోడల్ (GPT-NeoXT-Chat-Base-20B)పై ఆధారపడి ఉంటుంది, ఇది దాదాపు 20 బిలియన్ పారామీటర్‌లను కవర్ చేసే భాషా నమూనాను ఉపయోగించి నిర్మించబడింది మరియు సంభాషణ కమ్యూనికేషన్ కోసం ఆప్టిమైజ్ చేయబడింది. మోడల్‌కు శిక్షణ ఇవ్వడానికి, LAION, Together మరియు Ontocord.ai ప్రాజెక్ట్ సేకరణల నుండి పొందిన డేటా ఉపయోగించబడింది.

ఇప్పటికే ఉన్న నాలెడ్జ్ బేస్‌ను విస్తరించేందుకు, బాహ్య రిపోజిటరీలు, APIలు మరియు ఇతర మూలాధారాల నుండి అదనపు సమాచారాన్ని తిరిగి పొందగల వ్యవస్థ ప్రతిపాదించబడింది. ఉదాహరణకు, వికీపీడియా మరియు వార్తల ఫీడ్‌ల నుండి సమాచారాన్ని ఉపయోగించి సమాచారాన్ని నవీకరించడం సాధ్యమవుతుంది. అనుచితమైన ప్రశ్నలను ఫిల్టర్ చేయడానికి లేదా నిర్దిష్ట అంశాలకు చర్చలను పరిమితం చేయడానికి 6 బిలియన్ పారామీటర్‌లపై శిక్షణ పొంది GPT-JT మోడల్ ఆధారంగా ఐచ్ఛిక మోడరేషన్ మోడల్ అందుబాటులో ఉంది.

విడిగా, మేము ChatLLaMA ప్రాజెక్ట్ గురించి ప్రస్తావించవచ్చు, ఇది ChatGPT మాదిరిగానే తెలివైన సహాయకులను సృష్టించడానికి లైబ్రరీని అందిస్తుంది. ప్రాజెక్ట్ మీ స్వంత పరికరాలపై అమలు చేసే అవకాశాన్ని దృష్టిలో ఉంచుకుని అభివృద్ధి చేయబడుతోంది మరియు జ్ఞానం యొక్క ఇరుకైన ప్రాంతాలను (ఉదాహరణకు, ఔషధం, చట్టం, ఆటలు, శాస్త్రీయ పరిశోధన మొదలైనవి) కవర్ చేయడానికి రూపొందించిన వ్యక్తిగతీకరించిన పరిష్కారాలను రూపొందించడం జరిగింది. ChatLLaMA కోడ్ GPLv3 కింద లైసెన్స్ పొందింది.

మెటా ప్రతిపాదించిన LAMA (లార్జ్ లాంగ్వేజ్ మోడల్ మెటా AI) ఆర్కిటెక్చర్ ఆధారంగా మోడల్‌ల వినియోగానికి ప్రాజెక్ట్ మద్దతు ఇస్తుంది. పూర్తి LAMA మోడల్ 65 బిలియన్ పారామీటర్‌లను కవర్ చేస్తుంది, అయితే ChatLLaMA కోసం 7 మరియు 13 బిలియన్ పారామీటర్‌లు లేదా GPTJ (6 బిలియన్), GPTNeoX (1.3 బిలియన్), 20BOPT (13 బిలియన్), BLOOM (7.1 బిలియన్) మరియు గెలాక్టికా (6.7 బిలియన్) నమూనాలు ). ప్రారంభంలో, LAMA మోడల్‌లు ప్రత్యేక అభ్యర్థనపై పరిశోధకులకు మాత్రమే సరఫరా చేయబడ్డాయి, అయితే డేటాను అందించడానికి టోరెంట్‌లను ఉపయోగించారు కాబట్టి, ఔత్సాహికులు ఎవరైనా మోడల్‌ను డౌన్‌లోడ్ చేసుకోవడానికి అనుమతించే స్క్రిప్ట్‌ను సిద్ధం చేశారు.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి