ಚಾಟ್‌ಬಾಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸಲು ಟೂಲ್‌ಕಿಟ್‌ ಆದ OpenChatKit ಅನ್ನು ಪ್ರಕಟಿಸಲಾಗಿದೆ

OpenChatKit ಓಪನ್ ಸೋರ್ಸ್ ಟೂಲ್‌ಕಿಟ್ ಅನ್ನು ಪ್ರಸ್ತುತಪಡಿಸಲಾಗಿದೆ, ವಿಶೇಷ ಮತ್ತು ಸಾಮಾನ್ಯ ಬಳಕೆಗಾಗಿ ಚಾಟ್‌ಬಾಟ್‌ಗಳ ರಚನೆಯನ್ನು ಸರಳಗೊಳಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ. ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸುವುದು, ಬಹು-ಹಂತದ ಸಂವಾದಗಳನ್ನು ನಡೆಸುವುದು, ಸಾರಾಂಶ, ಮಾಹಿತಿಯನ್ನು ಹೊರತೆಗೆಯುವುದು ಮತ್ತು ಪಠ್ಯವನ್ನು ವರ್ಗೀಕರಿಸುವಂತಹ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಲು ಸಿಸ್ಟಮ್ ಅನ್ನು ಅಳವಡಿಸಲಾಗಿದೆ. ಕೋಡ್ ಅನ್ನು ಪೈಥಾನ್‌ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಮತ್ತು ಅಪಾಚೆ 2.0 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗಿದೆ. ಯೋಜನೆಯು ಸಿದ್ಧ ಮಾದರಿಯನ್ನು ಒಳಗೊಂಡಿದೆ, ನಿಮ್ಮ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಕೋಡ್, ಮಾದರಿಯ ಫಲಿತಾಂಶಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಉಪಯುಕ್ತತೆಗಳು, ಬಾಹ್ಯ ಸೂಚ್ಯಂಕದಿಂದ ಸಂದರ್ಭದೊಂದಿಗೆ ಮಾದರಿಯನ್ನು ಪೂರಕಗೊಳಿಸುವ ಸಾಧನಗಳು ಮತ್ತು ನಿಮ್ಮ ಸ್ವಂತ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಲು ಮೂಲ ಮಾದರಿಯನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳುವುದು.

ಬೋಟ್ ಮೂಲಭೂತ ಯಂತ್ರ ಕಲಿಕೆ ಮಾದರಿಯನ್ನು ಆಧರಿಸಿದೆ (GPT-NeoXT-Chat-Base-20B), ಸುಮಾರು 20 ಶತಕೋಟಿ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಭಾಷಾ ಮಾದರಿಯನ್ನು ಬಳಸಿಕೊಂಡು ನಿರ್ಮಿಸಲಾಗಿದೆ ಮತ್ತು ಸಂಭಾಷಣೆಯ ಸಂವಹನಕ್ಕಾಗಿ ಹೊಂದುವಂತೆ ಮಾಡಲಾಗಿದೆ. ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು, LAION, ಟುಗೆದರ್ ಮತ್ತು Ontocord.ai ಪ್ರಾಜೆಕ್ಟ್ ಸಂಗ್ರಹಣೆಗಳಿಂದ ಪಡೆದ ಡೇಟಾವನ್ನು ಬಳಸಲಾಗಿದೆ.

ಅಸ್ತಿತ್ವದಲ್ಲಿರುವ ಜ್ಞಾನದ ನೆಲೆಯನ್ನು ವಿಸ್ತರಿಸಲು, ಬಾಹ್ಯ ರೆಪೊಸಿಟರಿಗಳು, API ಗಳು ಮತ್ತು ಇತರ ಮೂಲಗಳಿಂದ ಹೆಚ್ಚುವರಿ ಮಾಹಿತಿಯನ್ನು ಹಿಂಪಡೆಯುವ ವ್ಯವಸ್ಥೆಯನ್ನು ಪ್ರಸ್ತಾಪಿಸಲಾಗಿದೆ. ಉದಾಹರಣೆಗೆ, ವಿಕಿಪೀಡಿಯಾ ಮತ್ತು ಸುದ್ದಿ ಫೀಡ್‌ಗಳಿಂದ ಡೇಟಾವನ್ನು ಬಳಸಿಕೊಂಡು ಮಾಹಿತಿಯನ್ನು ನವೀಕರಿಸಲು ಸಾಧ್ಯವಿದೆ. ಸೂಕ್ತವಲ್ಲದ ಪ್ರಶ್ನೆಗಳನ್ನು ಫಿಲ್ಟರ್ ಮಾಡಲು ಅಥವಾ ನಿರ್ದಿಷ್ಟ ವಿಷಯಗಳಿಗೆ ಚರ್ಚೆಗಳನ್ನು ಸೀಮಿತಗೊಳಿಸಲು 6 ಬಿಲಿಯನ್ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ಮತ್ತು GPT-JT ಮಾದರಿಯನ್ನು ಆಧರಿಸಿ ಐಚ್ಛಿಕ ಮಾಡರೇಶನ್ ಮಾದರಿ ಲಭ್ಯವಿದೆ.

ಪ್ರತ್ಯೇಕವಾಗಿ, ನಾವು ChatLLaMA ಯೋಜನೆಯನ್ನು ಉಲ್ಲೇಖಿಸಬಹುದು, ಇದು ChatGPT ಯಂತೆಯೇ ಬುದ್ಧಿವಂತ ಸಹಾಯಕರನ್ನು ರಚಿಸಲು ಲೈಬ್ರರಿಯನ್ನು ನೀಡುತ್ತದೆ. ನಿಮ್ಮ ಸ್ವಂತ ಸಾಧನದಲ್ಲಿ ಚಾಲನೆಯಲ್ಲಿರುವ ಸಾಧ್ಯತೆಯನ್ನು ಗಮನದಲ್ಲಿಟ್ಟುಕೊಂಡು ಯೋಜನೆಯನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗುತ್ತಿದೆ ಮತ್ತು ಜ್ಞಾನದ ಕಿರಿದಾದ ಕ್ಷೇತ್ರಗಳನ್ನು (ಉದಾಹರಣೆಗೆ, ಔಷಧ, ಕಾನೂನು, ಆಟಗಳು, ವೈಜ್ಞಾನಿಕ ಸಂಶೋಧನೆ, ಇತ್ಯಾದಿ) ಒಳಗೊಳ್ಳಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ವೈಯಕ್ತಿಕಗೊಳಿಸಿದ ಪರಿಹಾರಗಳನ್ನು ರಚಿಸಲಾಗುತ್ತಿದೆ. ChatLLaMA ಕೋಡ್ GPLv3 ಅಡಿಯಲ್ಲಿ ಪರವಾನಗಿ ಪಡೆದಿದೆ.

ಯೋಜನೆಯು ಮೆಟಾ ಪ್ರಸ್ತಾಪಿಸಿದ LAMA (ದೊಡ್ಡ ಭಾಷೆಯ ಮಾದರಿ ಮೆಟಾ AI) ಆರ್ಕಿಟೆಕ್ಚರ್ ಆಧಾರಿತ ಮಾದರಿಗಳ ಬಳಕೆಯನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಪೂರ್ಣ LAMA ಮಾದರಿಯು 65 ಶತಕೋಟಿ ನಿಯತಾಂಕಗಳನ್ನು ಒಳಗೊಂಡಿದೆ, ಆದರೆ ChatLLaMA ಗಾಗಿ 7 ಮತ್ತು 13 ಶತಕೋಟಿ ನಿಯತಾಂಕಗಳೊಂದಿಗೆ ಅಥವಾ GPTJ (6 ಶತಕೋಟಿ), GPTNeoX (1.3 ಶತಕೋಟಿ), 20BOPT (13 ಶತಕೋಟಿ), BLOOM (7.1 ಶತಕೋಟಿ) ಮತ್ತು ಆಯ್ಕೆಗಳನ್ನು ಬಳಸಲು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ. ಗ್ಯಾಲಕ್ಟಿಕಾ (6.7 ಬಿಲಿಯನ್) ಮಾದರಿಗಳು ). ಆರಂಭದಲ್ಲಿ, ವಿಶೇಷ ಕೋರಿಕೆಯ ಮೇರೆಗೆ LAMA ಮಾದರಿಗಳನ್ನು ಸಂಶೋಧಕರಿಗೆ ಮಾತ್ರ ಸರಬರಾಜು ಮಾಡಲಾಗುತ್ತಿತ್ತು, ಆದರೆ ಡೇಟಾವನ್ನು ತಲುಪಿಸಲು ಟೊರೆಂಟ್‌ಗಳನ್ನು ಬಳಸಿದಾಗಿನಿಂದ, ಉತ್ಸಾಹಿಗಳು ಮಾದರಿಯನ್ನು ಡೌನ್‌ಲೋಡ್ ಮಾಡಲು ಅನುಮತಿಸುವ ಸ್ಕ್ರಿಪ್ಟ್ ಅನ್ನು ಸಿದ್ಧಪಡಿಸಿದರು.

ಮೂಲ: opennet.ru

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ