发布 OpenChatKit,一个用于构建聊天机器人的工具包

引入了 OpenChatKit 开放工具包,旨在简化专门和通用应用程序的聊天机器人的创建。 该系统适用于执行诸如回答问题、进行多阶段对话、总结、提取信息、分类文本等任务。 代码是用 Python 编写的,并在 Apache 2.0 许可下分发。 该项目包括一个现成的模型、用于训练模型的代码、用于测试模型结果的实用程序、用于使用外部索引的上下文补充模型以及调整基础模型以解决您自己的问题的工具。

该机器人基于基本的机器学习模型 (GPT-NeoXT-Chat-Base-20B),使用覆盖约 20 亿个参数的语言模型构建,并针对会话通信进行了优化。 该模型使用从 LAION、Together 和 Ontocord.ai 项目的集合中获得的数据进行训练。

为了扩展现有的知识库,提出了一个能够从外部存储库、API 和其他来源提取附加信息的系统。 例如,可以使用来自维基百科和新闻提要的数据来更新信息。 此外,还提供了一个基于 GPT-JT 模型的审核模型,该模型使用 6 亿个参数进行训练,旨在过滤不适当的问题或将讨论限制在特定主题内。

另外,我们可以注意到 ChatLLaMA 项目,它提供了一个用于创建类似于 ChatGPT 的智能助手的库。 该项目的开发着眼于在自己的设备上运行的可能性,并创建旨在涵盖狭窄知识领域(例如医学、法律、游戏、科学研究等)的个性化解决方案。 ChatLLaMA 代码根据 GPLv3 获得许可。

该项目支持使用基于 Meta 提出的 LLaMA(大型语言模型元人工智能)架构的模型。 完整的 LLaMA 模型涵盖 65 亿个参数,但对于 ChatLLaMA,建议使用具有 7 个和 13 亿个参数的变体或 GPTJ(6 亿)、GPTNeoX(1.3 亿)、20BOPT(13 亿)、BLOOM(7.1 亿)和卡拉狄加(6.7 亿)型号)。 最初,LLaMA 模型仅根据特殊要求提供给研究人员,但由于使用种子来传输数据,爱好者们准备了一个脚本,允许任何人下载该模型。

来源: opennet.ru

添加评论