OpenChatKit

聊天机器人工具套件
授权协议 Apache 2.0
开发语言 Python
所属分类 神经网络/人工智能、 自然语言处理
软件类型 开源软件
地区 不详
投 递 者 支劲
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。

OpenChatKit 工具包包括一个指令调优的200亿参数语言模型、一个60亿参数调节模型和一个可扩展的检索系统,该检索系统用于包含来自自定义存储库的最新响应。它接受了OIG-43 M训练数据集的训练

OpenChatKit 包含以下代码:

  • 训练 OpenChatKit 模型
  • 使用模型测试推理
  • 使用来自检索索引的额外上下文来扩充模型

要求

在开始之前,需要安装 PyTorch 和其他依赖项。

  1. 安装Miniconda 
  2. 使用此存储库根目录下的 environment.yml 文件创建名为OpenChatKit的环境。
conda env create -f environment.yml

这个 repo 也使用 Git LFS 来管理一些文件,安装然后运行:

git lfs install

预训练权重

GPT-NeoXT-Chat-Base-20B 是 GPT-NeoX 的 20B 参数变体,在会话数据集上进行了微调。

可以在 Huggingface 上的GPT-NeoXT-Chat-Base-20B模型卡上找到更多详细信息。

数据集

聊天模型是在由LAION TogetherOntocord.ai构建的OIG数据集上训练的

要从 Huggingface 下载数据集,请从存储库的根目录运行以下命令。

python data/OIG/prepare.py

命令完成后,数据将位于data/OIG/files目录中。

数据贡献

通过贡献数据来帮助改进此聊天模型!有关详细信息,请参阅OpenDataHub存储库。

预训练基础模型

如上所述,聊天模型是 Eleuther AI 的 GPT-NeoX-20B 的微调变体。要下载 GPT-NeoX-20B 并准备好进行微调,请从存储库的根目录运行此命令。

python pretrained/GPT-NeoX-20B/prepare.py

该模型的权重在pretrained/GPT-NeoX-20B/EleutherAI_gpt-neox-20b

  • OpenChatKit  原文链接:GitHub - togethercomputer/OpenChatKit OpenChatKit是一个由前OpenAI研究员共同打造的开源聊天机器人平台。它包含了训练好的大型语言模型、定制配方和可扩展的检索系统,可以帮助用户快速构建高精度、多功能的聊天机器人应用。 其中,最核心的组件是一个经过微调的、具有200亿参数的语言模型——GPT-NeoXT-Chat-

  • OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。该套件包括一个指令调整的 200 亿参数语言模型、一个 60 亿参数调节模型和一个可扩展的检索系统,用于包含来自自定义存储库的最新响应。它是在 OIG-43M 训练数据集上训练的,该数据集是 Together、LAION 和 Ontocord.ai 之间的合作。这不仅仅是一个模型发布,这是一个开源项目的开

 相关资料
  • 译者:毛毛虫 作者: Matthew Inkawhich 在本教程中,我们探索了一个好玩和有趣的循环序列到序列的模型用例。我们将用 Cornell Movie-Dialogs Corpus处的电影剧本来训练一个简单的聊天机器人。 在人工智能研究领域中对话模型模型是一个非常热门的话题。聊天机器人可以在各种设置中找到,包括客户服务应用和在线帮助。这些机器人通常由基于检索的模型提供支持,这些输出是某些形

  • 本文向大家介绍Python QQBot库的QQ聊天机器人,包括了Python QQBot库的QQ聊天机器人的使用技巧和注意事项,需要的朋友参考一下 本文实例为大家分享了Python QQBot库的QQ聊天机器人的具体代码,供大家参考,具体内容如下 项目地址:https://github.com/pandolia/qqbot 1.安装 2.主动发出消息 3.根据事件回复消息 首先我们需要在命令行启动

  • 本文向大家介绍Python如何实现机器人聊天,包括了Python如何实现机器人聊天的使用技巧和注意事项,需要的朋友参考一下 今天午休的时候,无意之中看了一篇博客,名字叫Python实现机器人,感觉挺有的意思的。 于是用其写了一个简单的Python聊天,源码如下所示: 注意:如果出现某某模块找不到的时候,记得使用pip安装对应的模块。 效果图如下所示: 唯一美中不足的是英文,不过没关系,国内有图灵机

  • 聊天机器人是可行的 我:chatbot,你好! chatbot:你也好! 我:聊天机器人可行吗? chatbot:你不要怀疑这是天方夜谭,我不就在这里吗?世界上还有很多跟我一样聪明的机器人呢,你听过IBM公司在2010年就研发出来了的Watson问答系统吗?它可比我要聪明100倍呢 我:噢,想起来了,据说Watson在智力竞赛中竟然战胜了人类选手。但是我了解到它有一些缺陷:因为它还只是对信息检索技

  • 智能机器人可以做到的事情可以很复杂:文字、语音、视频识别与合成;自然语言理解、人机对话;以及驱动硬件设备形成的“机器”人。作为一个只有技术和时间而没有金钱的IT人士,我仅做自然语言和人工智能相关的内容,不涉及硬件,也不涉及不擅长的多媒体识别和合成。所以索性就做一个可以和你说话,帮你解决问题的聊天机器人吧。

  • 我已经创建了一个信使聊天机器人与烧瓶,pyMessenger和wit.ai. 我想添加facebook提供的模板(如按钮,添加图像和声音媒体)(https://developers.facebook.com/docs/messenger-platform/reference/template/button/) 有一些使用curl和json的东西我不明白。有人能帮助我吗?我应该把这些代码片段放在py

  • 我已经使用C#创建了一个电报机器人,我想看看谁在发送消息时使用我的机器人。 我可以在私人聊天中获取人们向我的机器人发送消息的用户名,但在组中,我无法获取使用机器人的用户名它返回GroupName。 我用的方法是

  • 我正在用电传制作电报机器人。 群聊消息以/开头时使用处理程序。 有没有办法获取所有群聊消息?