🤖 wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,支持ChatGPT多轮对话能力,还可能是首个支持脑机交互的开源智能音箱项目。
wukong-robot 是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,目的是让中国的 Maker 和 Haker 们也能快速打造个性化的智能音箱。wukong-robot 还可能是第一个开源的脑机唤醒智能音箱。
截至 2023 年 3 月 31 日,wukong-robot 的安装设备数已超过 13,000 台,唤醒次数累积超过了 700,000 次。
wukong-robot 的功能还在不断更新迭代中,详见 更新说明 。
wukong-robot 的工作模式:
wukong-robot 被唤醒后,用户的语音指令先经过 ASR 引擎进行 ASR 识别成文本,然后对识别到的文本进行 NLU 解析,再将解析结果进行技能匹配,交给适合处理该指令的技能插件去处理。插件处理完成后,得到的结果再交给 TTS 引擎合成成语音,播放给用户。
虽然一次交互可能包含多次网络请求,不过带来的好处是:每一个环节都可以被修改和定制。而且我认为,到了 5G 时代,音箱的响应速度将不再成为体验问题。可定制和个性化才是未来的主流,而届时 wukong-robot 将会是更好的选择!
wukong-robot 只支持 Python >= 3.7 且 < 3.10 ,不支持 Python 2.x 。
wukong-robot 支持运行在以下的设备和系统中:
python3 wukong.py update
如果提示升级失败,可以尝试在 wukong-robot 的根目录手动执行以下命令,看看问题出在哪。
git pull
pip3 install -r requirements.txt
python3 wukong.py
建议在 tmux 或 supervisor 中执行。
第一次启动时将提示你是否要到用户目录下创建一个配置文件,输入 y
即可。
然后通过唤醒词 “snowboy” 唤醒 wukong-robot 进行交互(该唤醒词可自定义)。
此外,wukong-robot 默认在运行期间还会启动一个后台管理端,提供了远程对话、查看修改配置、查看 log 等能力。
建议正式使用时修改用户名和密码,以免泄漏隐私。
参考配置文件的注释进行配置即可。注意不建议直接修改 default.yml 里的内容,否则会给后续通过 git pull
更新带来麻烦。你应该拷贝一份放到 $HOME/.wukong/config.yml
中,或者在运行的时候按照提示让 wukong-robot 为你完成这件事。
tips:不论使用哪个厂商的API,都建议注册并填上自己注册的应用信息,而不要用默认的配置。这是因为这些API都有使用频率和并发数限制,过多人同时使用会影响服务质量。
wukong-robot 的后台接口是开放 Web API 的,可以使用 Restful 方式调用,见 后台API。
您的捐赠将鼓励我继续完善 wukong-robot。
支付宝 | 微信支付 |
---|---|
如果以上的图裂了,可以下载图片(支付宝 | 微信)到本地进行扫描。
如果使用本项目的代码或插件,请引用本项目。
@misc{wukong-robot,
author = {潘伟洲},
title = {wukong-robot,一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目},
year = {2019},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/wzpan/wukong-robot}},
}
使用 QQ 扫码加入:
支付宝 | 微信支付 |
---|---|
如果以上的图裂了,可以下载图片(支付宝 | 微信)到本地进行扫描。