免费开通网站,seo网络推广培训班,wordpress标签数量,集团企业网站建设方案Fay数字人助理
Fay数字人助理版是fay开源项目的重要分支#xff0c;专注于构建智能数字助理的开源解决方案。它提供了灵活的模块化设计#xff0c;使开发人员能够定制和组合各种功能模块#xff0c;包括情绪分析、NLP处理、语音合成和语音输出等。Fay数字人助理版为开发人员…Fay数字人助理
Fay数字人助理版是fay开源项目的重要分支专注于构建智能数字助理的开源解决方案。它提供了灵活的模块化设计使开发人员能够定制和组合各种功能模块包括情绪分析、NLP处理、语音合成和语音输出等。Fay数字人助理版为开发人员提供了强大的工具和资源用于构建智能、个性化和多功能的数字助理应用。通过该版本开发人员可以轻松创建适用于各种场景和领域的数字人助理为用户提供智能化的语音交互和个性化服务。
推荐玩法
灵聚NLP api(支持GPT3.5及多应用)Fay数字人集成灵聚NLP api(支持GPT3.5及多应用)_哔哩哔哩_bilibili
集成本地唇型算法fay数字人助理更新本地唇型算法发布含新版UE5工程示例_哔哩哔哩_bilibili
给数字人加上眼睛集成yoloVisualGLM)B站视频
给Fay加上本地免费语音识别达摩院funaar: 给Fay加上本地免费语音识别达摩院funaar_哔哩哔哩_bilibili
消费级pc大模型ChatGLM-6B的基础上前置Rasa会话管理动手给faygithub数字人开源项目加上rasa及chatglm兼顾实时、可控、记忆及大模型的生成能力_哔哩哔哩_bilibili
UE5工程https://github.com/xszyou/fay-ue5
真人视频三维重建NeRFhttps://github.com/waityousea/xuniren
Fay数字人助理版
注带货版移到分支fay-sales-edition 助理版Fay控制器使用语音沟通语音和文字回复文字沟通文字回复。
PC远程助理 PC demo
手机远程助理 android demo
与数字形象通讯非必须,控制器需要关闭“面板播放”
控制器与采用 WebSocket 方式与 UE 通讯 下载工程: 百度网盘 请输入提取码
下载windows运行包: 百度网盘 请输入提取码 工程https://github.com/xszyou/fay-ue5
重要
Fay服务端与数字人的通讯接口: ws://127.0.0.1:10002已接通
消息格式: 查看 WebSocket.md
与远程音频输入输出设备连接非必须,外网需要配置http://ngrok.cc tcp通道的clientid
控制器与采用 socket(非websocket) 方式与 音频输出设备通讯
内网通讯地址: ws://127.0.0.1:10001
外网通讯地址: 通过http://ngrok.cc获取有伙伴愿意赞助服务器给社区免费使用吗 消息格式: 参考 remote_audio.py
二、Fay控制器核心逻辑 注
以上每个模块可轻易替换成自家核心产品。
目录结构
.
├── main.py # 程序主入口
├── fay_booter.py # 核心启动模块
├── config.json # 控制器配置文件
├── system.conf # 系统配置文件
├── ai_module
│ ├── ali_nls.py # 阿里云 实时语音
│ ├── ms_tts_sdk.py # 微软 文本转语音
│ ├── nlp_lingju.py # 灵聚 人机交互-自然语言处理
│ ├── xf_aiui.py # 讯飞 人机交互-自然语言处理
│ ├── nlp_gpt.py # gpt api对接
│ ├── nlp_chatgpt.py # chat.openai.com逆向对接
│ ├── nlp_yuan.py # 浪潮.源大模型对接
│ ├── nlp_rasa.py # ChatGLM-6B的基础上前置Rasa会话管理(强烈推荐)
│ ├── nlp_VisualGLM.py # 对接多模态大语言模型VisualGLM-6B
│ ├── yolov8.py # yolov8资态识别
│ └── xf_ltp.py # 讯飞 情感分析
├── bin # 可执行文件目录
├── core # 数字人核心
│ ├── fay_core.py # 数字人核心模块
│ ├── recorder.py # 录音器
│ ├── tts_voice.py # 语音生源枚举
│ ├── authorize_tb.py # fay.db认证表管理
│ ├── content_db.py # fay.db内容表管理
│ ├── interact.py # 互动消息对象
│ ├── song_player.py # 音乐播放暂不可用
│ └── wsa_server.py # WebSocket 服务端
├── gui # 图形界面
│ ├── flask_server.py # Flask 服务端
│ ├── static
│ ├── templates
│ └── window.py # 窗口模块
├── scheduler
│ └── thread_manager.py # 调度管理器
├── utils # 工具模块├── config_util.py ├── storer.py└── util.py
└── test # 都是惊喜三、升级日志
2023.07.12
修复助理版文字输入不读取人设回复问题修复助理版文字输入不读取qa回复问题增强麦克风接入稳定性。
2023.07.05
修复无法运行唇型算法而导致的不播放声音问题。
2023.06.28
重构NLP模块管理逻辑便于自由扩展gpt拆分为ChatGPT及GPT、更换新的GPT接口、可单独配置代理服务器指定yolov8包版本解决yolo不兼容问题修复自言自语bug、接收多个待处理消息bug。
2023.06.21
集成灵聚NLP api(支持GPT3.5及多应用)ui修正。
2023.06.17
集成本地唇型算法。
2023.06.14
解决多声道麦克风兼容问题重构fay_core.py及fay_booter.py代码ui适应布局调整恢复声音选择”思考中...“显示逻辑修复。
2023.05.27
修复多个bug消息框换行及空格问题、语音识别优化彩蛋转正Fay沟通与ChatGPT并行加入yolov8姿态识别加入VisualGLM-6B多模态单机离线大语言模型。
2023.05.12
打出Fay数字人助理版作为主分支带货版移到分支fay-sales-edition添加Fay助理的文字沟通窗口文字与语音同步添加沟通记录本地保存功能升级ChatGLM-6B的应用逻辑长文本与语音回复分离。
四、安装说明
环境
Python 3.9、3.10Windows、macos、linux
安装依赖
pip install -r requirements.txt
配置应用密钥
查看 AI 模块浏览链接注册并创建应用将应用密钥填入 ./system.conf 中
启动
启动Fay控制器
python main.py
AI 模块
启动前需填入应用密钥
代码模块描述链接./ai_module/ali_nls.py实时语音识别非必须免费3个月,asr二选一实时语音识别_语音转文字_实时会议记录_人工智能-阿里云./ai_module/funasr.py达摩院开源免费本地asr 非必须asr二选一fay/test/funasr/README.MD./ai_module/ms_tts_sdk.py微软 文本转情绪语音非必须不配置时使用免费的edge-tts文本转语音 – 真实 AI 语音生成器 | Microsoft Azure./ai_module/xf_ltp.py讯飞 情感分析情感分析 - 自然语言处理 - 讯飞开放平台./utils/ngrok_util.pyngrok.cc 外网穿透可选http://ngrok.cc./ai_module/nlp_lingju.py灵聚NLP api(支持GPT3.5及多应用)NLP多选1https://open.lingju.ai 需联系客服务开通gpt3.5权限./ai_module/yuan_1_0.py浪潮源大模型NLP 多选1源1.0-超大规模预训练模型-浪潮信息./ai_module/chatgpt.pyChatGPTNLP多选1*******./ai_module/nlp_rasa.pyChatGLM-6B的基础上前置Rasa会话管理NLP 多选1动手给faygithub数字人开源项目加上rasa及chatglm兼顾实时、可控、记忆及大模型的生成能力_哔哩哔哩_bilibili./ai_module/nlp_VisualGLM.py对接VisualGLM-6B多模态单机离线大语言模型NLP 多选1B站视频
五、使用说明
使用说明
语音助理fay控制器麦克风输入源开启、面板播放开启远程语音助理fay控制器面板播放关闭 远程设备接入数字人互动fay控制器麦克风输入源开启、面板播放关闭、填写性格QA 数字人贾维斯、Her加入我们一起完成。
语音指令
关闭核心静音取消静音关闭、再见、你走吧静音、闭嘴、我想静静取消静音、你在哪呢、你可以说话了
播放歌曲(音乐库暂不可用)暂停播放更多播放歌曲、播放音乐、唱首歌、放首歌、听音乐、你会唱歌吗暂停播放、别唱了、我不想听了没有了...
人设
数字人属性与用户交互中能做出相应的响应。
交互灵敏度
在交互中数字人能感受用户的情感并作出反应。最直的体现就是语气的变化如 开心/伤心/生气 等。 设置灵敏度可改变用户情感对于数字人的影响程度。
接收来源
文本输入
通过沟通窗口与助理文本沟通
麦克风
选择麦克风设备实现面对面交互成为你的伙伴
socket远程音频输入
可以接入远程音频输入远程音频输出
相关文章
1、集成消费级pc大模型ChatGLM-6B的基础上前置Rasa会话管理动手给faygithub数字人开源项目加上rasa及chatglm兼顾实时、可控、记忆及大模型的生成能力_哔哩哔哩_bilibili
2、(34条消息) 非常全面的数字人解决方案_郭泽斌之心的博客-CSDN博客_数字人算法
3、【开源项目数字人FAY——Fay新架构使用讲解】 开源项目数字人FAY——Fay新架构使用讲解_哔哩哔哩_bilibili
4、【开源项目FAY——UE工程讲解】Faygithub数字人开源项目UE工程讲解_哔哩哔哩_bilibili
5、m1机器安装办法Gason提供MacBook Pro m1版本怎么安装python 的pyqt5 - 知乎
6、bilbil主页xszyou的个人空间_哔哩哔哩_bilibili
商务联系QQ 467665317我们提供开发顾问、数字人模型定制及高校教学资源实施服务 开源做到底周边赚外快 - fay数字人 - 雅恒论坛 - Powered by Discuz!
关注公众号(fay数字人)获取最新微信技术交流群二维码请先star本仓库