EdgePersona打造完全离线的本地化智能数字人系统
EdgePersona 是一个开源项目,旨在创建一个完全本地化运行的智能数字人系统。该系统设计轻量高效,对硬件要求低,适合在普通笔记本电脑上运行,保障用户隐私。
项目简介
EdgePersona 的主要特点包括:
- 完全本地化运行:所有数据处理在本地完成,无需网络连接,确保数据隐私。
- 多模态交互:支持语音对话、表情控制和肢体动作同步响应,实现自然的人机交互。
- 低硬件要求:实测在配备 NVIDIA 3060 显卡的笔记本上即可实时运行。
- 角色深度定制:通过 YAML 配置文件自定义人物性格、动作和语音风格。
- 多模型支持:兼容 Ollama、HuggingFace、GGUF 等主流模型格式。
系统组件
EdgePersona 的系统架构包括以下主要模块:
- 语音识别(ASR):将用户语音输入转换为文本。
- 语音活动检测(VAD):识别语音的起始和结束,提高识别准确性。
- 大语言模型(LLM):处理文本输入,生成响应内容。
- 语音合成(TTS):将文本响应转换为语音输出。
- 记忆模块:存储和管理对话历史,实现上下文关联。
- 机器人控制:管理数字人的表情和动作,实现自然的交互体验。
安装与运行
环境要求:
- NVIDIA 显卡(建议 VRAM ≥ 6GB)
- Python 3.11.11 及以上版本
- 支持 Windows、Linux 和 macOS(M 系列芯片需启用 Metal 加速)
安装步骤:
-
克隆仓库:
git clone https://github.com/zc-maker/EdgePersona.git
-
安装依赖:
pip install -r requirements.txt
-
运行主程序:
python main.py
应用场景
EdgePersona 适用于多种场景,包括:
- 个人助理:在本地运行的智能助手,保障用户隐私。
- 教育和培训:创建交互式教学角色,提升学习体验。
- 娱乐和游戏:开发具有个性化特征的虚拟角色,增强用户参与感。
更多信息和详细文档,请访问项目主页: