EdgePersona是一個開源項目,旨在創建完全本地化的智能數字人類系統。該系統設計輕巧高效,硬體要求低,適合在普通筆記本電腦上運行,確保用戶隱私。
項目信息
EdgePersona的主要功能包括:
- 完全本地化操作:所有數據處理均在本地完成,無需網絡連接,確保數據隱私。
- 多模式交互:支持語音對話、表情控制和身體動作同步響應,實現自然的人機互動。
- 低硬體要求:在配備NVIDIA 3060圖形卡的筆記本電腦上進行實時測量。
- 深度角色定製:通過YML配置文件自定義角色、動作和聲音風格。
- 多種型號支持:兼容Olama、HuggingFace、GGUF等主流模型格式。
系統組件
EdgePersona的系統架構包括以下主要模塊:
- 語音識別(ASR):將用戶語音輸入轉換為文本。
- 語音活動檢測(VAR):識別語音的開頭和結尾,提高識別準確性。
- 大語言模型(LLM):處理文本輸入並生成響應內容。
- 文本轉語音(TTC):將文本響應轉換為語音輸出。
- 存儲器模塊:存儲和管理對話歷史記錄並實現上下文相關性。
- 機器人控制:管理數字人的表情和動作,以實現自然的互動體驗。
安裝和操作
環境要求:
- 英偉達圖形卡(建議VRAM = 6 GB)
- Python 3.11.11及以上版本
- 支持Windows、Linux和macOS(M系列晶片需要Metal加速)
安裝步驟:
-
克隆倉庫:
git克隆https://github.com/zc-maker/EdgePersona.git
-
安裝依賴關係:
pip安裝-r要求.文本
-
運行主程式:
python main.py
應用場景
EdgePersona適用於多種場景,包括:
- 個人助理:本地運行以保護用戶隱私的智能助理。
- 教育和培訓:創建互動教學角色以增強學習體驗。
- 娛樂和遊戲:開發具有個性化特徵的虛擬角色,以增強用戶參與度。
有關更多信息和詳細文檔,請訪問項目主頁:
Github:https://github.com/zc-maker/EdgePersona
輸油管: