xiaozhi-esp 32:一個基於LCP的聊天機器人。小智AI聊天機器人作為語音交互入口。它利用Qwen / DeepSeek等大型型號的AI能力,通過LCP協議實現多終端控制
這個項目 小智-esp 32 它是由「蝦哥」發起和維護的開源項目,運行在低成本ESPN 32系列晶片(例如ESPN 32-C3/S3/P4)上,打造語音交互AI聊天機器人
核心職能概述
- 線下喚醒實時對話
使用ESP-SR實現本地喚醒、上傳流語音識別(ASB)到雲大型語言模型(例如Qwen、DeepSeek)、接收LLM回復並通過TTC說話 - 多協議通信
支持Webocket或MQTT+ SDP處理遠程消息控制和設備交互 - 音頻處理
使用OPUS編解碼器提高語音傳輸效率 - 聲紋識別
可以區分多個人的聲音,實現身份互動。 - 顯示和交互
支持OLED/LCD顯示屏顯示錶情、電力等信息,以及相機攝影和圖像識別功能(已添加最新版本) - 超寬硬體兼容性
經驗證可支持70+ ESP32開發板,包括S3、P4系列以及各種屏幕、通信模塊、傳感模塊等。 - LCP協議控制智能硬體
它可以通過LCP控制音量、燈光、電機、MPI等外設,還可以通過雲命令控制PC、智能家居等。 - 多語言支持
兼容中文、英文、日文等語言,適合全球用戶
最新進展
- v1.7.6(2025年6月24日)
添加LCP作為默認協議,支持相機拍照,優化內存,支持更多單板平台。 - 社區正在不斷擴大,例如UNIHIKER K10、Waveshare、M5 Stack、DeepSeek等設備的支持,有些還實現了家庭助理改編。
使用
- 直接刷實體:GitHub或xiaozhi.me為公用板提供預編譯的bin。用戶只需配置Wi-Fi即可體驗基本功能。
- 自己編寫:搭建ESP-IDF環境(Linux推薦),調整sdkconfig,選擇適用的固件版本(如bread、ml307等),自己編輯並刻錄。
- 高級開發:您可以根據文檔添加新的硬體定製板,也可以通過HCP實現新的功能擴展。
適合人群
- DIY愛好者和創客社區
- 想要將大語言模型帶入智能硬體的學生或創新者
- 有語音交互、邊緣推理和遠程控制需求的開發人員
總體而言,xiaozhi-esp 32是一個高度集成、社區活躍、功能豐富的開源項目,適合喜歡手工製作並想要實現人工智慧功能的開發人員進行深入探索。
Github:https://github.com/78/xiaozhi-esp32
輸油管:
英文版的YouTube居間: