X-to-Voice:自动生成能说话的个人资料头像
ElevenLabs 发布了一个开源的小项目,X-to-Voice ,允许用户通过分析 Twitter 资料生成自定义的声音和头像。这个项目使用了 ElevenLabs 的新声音设计 API 和 Taedra 动态头像生成工具。
用户可以输入 Twitter 账号名称,系统将分析其资料数据生成特有的语音和动画头像。
ElevenLabs 发布了一个开源的小项目,X-to-Voice ,允许用户通过分析 Twitter 资料生成自定义的声音和头像。这个项目使用了 ElevenLabs 的新声音设计 API 和 Taedra 动态头像生成工具。
用户可以输入 Twitter 账号名称,系统将分析其资料数据生成特有的语音和动画头像。
该项目基于 OpenAI 的 Whisper 模型,并利用 FastAPI 的异步特性对其进行高效包装,支持异步任务队列,文件处理,网络爬虫,以及更多自定义功能。
「Fast-Powerful-Whisper-AI-Services-API 」的愿景是打造一个强大且开箱即用的 Whisper 服务 API
NoteGen 是一个跨平台的笔记 APP,目前支持 Mac、Windows、Linux
开源地址在视频下方的描述中
软件安装完毕后,请先在设置页面配置 API Key 后即可正常使用。
Mac 用户需要配置屏幕录制权限,才可以使用截图记录功能。
同步和图床功能(可选),需要创建 Github 仓库,并配置好密钥