几个开源AI项目一览
Ebook2Audiobook开源项目
将电子书自动转换为有声书 支持语音克隆、多种语言
ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆和章节信息的生成。该项目结合了 Calibre(电子书转换工具)和 Coqui XTTS(文本转语音引擎),通过简单的命令或Web界面完成转换,方便用户将他们的电子书转换为音频文件,适合日常听书需求或个性化有声书制作。
Github:https://github.com/DrewThomasson/ebook2audiobookXTTS
Hertz-dev:首个会话音频开源模型
全双工实时语音交互 120毫秒超低延迟
Hertz-dev 是由 Standard Intelligence 公司开发的首个会话音频开源模型。hertz-dev 是一个全双工、仅支持音频的 Transformer 基础模型。
它的主要功能是用于生成对话音频,也就是模拟人类对话的语音生成。支持全双工音频,它可以同时接收和生成音频,就像电话或实时对话一样,不需要等待说完一句话才能回复。
GitHub:https://github.com/Standard-Intelligence/hertz-dev
软件名称:小宾AI抠图
软件功能:AI图像处理
支持平台:Windows
软件简介:一款免费的开源AI图像处理工具,主要功能包括一键抠图、证件照制作和图片格式转换。
可以通过拖拽、粘贴图片或链接的方式进行单张或批量抠图。能够高效地处理各种格式的图片,包括jpg、png、gif、webp和bmp。
还可以利用该软件制作符合不同规格的证件照,并进行二次编辑。
原文:https://matting.20133075.xyz/
网站功能:AI 头像动起来
网站名称:Discopixel
网站简介:一款利用人工智能技术提供有趣的面部动画和视频贺卡服务。
只需上传一张照片,并分享一些有趣的事实,就能生成个性化的音乐视频。
网站目前正在准备下一次发布,可以加入候补名单。