几个开源AI项目一览

無人告訴您的令人震驚的電子書轉換技巧

Watch this video on YouTube

Ebook2Audiobook开源项目

将电子书自动转换为有声书支持语音克隆、多种语言

ebook2audiobookXTTS 是一个开源项目，旨在将电子书自动转换为有声书，并支持多种语言、语音克隆和章节信息的生成。该项目结合了 Calibre（电子书转换工具）和 Coqui XTTS（文本转语音引擎），通过简单的命令或Web界面完成转换，方便用户将他们的电子书转换为音频文件，适合日常听书需求或个性化有声书制作。

Github：https://github.com/DrewThomasson/ebook2audiobookXTTS

Hertz-dev：首个会话音频开源模型

全双工实时语音交互 120毫秒超低延迟

Hertz-dev 是由 Standard Intelligence 公司开发的首个会话音频开源模型。hertz-dev 是一个全双工、仅支持音频的 Transformer 基础模型。

它的主要功能是用于生成对话音频，也就是模拟人类对话的语音生成。支持全双工音频，它可以同时接收和生成音频，就像电话或实时对话一样，不需要等待说完一句话才能回复。

GitHub：https://github.com/Standard-Intelligence/hertz-dev

软件名称：小宾AI抠图

软件功能：AI图像处理

支持平台：Windows
软件简介：一款免费的开源AI图像处理工具，主要功能包括一键抠图、证件照制作和图片格式转换。

可以通过拖拽、粘贴图片或链接的方式进行单张或批量抠图。能够高效地处理各种格式的图片，包括jpg、png、gif、webp和bmp。

还可以利用该软件制作符合不同规格的证件照，并进行二次编辑。

原文：https://matting.20133075.xyz/

网站功能：AI 头像动起来

网站名称：Discopixel
网站简介：一款利用人工智能技术提供有趣的面部动画和视频贺卡服务。
只需上传一张照片，并分享一些有趣的事实，就能生成个性化的音乐视频。
网站目前正在准备下一次发布，可以加入候补名单。

原文：https://discopixel.app/

油管：https://youtu.be/Fmf8l_zDig0

几个开源AI项目一览

Ebook2Audiobook开源项目

Hertz-dev：首个会话音频开源模型

软件名称：小宾AI抠图

网站功能：AI 头像动起来

ETF与ETF联接的区别

什么是凉霸

GitHub的AI 开源项目精选-1

鱼要炸多久

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email

Ebook2Audiobook开源项目

Hertz-dev：首个会话音频开源模型

软件名称：小宾AI抠图

网站功能：AI 头像动起来

分享此文：

ETF与ETF联接的区别

什么是凉霸

GitHub的AI 开源项目精选-1

鱼要炸多久

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email