几个开源AI项目一览
Ebook2Audiobook开源项目
将电子书自动转换为有声书 支持语音克隆、多种语言
Hertz-dev:首个会话音频开源模型
小宾AI抠图
AI 头像动起来
Ebook2Audiobook开源项目
将电子书自动转换为有声书 支持语音克隆、多种语言
Hertz-dev:首个会话音频开源模型
小宾AI抠图
AI 头像动起来
配音演员从中看到了希望和危险
在长达六十多年的演艺生涯中,詹姆斯·厄尔·琼斯的声音成为他作为表演者作品中不可磨灭的一部分。
琼斯于周一去世,享年 93 岁。在银幕上,琼斯在《梦想之地》中再现了一位隐居的作家,在《梦想之地》中重新回到聚光灯下,在《来到美国》中再现了一位虚构土地上傲慢的国王。
Audible 即将推出新功能,邀请在美国的精选朗读员创建其声音的 AI 生成复制品,以丰富其有声书产品。此举旨在满足日益增长的音频内容需求,因为许多书籍仍未以这种格式提供。参与者将提交语音样本,Audible 将将其转化为高质量的复制品,作者可以在有声书创作交易所 (ACX) 上选择这些复制品用于他们的有声书。
一个在线插图工具,帮助作者、教育工作者和创意家长快速为儿童书籍创建插图。
可以使用先进的生成式AI模型,如Imagen、Stable Diffusion、DALL-E等,轻松地在几分钟内完成插图工作。
插图作品可以导出到各种媒体,如印刷书籍、电子书、YouTube等,且所有图像都可商用,无需支付版权费用。
PS2 Filter AI 是一个在线平台,它利用人工智能的力量将您的照片和图像转换为 PlayStation 2 时代的标志性视觉风格。它再现了 2000 年代早期视频游戏的低多边形模型、像素化纹理、独特的照明和整体怀旧感,让您的照片具有独特的复古游戏美感
提供了将 2D 图像和视频快速转换为 3D 内容的工具,使用其独特的神经深度引擎生成精确的深度图,从而实现逼真的 3D 效果。
LeiaSR™是一个可以将2D显示转换为3D显示的技术平台,帮助观看者体验身临其境的感觉,就像他们是场景的一部分一样。
LeiaSR™ 结合了专利的可切换显示技术、先进的人工智能面部跟踪和内容转换。
LeiaSR™ 可在不影响原始显示质量的情况下实现令人惊叹的 3D 内容体验。它还与更广泛的 3D|XR 行业兼容。
AI视频剪辑
一个靠口头描述来转换文件格式的程序。
字面意思,就是口述。
例如,你拖动或者上传了一份mp4,然后你只需在输入框内描述你想干的内容。 像是“转成webm”“只保留视频第10秒到20秒之间的内容”“提取音频文件”“将视频倒放”这类。 然后点击按钮们等待进度条完成就行。 运用了ChatGPT和FFmpeg的对接。
Pikimov 是一款基于Web 的应用程序,允许用户创建和编辑各种媒体类型,包括图像、视频、音频和3D 模型。
它为运动设计提供了基于图层的合成系统和关键帧动画系统。
该应用程序与Windows、macOS 和Linux 操作系统兼容,无需任何安装。 所有用户文件都保留在本地计算机上,不会上传到服务器