可控人物影像產生旨在產生以參考影像為條件的人物影像,從而允許精確控制人物的外觀或姿勢。然而,現有方法儘管實現了較高的整體影像質量,但通常會扭曲參考影像的細粒度紋理細節。我們將這些扭曲歸因於對參考影像中相應區域的關注不夠
分类: 多媒体处理
将照片即时转换为卡通和动画艺术风格的人工智能工具
网站简介:一款可以将照片即时转换为卡通和动画艺术风格的人工智能工具。 只需上传一张照片,网站的AI技术会迅速将其转换为一个个性化的《海贼王》动漫角色。
Claude iOS 和 Android App 迎来新界面
新增分析工具,支持编写和运行JavaScript代码以处理和分析CSV文件数据 Anthropic 今日上线了全新的 Claude AI 内置工具,可以编写和运行 JavaScript 代码,处理数据、进行分析并生成洞察。
Power-over-Skin “皮肤供电”技术
现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体积,并且需要定期充电和移除设备。 为了解决这些问题,卡内基梅隆大学的研究人员提出了通过人体传输能量的“皮肤供电”技术。 ...
几个开源AI项目一览
Ebook2Audiobook开源项目 将电子书自动转换为有声书 支持语音克隆、多种语言 Hertz-dev:首个会话音频开源模型 小宾AI抠图 AI 头像动起来
PDF2Audio
将 PDF 文件转换为播客、讲座、摘要等音频内容 PDF2Audio 是一个开源项目,旨在将 PDF 文件转换为音频格式,如播客、讲座或摘要。该项目利用 OpenAI 的 GPT 模型进行文本生成和文本转语音(TTS)转换。用户可以上传多个 PDF...
詹姆斯·厄尔·琼斯的达斯·维德声音通过人工智能得以延续
配音演员从中看到了希望和危险 在长达六十多年的演艺生涯中,詹姆斯·厄尔·琼斯的声音成为他作为表演者作品中不可磨灭的一部分。 琼斯于周一去世,享年 93 岁。在银幕上,琼斯在《梦想之地》中再现了一位隐居的作家,在《梦想之地》中重新回到聚光灯下,在《来到美国》中再现了一位虚构土地上傲慢的国王。
WechatFerry:一个开源微信机器人框架
助你轻松开发微信聊天机器人 WechatFerry 是一个微信机器人框架,提供了一套强大、快速且可定制的解决方案,适用于开发和集成微信机器人。为开发微信机器人的用户提供了 SDK 封装和多种插件,能够轻松调用微信的相关功能,适用于需要与微信进行交互的自动化任务。此项目包含多个组件和插件模块
Audible 推出 AI 语音复制功能
Audible 即将推出新功能,邀请在美国的精选朗读员创建其声音的 AI 生成复制品,以丰富其有声书产品。此举旨在满足日益增长的音频内容需求,因为许多书籍仍未以这种格式提供。参与者将提交语音样本,Audible 将将其转化为高质量的复制品,作者可以在有声书创作交易所 (ACX)...
Storybooks玩具变故事书
一个在线插图工具,帮助作者、教育工作者和创意家长快速为儿童书籍创建插图。 可以使用先进的生成式AI模型,如Imagen、Stable Diffusion、DALL-E等,轻松地在几分钟内完成插图工作。...
xAI 的 Grok 现在可以在 X 上生成图像
xAI 的 Grok AI 模型现在可以在 X 社交网络上生成图像,尽管 Grok 访问目前仅限于 X 上的 Premium 和 Premium+ 用户。 示例图像下方的文字提示表明,Grok正在使用 Black Forest Labs 的 FLUX.1...
PS2 Filter AI-AI一键图片转游戏怀旧风
PS2 Filter AI 是一个在线平台,它利用人工智能的力量将您的照片和图像转换为 PlayStation 2 时代的标志性视觉风格。它再现了 2000 年代早期视频游戏的低多边形模型、像素化纹理、独特的照明和整体怀旧感,让您的照片具有独特的复古游戏美感
网站名称:Immersity AI
提供了将 2D 图像和视频快速转换为 3D 内容的工具,使用其独特的神经深度引擎生成精确的深度图,从而实现逼真的 3D 效果。 LeiaSR™是一个可以将2D显示转换为3D显示的技术平台,帮助观看者体验身临其境的感觉,就像他们是场景的一部分一样。 LeiaSR™...
AI视频剪辑软件:Kurisu
AI视频剪辑 一个靠口头描述来转换文件格式的程序。 字面意思,就是口述。 例如,你拖动或者上传了一份mp4,然后你只需在输入框内描述你想干的内容。 像是“转成webm”“只保留视频第10秒到20秒之间的内容”“提取音频文件”“将视频倒放”这类。 然后点击按钮们等待进度条完成就行。...
ChatGPT API SRT 字幕翻译器
此工具采用OpenAI ChatGPT API进行文本翻译,专注于行对行翻译,特别用于SRT字幕。通过去除SRT文件的额外开销并将文本分批处理,优化了令牌使用,确保输入和输出行数一致。支持Web...
Pikimov视频编辑器
Pikimov 是一款基于Web 的应用程序,允许用户创建和编辑各种媒体类型,包括图像、视频、音频和3D 模型。 它为运动设计提供了基于图层的合成系统和关键帧动画系统。 该应用程序与Windows、macOS 和Linux 操作系统兼容,无需任何安装。...