提供了将 2D 图像和视频快速转换为 3D 内容的工具,使用其独特的神经深度引擎生成精确的深度图,从而实现逼真的 3D 效果。 LeiaSR™是一个可以将2D显示转换为3D显示的技术平台,帮助观看者体验身临其境的感觉,就像他们是场景的一部分一样。 LeiaSR™...
分类: AI行业应用
Google 开发出一个能够达到人类业余水平的乒乓球机器人
DeepMind的工程师团队开发了一款能够打业余水平乒乓球的机器人。该机器人的核心硬件基于ABB IRB 1100机械臂,这款机械臂以其高速度和高精度著称,广泛应用于工业场景。通过结合了先进的机器人技术和人工智能,能够执行快速且有策略的乒乓球动作。 ...
AI视频剪辑软件:Kurisu
AI视频剪辑 一个靠口头描述来转换文件格式的程序。 字面意思,就是口述。 例如,你拖动或者上传了一份mp4,然后你只需在输入框内描述你想干的内容。 像是“转成webm”“只保留视频第10秒到20秒之间的内容”“提取音频文件”“将视频倒放”这类。 然后点击按钮们等待进度条完成就行。...
电装公司研发出自动采摘番茄的机器人
电装公司研发出自动采摘小番茄的机器人,已开始在欧洲接受订单。研发中运用了迄今制造汽车零件所培养的图像识别与安全行驶技术。在欧洲,人口减少带来的劳动力短缺和工资上涨成为问题,预计对自动化的需求将增长。5月开始接受订单以来,各方的咨询相继而来,目前也正讨论在日本国内发售。 ...
ChatGPT API SRT 字幕翻译器
此工具采用OpenAI ChatGPT API进行文本翻译,专注于行对行翻译,特别用于SRT字幕。通过去除SRT文件的额外开销并将文本分批处理,优化了令牌使用,确保输入和输出行数一致。支持Web...
Pikimov视频编辑器
Pikimov 是一款基于Web 的应用程序,允许用户创建和编辑各种媒体类型,包括图像、视频、音频和3D 模型。 它为运动设计提供了基于图层的合成系统和关键帧动画系统。 该应用程序与Windows、macOS 和Linux 操作系统兼容,无需任何安装。...
海绵音乐
海绵音乐是由字节跳动最新推出的免费AI音乐创作和分享平台,旨在利用人工智能技术生成个性化音乐,海绵音乐在人声处理方面表现优异,尤其是在中文歌曲中,减少了电音的使用,提高了吐字清晰度和演唱流畅性。相比较Suno,海绵音乐的音乐风格更符合国人的喜好。
MindSearch 是一个开源的 AI 搜索引擎框架
MindSearch是由上海人工智能实验室开发的一个基于大语言模型(LLM)和搜索引擎相结合的系统,旨在模仿人类在网络上寻找和整合信息的过程。性能可与 Perplexity.ai Pro 相媲美,能够处理超过 300 个网页的长上下文信息。而且是开源的,你可以轻松用它部署来构建您自己的搜索引擎。
Canva 收购 Leonardo.ai,提升生成式 AI 能力
Canva 已收购澳大利亚 AI 初创公司 Leonardo.ai,获得了其文本转图像和文本转视频生成器的访问权限。此举加强了 Canva 在生成式 AI 市场的地位,有可能挑战 Adobe 的主导地位。 Leonardo.ai 的技术将被整合到 Canva 的 Magic Studio...
SeekAll插件发布两周时间
这是一个让你能够一键同时向多个AI提问的完全免费浏览器插件。 目前支持了新标签页打开和新窗口打开两种模式, 还在开发浏览器侧边栏,能够让你在新标签页打开时垂直查看打开的多个标签页,估计下周能发布。
CLASI :字节跳动开发的端到端语音同步翻译系统
CLASI是由字节跳动开发的一个高质量的同时语音翻译系统,类似于专业的人类译员。它能实时翻译语音内容,保持高翻译质量和低延迟。CLASI利用先进的数据策略和多模态检索技术来处理复杂的术语和不清晰的语音信息。 ...
Vozo:AI视频生成器
Vozo Rewrite & Redub 是一款创新的视频编辑工具,你可以通过简单的提示重写视频脚本、然后这个工具会自动给视频重新配音、翻译语音并口型同步,然后生成新的视频。 无论是将经典视频转变为病毒视频宣传片,还是将普通视频变成喜剧,亦或是将一种语言翻译成多种语言,Vozo...
Udio进行重大升级,大幅提升音乐音质和控制
大部分新功能需要订阅标准版才可以用,目前的定价是 10 美元/月 AI...
OpenAI测试AI搜索功能SearchGPT
SearchGPT目前只是临时的原型,计划未来将新功能中最佳的那些直接融入ChatGPT。OpenAI将首先只对一小部分用户和发行商开放SearchGPT,从中获取反馈。 OpenAI并未在官网透露具体将接纳多少测试者。不过,OpenAI的发言人Kayla...
RoboflowSports :跟踪检测和识别运动员行为
RoboflowSports是一个使用深度学习模型检测和识别运动员行为分析的工具。它通过检测和分割运动员和足球等对象,为体育数据分析提供了强大的工具。 ...
SpeechGPT2:一个端到端的语音对话语言模型
它能够感知和表达情感,并根据上下文和人类指令提供多种风格的语音响应,如说唱、戏剧、机器人、搞笑和低语等。 超过10万小时的学术和野外收集的语音数据, 涵盖了丰富的语音场景和风格。 SpeechGPT2...