AI行业应用

AI行业应用, AI项目, 开源项目, 文档AI

Ebook2Audiobook开源项目

将电子书自动转换为有声书 支持语音克隆、多种语言
ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆和章节信息的生成。该项目结合了 Calibre(电子书转换工具)和 Coqui XTTS(文本转语音引擎),通过简单的命令或Web界面完成转换

AI行业应用, 机器人

D-ID推出了两款新数字人工具

AI视频平台D-ID推出了两款新型数字人工具—Express和Premium+,专为内容创作设计,旨在让企业在市场营销、销售和客户支持等领域应用更逼真的虚拟人。Express虚拟人只需一分钟视频训练即可生成,能够同步用户头部的运动;而Premium+虚拟人需要更长的视频进行训练

AI巨头, AI资讯, AI项目, Nvdia

華爾街對DeepSeek的衝擊有不同解讀

美股人工智能概念爆發小股災,英偉達狂瀉近17%收市,市值蒸發5,890億美元,是美股史上單日最多;多隻晶片股跌幅雙位數,納斯達克指數坐挫3%。資金擁向周期股以及與AI關聯較少的股份,道瓊斯指數倒升近300點收市。中國的生成AI模型DeepSeek開放與公眾使用,震撼科技界及華爾街

AI行业应用, AI项目, 开源项目, 机器人

Ultralight-Digital-Human数字人模型

支持在移动设备上实时运行的超轻量级数字人模型
Ultralight-Digital-Human 是一个创新的开源项目,使得数字人在移动设备上的实时应用成为可能,旨在实现超轻量级的数字人模型,其能够在移动设备上实时运行。
支持在移动设备上实时运行的超轻量级数字人模型
提供了详细的训练和推理步骤

AI巨头, AI资讯, AI项目, Meta

Instagram 新增AI 扩图工具

YouTube 正在测试一项新功能,允许创作者使用人工智能“重新设计”其短视频中的授权歌曲。获得访问权限的小部分创作者可以输入提示词来更改歌曲中的不同元素,例如情绪或流派。而 Dream Track AI 功能扩展将生成重新制作的30秒配乐。

AI巨头, AI资讯, AI项目

Cloudflare新的开发工具Workflows

Cloudflare推出了一个新的开发工具:Workflows。的持久执行引擎,目前已进入公开测试阶段。这项工具让开发者可以使用Cloudflare Workers创建稳定、可扩展的多步骤应用。通过自动重试、状态持久化和扩展等功能,简化了多步骤应用的构建。

Adobe, AI巨头, AI资讯, AI项目, Apple

苹果研究院质疑AI推理

研究员Mehrdad Farajtabar等人发表的论文对大型语言模型(LLM)的推理能力提出质疑,认为LLM所谓的“推理”能力实际上只是复杂的模式匹配,并非真正的逻辑推理。
研究团队开发了GSM-Symbolic工具,基于GSM8K测试集生成符号模板,发现目前的LLM如Llama、Phi、Gemma、Mistral 等开源模型

AI巨头, MicroSoft

微軟透過語音和視覺增強其人工智慧助手

微軟發布了 Copilot 聊天機器人的更新版本,該機器人可以進行語音對話和解釋影像。
執行副總裁兼執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)在介紹升級後的聊天機器人的部落格文章中表示:「Copilot 將在您身邊,在您的角落,在您身邊,並始終與您的利益保持緊密一致。

AI行业应用, AI资讯, AI项目, 机器人

生物混合游泳機器人使用運動神經元和心肌細胞來模擬肌肉組織

來自美國布萊根婦女醫院和瑞士 iPrint 研究所的生物研究人員和機器人專家組成的聯合團隊,利用人類運動神經元和心肌細胞來模擬肌肉組織,開發了微型游泳機器人。

他們的論文發表在《科學機器人》雜誌。科羅拉多大學博爾德分校的機械工程師Nicole Xu 在同一期期刊上發表了一篇焦點文章

退出移动版