AI巨头
MetaMotivo:基于物理的仿人代理行为模型解析
Meta Motivo 是由 Meta 的 FAIR(Facebook AI Research)团队开发的行为基础模型,旨在控制虚拟的基于物理的仿人代理,使其能够执行各种全身任务。
WanX 2.1 – 阿里巴巴先进视频生成模型
WanX 2.1 是由阿里巴巴通义万相团队开发的前沿视频生成模型,代表了 AI 驱动视觉内容创作的重大突破。它不仅支持高质量的文本到视频和图像到视频生成,还在物理模拟、多语言支持和视觉一致性方面表现出色。通过其开源计划,WanX 2.1 将为全球开发者提供强大的工具,助力创意内容生产、教育培训、娱乐和营销等多个领域的应用创新。
Google Whisk:革新图像生成的全新工具
Google Whisk 是一款创新的图像生成工具,用户无需输入复杂的文本提示,只需上传参考图片,即可快速生成符合预期的图像。
该工具结合了 Gemini 和 Imagen 3 模型,提供直观且高效的创作体验,适用于多种创作需求。
ChatGPT的几个工具
ChatGPT 搜索插件:增强 ChatGPT 的信息获取能力,提供实时搜索功能,让 AI 回答更准确、最新。适用于需要实时信息或深入研究的用户。
Telegram GPT Worker:将 ChatGPT 集成到 Telegram,支持自动回复、任务处理、智能对话,适合个人和企业用户,提升沟通效率。
ChatGPT for WhatsApp:让 ChatGPT 在 WhatsApp 上提供智能对话服务,可用于自动客服、智能问答,提升聊天体验,适用于个人助手和商业用途。
新版Claude 3.5 Sonnet将可进行电脑操作
Anthropic宣布了升级版 Claude 3.5 Sonnet,以及新模型Haiku。新版在各方面都比前代有显著提升,尤其是在编码方面,这一领域它本来就处于领先地位。
Claude API 还将支持电脑操作,并已进入公共测试阶段。
華爾街對DeepSeek的衝擊有不同解讀
美股人工智能概念爆發小股災,英偉達狂瀉近17%收市,市值蒸發5,890億美元,是美股史上單日最多;多隻晶片股跌幅雙位數,納斯達克指數坐挫3%。資金擁向周期股以及與AI關聯較少的股份,道瓊斯指數倒升近300點收市。中國的生成AI模型DeepSeek開放與公眾使用,震撼科技界及華爾街
NotebookLlama介绍
Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程
NotebookLlama 是一套用于从 PDF 文件生成播客的引导式教程,结合了文本到语音(TTS)模型的应用,旨在帮助用户轻松构建一个完整的 PDF 到播客的工作流程。
谷歌年底将预览接管个人电脑的人工智能
谷歌计划预览人工智能技术,该技术将接管网络浏览器以完成研究和购物等任务。据知情人士透露,谷歌计划最早于今年12月发布其下一代旗舰 Gemini 大型语言模型来展示该产品,该项目代号为“Project Jarvis”。这些计划只是暂定的,可能会有所改变。该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本
Instagram 新增AI 扩图工具
YouTube 正在测试一项新功能,允许创作者使用人工智能“重新设计”其短视频中的授权歌曲。获得访问权限的小部分创作者可以输入提示词来更改歌曲中的不同元素,例如情绪或流派。而 Dream Track AI 功能扩展将生成重新制作的30秒配乐。