Google Whisk:革新图像生成的全新工具
Google Whisk 是一款创新的图像生成工具,用户无需输入复杂的文本提示,只需上传参考图片,即可快速生成符合预期的图像。
该工具结合了 Gemini 和 Imagen 3 模型,提供直观且高效的创作体验,适用于多种创作需求。
Google Whisk 是一款创新的图像生成工具,用户无需输入复杂的文本提示,只需上传参考图片,即可快速生成符合预期的图像。
该工具结合了 Gemini 和 Imagen 3 模型,提供直观且高效的创作体验,适用于多种创作需求。
ChatGPT 搜索插件:增强 ChatGPT 的信息获取能力,提供实时搜索功能,让 AI 回答更准确、最新。适用于需要实时信息或深入研究的用户。
Telegram GPT Worker:将 ChatGPT 集成到 Telegram,支持自动回复、任务处理、智能对话,适合个人和企业用户,提升沟通效率。
ChatGPT for WhatsApp:让 ChatGPT 在 WhatsApp 上提供智能对话服务,可用于自动客服、智能问答,提升聊天体验,适用于个人助手和商业用途。
Anthropic宣布了升级版 Claude 3.5 Sonnet,以及新模型Haiku。新版在各方面都比前代有显著提升,尤其是在编码方面,这一领域它本来就处于领先地位。
Claude API 还将支持电脑操作,并已进入公共测试阶段。
美股人工智能概念爆發小股災,英偉達狂瀉近17%收市,市值蒸發5,890億美元,是美股史上單日最多;多隻晶片股跌幅雙位數,納斯達克指數坐挫3%。資金擁向周期股以及與AI關聯較少的股份,道瓊斯指數倒升近300點收市。中國的生成AI模型DeepSeek開放與公眾使用,震撼科技界及華爾街
Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程
NotebookLlama 是一套用于从 PDF 文件生成播客的引导式教程,结合了文本到语音(TTS)模型的应用,旨在帮助用户轻松构建一个完整的 PDF 到播客的工作流程。
谷歌计划预览人工智能技术,该技术将接管网络浏览器以完成研究和购物等任务。据知情人士透露,谷歌计划最早于今年12月发布其下一代旗舰 Gemini 大型语言模型来展示该产品,该项目代号为“Project Jarvis”。这些计划只是暂定的,可能会有所改变。该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本
YouTube 正在测试一项新功能,允许创作者使用人工智能“重新设计”其短视频中的授权歌曲。获得访问权限的小部分创作者可以输入提示词来更改歌曲中的不同元素,例如情绪或流派。而 Dream Track AI 功能扩展将生成重新制作的30秒配乐。
Cloudflare推出了一个新的开发工具:Workflows。的持久执行引擎,目前已进入公开测试阶段。这项工具让开发者可以使用Cloudflare Workers创建稳定、可扩展的多步骤应用。通过自动重试、状态持久化和扩展等功能,简化了多步骤应用的构建。