苹果12月14日释放了一个名为Ferret的多模态大语言模型,该模型不仅可以准确识别图像并描述其内容。 同时它还能够识别和定位图像中的各种元素,无论你用怎样的方式描述图像内容,Ferret都能准确地在图像中找到并识别出来。
作者: Tarogo Cloud
Midjourney
这就是它的样子。 从版本 1 到版本 6 的对比
苹果公司已经和多家主要出版商达成协议
苹果公司的目标,是和这些主要出版商达成多年合作协议,目前已经和康泰纳仕(Condé Nast)、NBC 新闻和 IAC 接洽。
苹果希望人工智能(AI)能够直接在其硬件上运行
这一举措被视为苹果努力赶上 AI 领域竞争对手并有望复兴智能手机市场的努力。
Marigold深度估计效果非常好!
最棒的是检查点和代码完全可用于商业用途!
AppAgent:让AI模仿人类在手机上操作APP
AppAgent可以通过自主学习和模仿人类的点击和滑动手势,能够在手机上执行各种任务。
部署一个Gemini机器人:
部署很简单,教你们3分钟部署一个
Apple 刚刚开发出一项人工智能突破
此外,来自 Google、ChatGPT、Gemini、Dictionary、Lightricks、Anthropic、Chevrolet、GPT-Engineer 在 AI 方面取得了巨大进展。
在MS-Word和GoogleDocs中安装ChatGPT
打开 MS Word,点击 "Add-ins."("加载项")
视频展示了如何微调 Mixtral
该视频演练简单易懂,并使用 QLoRA,因此您不需要 A100
一个开源模型声称击败了 ChatGPT 3.5 和 Grok。
新版 OpenChat-3.5 这是您可以使用和更改的免费人工智能世界中的一件大事。 它甚至比 ChatGPT 和 Grok 等其他知名人工智能模型做得更好
苹果公司隆重推出🫂HUGS:
Human Gaussian Splats - 能够在大约 30 分钟内从休闲视频(50-100 帧)创建可动画 (3DGS) 头像。创作者的化身可以轻松嵌入到其他(NeRF)场景中。
比尔·盖茨对2024年人工智能做出了大胆预测
最值得注意的是,盖茨相信人工智能将通过个性化辅导来改变教育。 2024 年对于人工智能来说将是疯狂的一年。
这个人工智能模型将改变整个医疗行业。
MedLM 帮助 HCA Healthcare 等医疗系统自动记录急诊室就诊情况。 它获取医患会面的记录,并将其拆分成医疗服务提供者说明的组成部分。
Runway文字转语音功能正式发布
可以用来给生成的视频创建画外音和对话,支持细腻真实的人声效果,多种语言!
DomoAI推出了视频转视频功能。
任何人都可以将视频转换成不同的风格。 最有创意、最有趣的通常是动漫或8-bit游戏风格。