MetaMotivo:基于物理的仿人代理行为模型解析
Meta Motivo 是由 Meta 的 FAIR(Facebook AI Research)团队开发的行为基础模型,旨在控制虚拟的基于物理的仿人代理,使其能够执行各种全身任务。
AI news tracing site
Meta Motivo 是由 Meta 的 FAIR(Facebook AI Research)团队开发的行为基础模型,旨在控制虚拟的基于物理的仿人代理,使其能够执行各种全身任务。
Meta 发布了一个通过Llama从 PDF 文件生成播客的引导式教程
NotebookLlama 是一套用于从 PDF 文件生成播客的引导式教程,结合了文本到语音(TTS)模型的应用,旨在帮助用户轻松构建一个完整的 PDF 到播客的工作流程。
谷歌计划预览人工智能技术,该技术将接管网络浏览器以完成研究和购物等任务。据知情人士透露,谷歌计划最早于今年12月发布其下一代旗舰 Gemini 大型语言模型来展示该产品,该项目代号为“Project Jarvis”。这些计划只是暂定的,可能会有所改变。该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本
YouTube 正在测试一项新功能,允许创作者使用人工智能“重新设计”其短视频中的授权歌曲。获得访问权限的小部分创作者可以输入提示词来更改歌曲中的不同元素,例如情绪或流派。而 Dream Track AI 功能扩展将生成重新制作的30秒配乐。
Meta 的 Quest 3 头显即将迎来一款名为 Layout 的新应用,允许用户测量空间、可视化家具摆放,甚至调整图片水平。该应用是 v68 更新的一部分,允许用户虚拟放置电视等物体,以查看它们是否合适。
LlamaFS 是一个自组织文件管理器。它会根据文件的内容和众所周知的约定(例如时间)自动重命名和组织文件。它支持多种文件,甚至图像(通过 Moondream)和音频(通过 Whisper)。
LlamaFS 以两种“模式”运行 – 作为批处理作业(批处理模式)和交互式守护进程(监视模式)。
@ICepfl 和 @YaleMed 的研究人员联手构建了 Meditron,这是一款适用于资源匮乏的医疗环境的 LLM 套件。借助 Llama 3,他们的新模型在 MedQA 和 MedMCQA 等基准测试中优于其参数类别中的大多数开放模型。
它还提供了更高的GEMM和SIMD顶点操作速度,以及更大的本地和片上内存容量和带宽。
此外,Meta还开发了一个大型机架系统,可容纳多达72个加速器,以及一个全新的软件堆栈,与PyTorch 2.0完全集成,支持高效的模型和内核代码生成。
首次发布的是 Llama 3 系列中的两款参数分别为 8B 和 70B 的模型。
最大参数的 400+ B 的模型还在开发中,预计几个月内发布。
模型是基于光级数据构建的 Relightable Hands 的高保真通用先验。它概括为新颖的观点、姿势、身份和照明,从而可以通过手机扫描进行快速个性化
基于 Llama2,从头开始训练。
许可 – 开源。
优化在 CPU 上运行。 🔥
高度可控,可选择节奏、和弦进行、小节范围等等!
通过根据给定的文本提示、和弦序列、旋律线索、音乐主题或形式等条件。
ChatMusician能自动生成结构完整、风格多样的音乐作品。
包括单声部旋律、和声编配,乃至完整的乐曲结构设计。
同时它还能理解和分析音乐理论的各个方面。