作者: Tarogo Cloud

清华大学研究人员提出 SPMamba

清华大学BNRist计算机科学与技术系的研究人员介绍了SPMamba,这是一种植根于SSM原理的新颖架构。通过引入平衡效率和效果的创新模型,围绕语音分离的讨论得到了丰富。 SSM 体现了这种平衡。通过巧妙地整合 CNN 和 RNN 的优势,SSM...

Google DeepMind 展示深度混合:

来自 Google DeepMind、麦吉尔大学和 Mila 的研究人员推出了一种突破性的方法,称为深度混合 (MoD),它不同于传统的统一资源分配模型。 MoD 使 Transformer...

斯坦福大学的研究人员推出 Octopus v2:

斯坦福大学的研究人员推出了 Octopus v2,这是一种先进的设备上语言模型,旨在解决与当前LLM应用程序相关的普遍存在的延迟、准确性和隐私问题。与之前的型号不同,Octopus v2...

Claude发布函数调用工具:Tool use

允许模型与外部系统和数据进行交互 使用Tool use (function calling)功能,Claude不仅能够生成文本或回答问题,还能实际调用外部定义的函数或工具来执行特定操作,如获取当前的天气信息、执行数学计算等。

Octopus-v2:可以在移动设备上运行的2B LLMs

Octopus-V2-2B是由斯坦福大学Nexa AI开发专为Android API的功能调用定制。 采用了一种独特的功能性标记策略,超越了基于RAG的方法,特别适用于边缘计算设备。 比Llama7B + RAG方案快36倍,性能优于 GPT-4,延迟时间小于 1 秒。

POM给Animatediff训练了三个MotionLora

WAS26:这个模型是在Banodoco Discord平台分享的艺术作品中挑选出来进行训练的。 Smoooth:专门针对那些动作流畅的视频进行训练。 LiquidAF:这个模型则是在液体模拟的基础上训练的

Meta 宣布推出 URHand

模型是基于光级数据构建的 Relightable Hands 的高保真通用先验。它概括为新颖的观点、姿势、身份和照明,从而可以通过手机扫描进行快速个性化