作者: Tarogo Cloud

SignLLM:手语生产大型语言模型

介绍了第一个名为 Prompt2Sign 的多语言手语数据集,该数据集基于公共手语数据,包括美国手语 (ASL) 和其他七种语言。 数据集将大量视频转换为简化的、模型友好的格式,并针对 seq2seq 和 text2text 等翻译模型的训练进行了优化。在此新数据集的基础上,提出了...

Backseat:您的新游戏伙伴

Backseat 是一款由人工智能驱动的游戏内好友,旨在提升您的联盟体验并让您在游戏中获益。我们的梦想是成为在联赛中取得进步的最佳方式,让每场比赛变得社交化和有趣。 今天,我们的桌面应用程序中提供了 Backseat Buddy(游戏内 AI 语音伴侣)和游戏后大厅功能,还有更多功能即将推出...

Deep Paint 是一个为 Blender 这个 3D 制作软件设计的插件

Deep Paint 提供了各种特制的笔刷和材质,让你的模型看起来更有艺术效果,比如模拟水彩画或粉彩画的效果 您想用 Blender 创造自己的充满幻想的梦幻世界吗?从基本操作到建模、灯光、动画和油性铅笔,让我们通过各种挑战增强您的 3D 知识,共同创作精彩的作品。

Midjourney 新上的这个随机风格能力现在很有用啊。

刚发布的时候风格复用只能通过垫图用风格一致性的方式。现在直接展示了风格代码,可以很方便的复用功能。 在探索页面随便找了一个提示词,用随机风格抽奖跑了一下,结果出来一个很强的风格。 可以让画面出现暗黑粗粝的风格,而且会大概率出现雪景和怪物特写。

15个非常实用且鲜为人知的手机应用

1/ Smartify 使用它你可以像扫描QR码一样扫描绘画、纪念碑、建筑,扫描后,应用会为你提供详细信息。 2/ Snapseed Snapseed免费提供从裁剪到改变脸部方向或删除物体的一系列功能。 3/ Headspace 一款可以帮助你减压减焦虑的冥想应用。

LlamaFS:基于Llama 3的能自动帮你分类整理电脑里文件的工具

LlamaFS 是一个自组织文件管理器。它会根据文件的内容和众所周知的约定(例如时间)自动重命名和组织文件。它支持多种文件,甚至图像(通过 Moondream)和音频(通过 Whisper)。 LlamaFS 以两种“模式”运行 - 作为批处理作业(批处理模式)和交互式守护进程(监视模式)。

Suno AI宣布获得1.25 亿美元融资

此次融资由 Lightspeed Venture Partners、Nat Friedman、Daniel Gross 等顶级投资者领投。 Suno 称此轮融资旨在加速产品开发并扩展其音乐创作者团队。致力于打造一个人人都能创作音乐的平台! ...

潘多拉:通过自然语言动作和视频状态迈向通用世界模型

Pandora 在视频生成过程中接受自由文本操作作为输入,以动态引导视频。这与以前的文本到视频模型有很大不同,以前的文本到视频模型只允许在视频开头出现文本提示。动态控制实现了世界模型的承诺,支持交互式内容生成并增强稳健的推理和规划。

学英语不能错过的神器:DashPlayer

在课堂里我一直是面向考试学习英语,不断记忆那些永远也记不住的单词,阅读那些即使翻译成中文也很枯燥的文章。 后来我完成了学校的所有英文课程以后,就开始寻找一些可以让英语学习和娱乐、技能学习相结合的方法。比如阅读感兴趣的英文书籍就是个很好的方法。

TRAMBA:一种新型混合变压器和基于 Mamba 的架构

来自西北大学和哥伦比亚大学的研究人员推出了混合变压器 TRAMBA 和 Mamba 架构,用于增强移动和可穿戴平台中的声学和骨传导语音。此前,在此类平台中采用骨传导语音增强技术面临着由于劳动密集型数据收集和模型之间的性能差距而面临的挑战。 TRAMBA...

MS Build 2024 的第一天

在 Microsoft Build 2024 上,Microsoft Copilot Studio 中的一系列强大新功能,您可以使用它来创建自己的自定义副驾驶或通过自己的企业数据和场景扩展 Microsoft Copilot 体验。 第一个是Copilot...

一个做llama3中文微调的宝藏仓库

CrazyBoyM/llama3-Chinese-chat: Llama3 中文仓库(聚合资料,各种微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档),旨在支持中文场景下的Llama3模型应用和开发。