AI项目

Backseat:您的新游戏伙伴

Backseat 是一款由人工智能驱动的游戏内好友,旨在提升您的联盟体验并让您在游戏中获益。我们的梦想是成为在联赛中取得进步的最佳方式,让每场比赛变得社交化和有趣。

今天,我们的桌面应用程序中提供了 Backseat Buddy(游戏内 AI 语音伴侣)和游戏后大厅功能,还有更多功能即将推出 – 包括与好友的实时问答、赛前建议以及更多创作者声音(来自全球创作者!)。

Deep Paint 是一个为 Blender 这个 3D 制作软件设计的插件

Deep Paint 提供了各种特制的笔刷和材质,让你的模型看起来更有艺术效果,比如模拟水彩画或粉彩画的效果

您想用 Blender 创造自己的充满幻想的梦幻世界吗?从基本操作到建模、灯光、动画和油性铅笔,让我们通过各种挑战增强您的 3D 知识,共同创作精彩的作品。

PictoGraphic:拥有超过40000张的免费AI生成插图库

PictoGraphic 是一个AI生成的插图库,提供超过40000张图像和SVG文件,你在这里可以找到适合自己的免费插图

作为设计师,通常会发现自己的设计需要 10 – 15 个高质量图形。

然而,找到这么多既能表达我们的想法又具有共同艺术风格的插图是非常具有挑战性和耗时的。通常,我们最终会花费大量时间在不同的网站和集合中寻找类似的插图,甚至花费更多的时间“再尝试一次”来编辑插图以使其适合。

Midjourney 新上的这个随机风格能力现在很有用啊。

刚发布的时候风格复用只能通过垫图用风格一致性的方式。现在直接展示了风格代码,可以很方便的复用功能。

在探索页面随便找了一个提示词,用随机风格抽奖跑了一下,结果出来一个很强的风格。

可以让画面出现暗黑粗粝的风格,而且会大概率出现雪景和怪物特写。

Suno AI宣布获得1.25 亿美元融资

此次融资由 Lightspeed Venture Partners、Nat Friedman、Daniel Gross 等顶级投资者领投。
Suno 称此轮融资旨在加速产品开发并扩展其音乐创作者团队。致力于打造一个人人都能创作音乐的平台!

音乐家社区值得拥有最好的工具,而构建最好的工具需要最优秀的人才。我们将利用这笔资金来加速产品开发,并发展我们世界一流的音乐制作人、音乐爱好者和技术人员团队。

潘多拉:通过自然语言动作和视频状态迈向通用世界模型

Pandora 在视频生成过程中接受自由文本操作作为输入,以动态引导视频。这与以前的文本到视频模型有很大不同,以前的文本到视频模型只允许在视频开头出现文本提示。动态控制实现了世界模型的承诺,支持交互式内容生成并增强稳健的推理和规划。

TRAMBA:一种新型混合变压器和基于 Mamba 的架构

来自西北大学和哥伦比亚大学的研究人员推出了混合变压器 TRAMBA 和 Mamba 架构,用于增强移动和可穿戴平台中的声学和骨传导语音。此前,在此类平台中采用骨传导语音增强技术面临着由于劳动密集型数据收集和模型之间的性能差距而面临的挑战。 TRAMBA 通过使用广泛可用的音频语音数据集进行预训练并使用少量骨传导数据进行微调来解决这个问题。

一个做llama3中文微调的宝藏仓库

CrazyBoyM/llama3-Chinese-chat: Llama3 中文仓库(聚合资料,各种微调、魔改版本有趣权重 & 训练、推理、评测、部署教程视频 & 文档),旨在支持中文场景下的Llama3模型应用和开发。

博主Min Choi的新艺术作品(一)

人工智能教育家。 𝕏 关于人工智能、解决方案和有趣的事情。 展示如何以实用的方式为您和您的企业利用人工智能。

人工智能教育家@minchoi 使用 Midjourney v6 重新构想了著名的艺术作品,以《星球大战》的风格呈现。

通义千问发布Qwen1.5-110B

首款超1000亿参数模型

Qwen1.5-110B是Qwen1.5系列中的新成员,也是该系列首个拥有超过1000亿参数的模型。

该模型在基础模型评估中表现出色,与Meta-Llama3-70B相媲美,并在聊天模型评估(包括MT-Bench和AlpacaEval 2.0)中表现出色

将任何URL转换为带有简单前缀的LLM友好输入

可以做两件事:

它将任何 URL 转换为 https://r.jina.ai/https://your.url 的 LLM 友好输入。免费提高代理和 RAG 系统的输出。
它使用 https://s.jina.ai/your+query 在网络上搜索给定的查询。这使您的LLMs能够从网络获取最新的世界知识。

RadOnc-GPT 是医学领域中的LLM

在医学领域中,很少有领域比放射肿瘤学需要更高的精度或数据。 RadOnc-GPT 是一种经过微调的 LLM,使用 Meta Llama 2 构建,有可能显着改善放射治疗决策。

很少有领域比放射肿瘤学需要更高的精度或更多的数据。患者的生命取决于在这个专业领域获得正确的治疗。

Google推出开源视觉语言模型:PaliGemma

支持图像视频等多种视觉语言任务
包括支持图像和短视频字幕、视觉问答、图像文本理解、物体检测文件图表解读、图像分割等任务。
PaliGemma 模型包含 30 亿(3B)个参数,结合了 SigLiP 视觉编码器和 Gemma 语言模型。

新的 SDXL Controlnet 线条模型 MistoLine

能够应对各种类型的线条艺术作品,无论是手绘草图、不同的 ControlNet 线预处理工具,还是由模型生成的轮廓,都能高精确性和稳定地处理。

一个重要特点是其泛化能力极强,无需针对不同的线预处理工具更换不同的 ControlNet 模型。