AI巨头, MicroSoft

Copilot+ PC 的 Recall 预览功能更新

微软:新电脑上捕捉屏幕截图的Recall AI 功能将默认关闭
该功能每5秒截取一次用户屏幕并记录用户屏幕操作。
使用户能够像查询记忆一样回顾过去的操作。但这一功能引发了网络安全专家的担忧,他们认为黑客有可能获取用户信息。

AI项目

博主Min Choi的新艺术作品(二)

人工智能教育家minchoi。 X关于人工智能、解决方案和有趣的事情。 展示如何以实用的方式为您和您的企业利用人工智能。

使用 Midjourney v6 以《Mad Max: Furiosa》的风格重新想象著名的艺术作品。

AI巨头, AI行业应用, Alphabet, 医疗AI

Google AI 医学影像模型

机器学习 (ML) 有潜力彻底改变医疗保健,从减少工作量和提高效率到发现新的生物标志物和疾病信号。为了负责任地利用这些好处,研究人员采用可解释性技术来了解机器学习模型如何进行预测。然而,当前基于显着性的方法突出了重要的图像区域,通常无法解释特定的视觉变化如何驱动机器学习决策。

AI行业应用, 多媒体处理

语音转文本TTS模型

ChatTTS:专门为对话场景设计的文本到语音TTS模型

该模型经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。
专为对话任务优化,能够支持多种说话人语音,中英文混合等。

AI行业应用, 多媒体处理

Seed-TTS细节的 TTS 技术

Seed-TTS,这是一系列大规模自回归文本转语音(TTS)模型,能够生成几乎与人类语音无法区分的语音。
Seed-TTS作为语音生成的基础模型,在语音上下文学习中表现出色,在说话者相似性和自然性方面的表现与真实人类语音在客观和主观评估中相匹配。
通过微调,我们在这些指标上获得了更高的主观评分

AI巨头, Alphabet

LearnLM-Tutor:DeepMind 开发 专门用于一对一的教学辅导的 AI 模型

LearnLM-Tutor 是一个由 Google DeepMind 开发的生成式 AI 模型,专门用于教育领域,旨在提供一对一的对话辅导。

通过即时反馈、多轮对话、错误识别和积极学习促进等功能,模型不仅帮助学生解决具体问题,还培养他们的自主学习和批判性思维能力。结合定制化学习计划、多学科支持和进步追踪功能,LearnLM-Tutor 成为一个强大的教育工具,为学生的全面发展提供了有力支持。

AI巨头, Alphabet

谷歌家的好东西:艺术家

say-what-you-see

可以帮你学会如何写 AI 画图提示词

除了教你技巧外还会有对应的练习,给你一张图片让你用学习的技巧写提示词复刻图片。
藏师傅第一等级全部 70 分以上通过,哈哈。
来测试一下你的 AI 画图提示词能力吧,又要干苦力给谷歌打标了

AI项目

Backseat:您的新游戏伙伴

Backseat 是一款由人工智能驱动的游戏内好友,旨在提升您的联盟体验并让您在游戏中获益。我们的梦想是成为在联赛中取得进步的最佳方式,让每场比赛变得社交化和有趣。

今天,我们的桌面应用程序中提供了 Backseat Buddy(游戏内 AI 语音伴侣)和游戏后大厅功能,还有更多功能即将推出 – 包括与好友的实时问答、赛前建议以及更多创作者声音(来自全球创作者!)。

AI项目

SignLLM:手语生产大型语言模型

介绍了第一个名为 Prompt2Sign 的多语言手语数据集,该数据集基于公共手语数据,包括美国手语 (ASL) 和其他七种语言。
数据集将大量视频转换为简化的、模型友好的格式,并针对 seq2seq 和 text2text 等翻译模型的训练进行了优化。在此新数据集的基础上,提出了 SignLLM,这是第一个多语言手语生成 (SLP) 模型,其中包括两种新颖的多语言 SLP 模式,允许根据输入文本或提示生成手语手势。

AI项目, 开源项目

PictoGraphic:拥有超过40000张的免费AI生成插图库

PictoGraphic 是一个AI生成的插图库,提供超过40000张图像和SVG文件,你在这里可以找到适合自己的免费插图

作为设计师,通常会发现自己的设计需要 10 – 15 个高质量图形。

然而,找到这么多既能表达我们的想法又具有共同艺术风格的插图是非常具有挑战性和耗时的。通常,我们最终会花费大量时间在不同的网站和集合中寻找类似的插图,甚至花费更多的时间“再尝试一次”来编辑插图以使其适合。

滚动至顶部