作者: Tarogo Cloud - 第 32 頁 - Tarogo Cloud Bloger & Shop

AI巨头 MicroSoft

Copilot+ PC 的 Recall 预览功能更新

微软：新电脑上捕捉屏幕截图的Recall AI 功能将默认关闭
该功能每5秒截取一次用户屏幕并记录用户屏幕操作。
使用户能够像查询记忆一样回顾过去的操作。但这一功能引发了网络安全专家的担忧，他们认为黑客有可能获取用户信息。

3 7 月, 2024

Chrome 已经内置大模型(Gemini Nano)

本地和远端大模型混合使用的方案。
使用 chrome 本地模型的好处：
1、本地处理敏感数据；
2、流畅的用户体验；
3、对 AI 的访问权限更高；
4、离线使用 AI。

2 7 月, 2024

AI项目

博主Min Choi的新艺术作品（二）

人工智能教育家minchoi。 X关于人工智能、解决方案和有趣的事情。展示如何以实用的方式为您和您的企业利用人工智能。

使用 Midjourney v6 以《Mad Max: Furiosa》的风格重新想象著名的艺术作品。

2 7 月, 2024

AI巨头 AI行业应用 Alphabet 医疗AI

Google AI 医学影像模型

机器学习 (ML) 有潜力彻底改变医疗保健，从减少工作量和提高效率到发现新的生物标志物和疾病信号。为了负责任地利用这些好处，研究人员采用可解释性技术来了解机器学习模型如何进行预测。然而，当前基于显着性的方法突出了重要的图像区域，通常无法解释特定的视觉变化如何驱动机器学习决策。

1 7 月, 2024

AI行业应用多媒体处理

Truecaller允许用户克隆自己的声音，来让AI接听电话

Truecaller 很自豪地宣布与 Microsoft 建立合作伙伴关系，利用 Microsoft Azure AI Speech 的全新个人语音技术。 Truecaller 的 AI 助手于 2022 年 9 月首次推出，已经融合了多种 AI 技术，可以自动为您接听电话、屏幕呼叫、接收消息、代表您回复或记录通话以供您以后查看。

1 7 月, 2024

AI行业应用多媒体处理

语音转文本TTS模型

ChatTTS：专门为对话场景设计的文本到语音TTS模型

该模型经过超过10万小时的训练，公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。
专为对话任务优化，能够支持多种说话人语音，中英文混合等。

30 6 月, 2024

AI行业应用多媒体处理

Seed-TTS细节的 TTS 技术

Seed-TTS，这是一系列大规模自回归文本转语音（TTS）模型，能够生成几乎与人类语音无法区分的语音。
Seed-TTS作为语音生成的基础模型，在语音上下文学习中表现出色，在说话者相似性和自然性方面的表现与真实人类语音在客观和主观评估中相匹配。
通过微调，我们在这些指标上获得了更高的主观评分

30 6 月, 2024

AI巨头 Alphabet

LearnLM-Tutor：DeepMind 开发专门用于一对一的教学辅导的 AI 模型

LearnLM-Tutor 是一个由 Google DeepMind 开发的生成式 AI 模型，专门用于教育领域，旨在提供一对一的对话辅导。

通过即时反馈、多轮对话、错误识别和积极学习促进等功能，模型不仅帮助学生解决具体问题，还培养他们的自主学习和批判性思维能力。结合定制化学习计划、多学科支持和进步追踪功能，LearnLM-Tutor 成为一个强大的教育工具，为学生的全面发展提供了有力支持。

29 6 月, 2024

AI巨头 Alphabet

谷歌家的好东西：艺术家

say-what-you-see

可以帮你学会如何写 AI 画图提示词

除了教你技巧外还会有对应的练习，给你一张图片让你用学习的技巧写提示词复刻图片。
藏师傅第一等级全部 70 分以上通过，哈哈。
来测试一下你的 AI 画图提示词能力吧，又要干苦力给谷歌打标了

29 6 月, 2024

AI项目

Backseat：您的新游戏伙伴

Backseat 是一款由人工智能驱动的游戏内好友，旨在提升您的联盟体验并让您在游戏中获益。我们的梦想是成为在联赛中取得进步的最佳方式，让每场比赛变得社交化和有趣。

今天，我们的桌面应用程序中提供了 Backseat Buddy（游戏内 AI 语音伴侣）和游戏后大厅功能，还有更多功能即将推出 – 包括与好友的实时问答、赛前建议以及更多创作者声音（来自全球创作者！）。

28 6 月, 2024

AI项目

介绍了第一个名为 Prompt2Sign 的多语言手语数据集，该数据集基于公共手语数据，包括美国手语 (ASL) 和其他七种语言。
数据集将大量视频转换为简化的、模型友好的格式，并针对 seq2seq 和 text2text 等翻译模型的训练进行了优化。在此新数据集的基础上，提出了 SignLLM，这是第一个多语言手语生成 (SLP) 模型，其中包括两种新颖的多语言 SLP 模式，允许根据输入文本或提示生成手语手势。