分類: 开源项目 - 第 8 頁 - Tarogo Cloud Bloger & Shop

SynthID：识别AI生成的内容

SynthID 使用各种深度学习模型和算法进行水印嵌入和识别，在不影响原始内容质量的前提下，帮助用户确定内容是否由 Google 的 AI 工具生成，并已集成到 Imagen、ImageFX、Gemini 等 Google 产品中

24 1 月, 2025

AI巨头 AI行业应用 AI项目 Claude 多媒体处理开源项目

Claude iOS 和 Android App 迎来新界面

新增分析工具，支持编写和运行JavaScript代码以处理和分析CSV文件数据
Anthropic 今日上线了全新的 Claude AI 内置工具，可以编写和运行 JavaScript 代码，处理数据、进行分析并生成洞察。

21 1 月, 2025

AI行业应用 AI项目多媒体处理开源项目

Power-over-Skin “皮肤供电”技术

现代计算设备功能强大且小巧，可以轻松佩戴在身体上。然而，电池成为设计和用户体验的主要障碍，增加了设备的重量和体积，并且需要定期充电和移除设备。

为了解决这些问题，卡内基梅隆大学的研究人员提出了通过人体传输能量的“皮肤供电”技术。

強大的計算設備現在足夠小，可以輕鬆佩戴在身上。然而，電池造成了主要的設計和使用者體驗障礙

20 1 月, 2025

AI行业应用 AI项目多媒体处理开源项目

几个开源AI项目一览

Ebook2Audiobook开源项目
将电子书自动转换为有声书支持语音克隆、多种语言

Hertz-dev：首个会话音频开源模型

小宾AI抠图

AI 头像动起来

16 1 月, 2025

AI行业应用 AI项目多媒体处理开源项目

PDF2Audio

将 PDF 文件转换为播客、讲座、摘要等音频内容

PDF2Audio 是一个开源项目，旨在将 PDF 文件转换为音频格式，如播客、讲座或摘要。该项目利用 OpenAI 的 GPT 模型进行文本生成和文本转语音（TTS）转换。用户可以上传多个 PDF 文件，并根据不同的模板（例如播客、讲座、摘要）生成音频内容。

29 12 月, 2024

AI资讯 AI项目开源项目

几个AI项目介绍

项目简介：一个基于VITS的简单易用的变声框架，可以帮助用户在10分钟以内用自己的语音数据训练出高质量的语音转换（VC）模型。
支持不同硬件设备，提供简单的网页界面和实时变声功能，适用于各类音色转换与合成应用。

28 12 月, 2024

AI项目开源项目

Ehrrapy 一种用于分析复杂健康数据的新开源工具

科学家们开发了一种易于使用的软件解决方案，专门用于分析复杂的医疗健康数据。名为“ehrapy”的开源软件使研究人员能够构建和系统地检查大型异构数据集。该软件可供全球科学界使用和进一步开发。
主要开发者之一、慕尼黑亥姆霍兹计算生物学研究所和慕尼黑工业大学 (TUM) 的科学家 Lukas Heumos

21 12 月, 2024

AI行业应用 AI项目多媒体处理开源项目文档AI

WechatFerry：一个开源微信机器人框架

助你轻松开发微信聊天机器人
WechatFerry 是一个微信机器人框架，提供了一套强大、快速且可定制的解决方案，适用于开发和集成微信机器人。为开发微信机器人的用户提供了 SDK 封装和多种插件，能够轻松调用微信的相关功能，适用于需要与微信进行交互的自动化任务。此项目包含多个组件和插件模块

10 12 月, 2024

AI行业应用 AI项目多媒体处理开源项目

AI视频剪辑软件：Kurisu

AI视频剪辑

一个靠口头描述来转换文件格式的程序。

字面意思，就是口述。

例如，你拖动或者上传了一份mp4，然后你只需在输入框内描述你想干的内容。像是“转成webm”“只保留视频第10秒到20秒之间的内容”“提取音频文件”“将视频倒放”这类。然后点击按钮们等待进度条完成就行。运用了ChatGPT和FFmpeg的对接。

3 10 月, 2024

AI巨头 AI行业应用 AI项目 OpenAI 多媒体处理开源项目

ChatGPT API SRT 字幕翻译器

此工具采用OpenAI ChatGPT API进行文本翻译，专注于行对行翻译，特别用于SRT字幕。通过去除SRT文件的额外开销并将文本分批处理，优化了令牌使用，确保输入和输出行数一致。支持Web UI和CLI接口，提供流式输出、请求速率限制、进度恢复等功能，适用于多种语言和特殊书写形式，如表情符号和单词打乱排序。