SenseVoice开源的语音理解基础模型
致力于提供多模态、多语言、高性能的语音理解能力
SenseVoice 是 FunAudioLLM 项目中负责“语音理解”的基础模型
致力于提供多模态、多语言、高性能的语音理解能力
SenseVoice 是 FunAudioLLM 项目中负责“语音理解”的基础模型
使用扩散技术生成完整的三分钟以上歌曲
简介:FUZZ 是 Riffusion 推出的最新音乐生成模型,利用扩散模型生成音乐谱图,并转换为音轨可供下载。尽管目前中文语言能力有待提高,但 FUZZ 的功能与 Suno V2 相当,且承诺在 GPU 资源允许的情况下保持免费。
音乐风格:支持多种音乐风格,助力创作多样化的音乐作品。
SynthID 使用各种深度学习模型和算法进行水印嵌入和识别,在不影响原始内容质量的前提下,帮助用户确定内容是否由 Google 的 AI 工具生成,并已集成到 Imagen、ImageFX、Gemini 等 Google 产品中