分类: 多媒体处理

WhisperSpeech:一个开源的文本到语音系统

是通过对OpenAI的Whisper语音识别模型反向工程来实现的。 通过这种反转过程,WhisperSpeech能够接收文本输入,并利用修改后的Whisper模型生成听起来自然的语音输出。 输出的语音在发音准确性和自然度方面都非常的优秀。