软件介绍
VALL_E_X语音学习克隆软件可以通过几秒的录音作为声学提示,合成高质量的个性化语音。支持三种语言英语、中文、日语,单语、跨语言文本到语音功能。
带6款模型,官方原版打包,下载附件为集成版本,无需配置,打开即可使用。官方版本可以去官方Github下载,网址:https://github.com/Plachtaa/VALL-E-X
软件特点:
多语言 TTS:以三种语言(英语、中文和日语)说话,具有自然且富有表现力的语音合成。
零样本语音克隆:使用3~10 秒短音频,就可以训练模型,提取出音色!
言语情绪控制:体验情绪的力量!VALL-E X 可以合成与所提供的声音提示具有相同情感的语音,为您的音频添加额外的表现力。
零样本跨语言语音合成:VALL-E X 可以用另一种语言生成个性化语音,而不会影响流畅性或口音。
口音控制:发挥口音创意!VALL-E X 允许您尝试不同的口音,例如用英语口音说中文,反之亦然。
声学环境维护:不需要完全干净的音频提示!VALL-E X 适应输入的声学环境,使语音生成感觉自然且身临其境。
使用教程
1.上传一个持续3到10秒的语音作为音频提示,并键入您想要合成的文本。
2.模型将用您的音频提示相同的声音合成给定文本的语音。
3.该模型还倾向于保留您给定语音的情感和声学环境。