一个由 MyShell 发布的及时语音克隆工具,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。
除了复制音色之外,还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调;并且可以针对海量说话人训练集中未包含的语言实现零样本跨语言语音克隆。
1.准确的色调颜色克隆。OpenVoice可以准确克隆参考音色,生成多种语言和口音的语音。
2.灵活的语音风格控制。OpenVoice 支持对语音风格(如情感和口音)以及其他风格参数(包括节奏、停顿和语调)进行精细控制。
3. 零样本跨语言语音克隆。生成的语音的语言和参考语音的语言都不需要在大规模说话人多语言训练数据集中呈现。
colab在线使用:https://colab.research.google.com/github/camenduru/OpenVoice-colab/blob/main/OpenVoice_colab.ipynb
不懂就问myshell 是什么公司