EmotiVoice是什么?
EmotiVoice是一个强大而现代的开源文本到语音引擎,它可以让你用超过2000种不同的声音来合成中文和英文的语音。EmotiVoice的最突出的特点是,它可以根据你的提示来调整语音的情感、语气、风格、速度、音高等参数,让你的语音更加生动和个性化。
EmotiVoice是由网易有道的研究团队开发的,他们利用了最新的深度学习技术,如Tacotron、WaveGlow、Style Tokens等,来构建一个高质量、高效率、高灵活性的语音合成系统。EmotiVoice不仅可以用于普通的语音合成任务,如朗读、导航、播报等,还可以用于创造性的语音合成任务,如配音、歌唱、模仿等。
EmotiVoice的使用方法非常简单,你只需要在你的文本前面加上一句提示,就可以控制你的语音合成器的输出。
EmotiVoice Docker镜像
尝试EmotiVoice最简单的方法是运行docker镜像。你需要一台带有NVidia GPU的机器。先按照Linux和Windows WSL2平台的说明安装NVidia容器工具包。然后可以直接运行EmotiVoice镜像:
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest
打开浏览器并导航到 http://localhost:8501 以开始使用 EmotiVoice 强大的 TTS 功能。
开源地址:https://github.com/netease-youdao/EmotiVoice