网易有道上线“易魔声”TTS引擎，拥有情感合成功能

2023-11-14 10:07:50 来源：

　　日前，网易有道方面宣布上线 " 易魔声 " 开源语音合成(TTS)引擎。据悉，" 易魔声 " 是一款有道自研 TTS 引擎，目前支持中英文双语，包含 2000 多种不同的音色，拥有情感合成功能，支持用户使用其合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

　　通过 " 易魔声 "，用户可通过在文本中加入情感的描述提示，即可实现自由合成符合自己需求的带有情感的语音，比传统的 TTS 更加自然逼真。目前，所有用户可免费在开源社区 GitHub 下载使用，通过其提供的 web 界面及批量生成结果的脚本接口，实现音色的情感合成与应用。

　　网易有道 CEO 周枫对此表示，" 目前该项目还处于初期阶段，现在将这个项目开源，也是希望能帮助到有需求的开发者与内容创作者，并不断扩大高质量 TTS 的应用范围，让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议 "。

　　据悉，网易有道方面在 TTS 领域已投入多年，通过以场景为导向，推动技术落地，带来了一系列应用和产品。此前其曾推出教育领域首个明星语音功能，通过将明星的声音内置在网易有道词典中，陪伴用户学习英语，同时还提供声音定制和声音复刻功能，仅需 5 分钟即可完成个性化声音定制。而在近期推出的 Hi Echo 虚拟人口语私教，则是借助有道 " 子曰 " 教育大模型、语音和虚拟人技术，帮助用户练习英语口语。

　　早在 2008 年网易有道方面便开始布局 AI 领域，致力于基于 Transformer 模型进行创新和应用，并陆续在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面取得了进展。今年 5 月，网易有道成为首批 " 北京市通用人工智能产业创新伙伴计划 " 成员 , 旨在助力人工智能大模型研发和应用。随后在 7 月，其在 2023 世界人工智能大会上参与制定了首个《教育通用人工智能大模型系列标准》。

　　7 月底，网易有道还推出了国内首个教育领域垂直大模型 " 子曰 "，并定位为 " 场景为先 " 的教育垂类模型。基于这一大模型，网易有道为不同学习场景设计了定制化的模型，以实现模型与场景的高度契合。随后网易有道还推出了搭载 " 子曰 " 教育大模型的六大应用成果并实现落地，包括拟人口语教练 Hi Echo、LLM 翻译、AI 作文指导、语法精讲、AIBox、文档问答等。本月初，" 子曰 " 教育大模型已通过相关备案，可对公众开放。

上一篇：网易有道推出开源语音合成引擎易魔声

下一篇：腾讯发布Q3财报：全面拥抱大模型，ToB业务收入占比创新高