当前位置:>首页 > 传媒频道 > 正文
传媒频道

网易有道上线“易魔声”TTS引擎,拥有情感合成功能

2023-11-14 10:07:50  来源:
  日前,网易有道方面宣布上线 " 易魔声 " 开源语音合成(TTS)引擎。据悉," 易魔声 " 是一款有道自研 TTS 引擎,目前支持中英文双语,包含 2000 多种不同的音色,拥有情感合成功能,支持用户使用其合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
  通过 " 易魔声 ",用户可通过在文本中加入情感的描述提示,即可实现自由合成符合自己需求的带有情感的语音,比传统的 TTS 更加自然逼真。目前,所有用户可免费在开源社区 GitHub 下载使用,通过其提供的 web 界面及批量生成结果的脚本接口,实现音色的情感合成与应用。
  网易有道 CEO 周枫对此表示," 目前该项目还处于初期阶段,现在将这个项目开源,也是希望能帮助到有需求的开发者与内容创作者,并不断扩大高质量 TTS 的应用范围,让产品及应用更好地落地。也期待大家试用后给我们提供更多反馈与建议 "。
  据悉,网易有道方面在 TTS 领域已投入多年,通过以场景为导向,推动技术落地,带来了一系列应用和产品。此前其曾推出教育领域首个明星语音功能,通过将明星的声音内置在网易有道词典中,陪伴用户学习英语,同时还提供声音定制和声音复刻功能,仅需 5 分钟即可完成个性化声音定制。而在近期推出的 Hi Echo 虚拟人口语私教,则是借助有道 " 子曰 " 教育大模型、语音和虚拟人技术,帮助用户练习英语口语。
  早在 2008 年网易有道方面便开始布局 AI 领域,致力于基于 Transformer 模型进行创新和应用,并陆续在神经网络翻译、计算机视觉、高性能计算、智能语音 AI 技术等方面取得了进展。今年 5 月,网易有道成为首批 " 北京市通用人工智能产业创新伙伴计划 " 成员 , 旨在助力人工智能大模型研发和应用。随后在 7 月,其在 2023 世界人工智能大会上参与制定了首个《教育通用人工智能大模型系列标准》。
  7 月底,网易有道还推出了国内首个教育领域垂直大模型 " 子曰 ",并定位为 " 场景为先 " 的教育垂类模型。基于这一大模型,网易有道为不同学习场景设计了定制化的模型,以实现模型与场景的高度契合。随后网易有道还推出了搭载 " 子曰 " 教育大模型的六大应用成果并实现落地,包括拟人口语教练 Hi Echo、LLM 翻译、AI 作文指导、语法精讲、AIBox、文档问答等。本月初," 子曰 " 教育大模型已通过相关备案,可对公众开放。