当前位置:>首页 > 全部资讯 > 互联网 > 正文
互联网

腾讯优图开放语音合成技术 多场景应用人机互动升级

2017-08-14 14:26:19  来源:
  语音合成是人工智能领域用语音实现人与机器交互的关键技术。近日,腾讯优图实验室在优图开放平台上正式对外开放了语音合成API。这种语音合成技术能够实现更亲近更自然流畅的人机交互,同时也在有声读物、教育教学、智能玩具、智能家居等场景实现应用,让人工智能连接未来的目标愈发清晰。

  自然流畅可定制优图开放语音合成技术

  语音合成(Text to Speech,TTS)技术是指将文本文字变成语音并朗读出来的技术。为了让机器开口说话,与人类更进一步交流,语音合成的自然度、多语种能力、快速定制能力也就十分重要。

  据了解,为了提高语音合成的自然流畅度,优图的语音合成技术在声学、韵律上采用了深度模型,这使得合成的语音发音自然、清晰、韵律感流畅,接近业界顶尖水平。同时,这也让机器与人的互动显得更亲近。

  面对更复杂多变的现实人机交互应用需求,单一语种的语音合成显然已经不足以应对。优图语音合成技术能够实现中文、英文、中英混读。此外,优图通过使用迁移学习技术还实现了跨语言合成,即中文语料可以合成英文,反之亦可。

  而随着时代的发展,人们对智能语音技术有了更高的要求,比如让合成语音听起来更像某个特定发音人。目前,依托优图语音合成的深度模型,可根据用户需求实现音库定制,满足用户的个性化应用。

  做主播、陪孩子玩耍语音合成实现多生活场景应用

  技术的提升使得语音合成技术在人们的生活中得到了更广泛的应用,优图的语音合合成技术就在有声读物、教育教学、智能玩具、智能家居等领域实现了应用落地。

  企鹅FM中的虚拟主播Q小播就是一个例子。在对外开放语音合成能力之前,优图已为腾讯内部产品企鹅FM提供了技术支持,使用了优图语音合成技术的Q小播,用亲近感十足的声音为读者播报新闻实时听等专题。

  语音合成技术的应用在这个时代还有更深远的社会意义。通过拥有语音合成技术的智能玩具,可以在父母因忙碌工作而无法陪伴孩子时,陪孩子说话、给孩子讲故事、教识字等,消除孩子的孤独感。优图的语音合成技术已为腾讯云小微智能语音系统提供技术支持,并应用于小Q机器人第二代。

  此外,优图的语音合成技术还可以帮助特殊人群,例如对于丧失说话能力的群体,可以将需要表达的文字输入到语音合成技术的体验平台或应用中,便可将文字生成语音来传递信息。而在智能家居应用中,语音合成技术也是必不可少的。可以预见的是,在未来,语音合成技术将在更多场景融入寻常生活,如此的人机交互升级将使得人工智能对于人类更有意义,并让人们的生活更加美好。