当前位置:>首页 > 传媒频道 > 正文
传媒频道

人工智能进入工业大生产时代百度地图帮你制定模拟人声

2019-10-23 17:05:00  来源:
  10月21日,在第六届世界互联网大会上,百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰发表了题为《人工智能进入工业大生产时代》的主旨演讲,王海峰表示,如果想让人工智能能更快地、更有效地助力经济的发展,需要让人工智能真正像工业大生产的方式进入各行各业的生产环节,进而推动整个生产力的进步,也推动社会的进步。
  人工智能是新一轮科技革命和产业变革的核心驱动力量。王海峰说,百度大脑是百度经过多年人工智能的技术积累和产业实践的集大成,从2010年左右百度就开始布局人工智能相关的各种基础能力,经过多年的积累,在2016年形成初步完善的布局,因而发布百度大脑1.0。发展到今年,百度大脑不仅仅有很强的各方面的跟AI相关的软的能力,从事也开始进入工业大生产的阶段。
  王海峰说,百度AI大生产平台的基本架构,有基本的算力和数据,同时还具有深度学习平台,包括核心框架、工具组件、服务平台;上面有各种相对通用的AI能力,比如跟人的视觉和听觉、感知相关的计算机视觉技术、语音技术,同时也包括跟人的认知相关的自然语言处理、知识图谱等基础。在此基础上,还要有定制的训练平台,比如面向各种垂直场景的应用技术进行定制化平台,当然还要有适用于多种场景的多端部署能力,不管是云上、端上还是边缘上以及各种各样的设备上,从而形成AI的解决方案。
  深度学习有感知、认知技术,包括语音、视觉、语言和知识等等,这也是百度大脑具备的各方面的能力,王海峰介绍称,百度最近研发的SIMLTA流式注意力模型,使准确率进一步提升,而且不仅在正常的比较安静、标准的语音环境下能得到很好的识别效果,在嘈杂的环境或者中英文混读的环境中也能得到很好的效果
  王海峰称,百度研发的语音合成技术,把这些要素分别结耦、分别训练,最后形成了统一的声音。这时候不仅让声音的自然度更好,同时也可以进行各种定制。基于百度现在最新研制的语音合成技术,任何人只要对着手机到百度地图说20句话,它就可以给你定制一个模拟这个人声音的合成语。比如开车的时候,就可以用孩子的声音帮你导航,帮助你去哪儿、要怎么走等。
  在交互技术方面,王海峰介绍说,目前百度的对话式交互平台已经有6万多个定制技能,累计交互已有500多亿次。翻译方面,百度首创语义单元驱动的上下游感知的翻译模型,不仅翻译得很好,同时实时性更好。王海峰表示,目前所有的百度AI技术都已经通过百度大脑开放平台以及飞桨开源开放平台全面开放,大家都可以基于这个平台开发自己的产品、发展自己的业务。另一方面,依托百度智能云,可以更好地、软硬一体地、包括数据、算法、算力结合起来,来部署这些AI能力。
  在安全方面,王海峰说,百度AI有一个完整的布局,从基础层到平台层到生态层都有很多的布局,并表示整体上百度AI大生产平台现在的数据已经开放216项能力,每天调用次数已过万亿,上面有150多万开发者,有大量的模型发布出来。