当前位置:>首页 > 全部资讯 > 科技 > 正文
科技

科大讯飞语音合成芯片推动人机交互革命性变化

2010-03-25 10:05:35  来源:

  (联合电讯/安徽)--只因有了一颗小小的芯片,车载调度仪、信息机、气象预警机、考勤机、排队机、智能仪表等各类信息终端产品一改往日冷冰冰的沉默,实现了用流畅、悦耳的语音与人类进行最自然、便捷的沟通。科大讯飞智能语音合成芯片推动人机交互模式发生革命性的变化,为提升产品人性化、行业服务水平、人类生活品质做出了创造性贡献!

  语音合成芯片是能够将任意文本信息通过语音合成技术(Text to Speech)转化为声音输出的一种处理器芯片。至2009年科大讯飞发布新一代语音合成芯片XFS4041CN,讯飞语音芯片家族已走过了核心技术、功能、表现力、应用效果持续改进、不断优化的9年发展历程。时至今日,科大讯飞已在中文语音合成芯片领域积淀了深厚的品牌口碑,牢牢占据着市场先发优势与领先地位。

  让我们共同回顾科大讯飞语音合成芯片伴随中国语音产业,以及语音技术应用深入社会生活、各行各业的发展历程。

  中文语音合成芯片开山之作——XF1M01

  2001年,基于第一代嵌入式语音合成技术,科大讯飞在业界首次推出XF1M01中文语音合成芯片,堪称中文语音合成芯片的开山鼻祖。XF1M01产品具备最基本的语音合成功能,可满足车载环境的基本应用需要,为今后语音芯片的发展打下了坚实的基础。随后,讯飞在XF1M01的基础上又开发了XF-1M02XF-2S01E,尽管随着新技术新产品的迅速推出,该产品逐渐淡出市场,但在中文语音合成芯片的发展历史中却具有重要的尝试性、创造性意义,起到了良好的市场培育作用,也由此奠定了科大讯飞在语音芯片领域的先发优势。

  语音应用时代的来临——XF-S3111

  2003年,讯飞推出基于第二代嵌入式语音合成技术的经典产品——XFS3111XFS3111采用InterSound3.0标准级语音合成系统的核心技术,增加了Midi、提示音等功能,与XF1M01相比,在效果、接口、功能上均有突破性的提升。更重要的是,该产品真正实现了对智能语音芯片实用门槛的突破,开创了智能语音芯片在车载电话系统、车载导航、考勤机、手持智能仪表、税控机等多个嵌入式领域的应用先河。智能语音芯片由此开始与各类机器设备、信息终端产品、行业服务需求紧密结合,使越来越多的人开始体验、享受到语音技术的独特魅力,切身、直观的认识到智能语音技术的巨大应用价值。

  高端语音模块的雏形—XF-S3231B

  20048月,基于高端车载应用领域的需求,讯飞推出采用第三代嵌入式语音合成技术的语音模块XFS3231BXFS3231B32RISC处理器为核心,配置InterSound3.0增强级语音合成软核,语音合成效果更优于前期经典型的XF-S3111XFS3231B的推出,既填补了高端市场的空白,也充分显示了科大讯飞的技术实力与产品化能力,得到了行业高端市场的充分认可,公司市场领导地位进一步增强,更为今后4240的研发打下了坚实的基础!

  性价比的全面飞越——XF-S3011

  20054月,讯飞推出高性价比产品XF-S3011XF-S3011采用InterSound3.0标准级语音合成系统的核心技术,具有MIDI、定制引擎等功能,采用小尺寸的单芯片封装架构。与之前的产品相比,XF-S3011产品体积减小,成本大幅降低,正是由于这些优势,为语音合成技术在低成本嵌入式应用领域的迅速普及创造了条件,大大降低了智能语音芯片的应用门槛,使智能语音技术在考勤机、信息机、车载调度仪等产品中的应用驶上了快车道,语音信息播报等功能也成为了这些产品的新亮点,XF-S3011产品面世的几年中,在低端语音市场的占有率保持在96%以上,开创了语音芯片被广泛应用的新时代。

  中文语音合成芯片的标杆——XF-S4240

  20062月,科大讯飞率先将第四代语音合成技术应用于智能语音芯片,推出XF-S4240,这是业界第一款基于第四代语音合成技术的硬件产品,科大讯飞技术、产品与市场引导性地位充分体现。

  XF-S4240堪称业界一款里程碑式的产品,相比较前期产品,其在自然度、准确度、清晰度等合成效果方面均得到大幅度提升,合成时可调节范围更广,例如可进行语速调节和语调调节等,功能、效果、应用性较之前推出的历代产品实现了质的飞跃。自2006年推出至今,XF-S4240得到了用户的普遍认可,广泛应用于中、高端的嵌入式应用领域,是目前为止语音合成硬件产品中口碑最好的标杆型产品。

  实力体现——XF-S4040

  20086月,讯飞推出中端语音合成芯片XF-S4040XF-S4040支持六种发音风格,可调节语速、语调,支持文本控制标记。该产品性能优良,价格适中,它的推出,大幅度提升了语音合成芯片产品的性价比,为加速语音产品向各行业的全面推广提供了最优的产品基础。

  低端升级——XFS3031CN

  为进一步满足广大用户对XF-S3011合成效果进一步提升的需求,20094月,讯飞发布XF-S3011的升级产品XFS3031CNXFS3031CNXF-S3011的基础上,对发音人音库进行进一步优化,采用更高的采样率和采样精度,合成声音的清晰度、自然度、可懂度较XF-S3011有显著的提升。在支持文本的内码格式方面,XFS3031CNXF-S3011支持GB2312UNICODE 的基础上,还增加了对GBKBIG5这两种内码格式文本的支持,满足了大陆以外香港、澳门等其他地区繁体字文本语音合成的应用需求。此外,XFS3031CN新增多首声音提示音及和弦提示音,可满足报警提示的需求,适合更多应用场合。

  作为升级型产品,XFS3031CN相对于XF-S3011效果提升显著,且价格适中,综合性价比在市场上处于领先地位,目前在低端市场占有90%以上的市场份额。

  再创辉煌——XFS4041CN

  20094月,在业界其他企业止步于现有技术,难以在芯片级产品上取得突破的背景下,科大讯飞却再接再厉,基于历年来在智能语音芯片领域的深厚积淀与其他企业难以仿效的综合实力优势,再次实现技术与产品的重大创新突破,推出更高性价比的双芯片产品XFS4041CN

  XFS4041CN定位中高端,采用双芯片的产品形式,体积占用小,可以进行机器贴装,适于规模化生产。更为重要的是,在合成的自然度、清晰度方面,XFS4041CN相对以前的同级别产品XF-S4040有了显著的提高。此外,XFS4041CN提供用于扩展SPI FLASH的接口,用户可以通过该接口非常方便地在系统中添加录音文件,如:添加个性提示音、开关机提升语、广告录音文件等,通过此接口添加到系统中的录音文件可以和XFS4041CN内部集成的提示音一样方便调用,极大增强了客户产品应用的灵活性、自主性。

  大势所趋——多语种语音芯片呼之欲出

  不断提升语音合成的朗读效果,无疑是语音芯片各厂商的重中之重,科大讯飞基于多年的不断积累,语音合成技术已经位居国际领先地位,芯片产品的高合成效果已经是业界公认。近年来,在讯飞连续4年获得国际英文合成大赛桂冠,在英文语音合成技术领域树立了牢固的国际领先地位的基础上,科大讯飞已研制出主导高端语音芯片市场的中英文合成芯片XFS4243CE,除具有优秀中文语音合成功能外,还可合成出标准的美式英语发音效果,满足嵌入式领域日益凸显的对中英文语音合成的双重需求,此产品目前已进入试推广阶段。伴随着语音合成芯片应用范围的不断扩展,未来几年中,科大讯飞将推出涵盖多个语种的语音合成芯片。

  在高端语音芯片应用领域,目前还只有科大讯飞有能力满足实际应用需求。

  结语

  科大讯飞是中国语音产业界迄今唯一上市公司,其智能语音核心技术代表了世界的最高水平。随着智能语音技术的持续发展和应用需求的拓展深化,科大讯飞将进一步发挥中国语音产业龙头企业和领导者的作用,在无可复制的经验积累基础上,永不停止创新突破的步伐,薪火相传、继往开来,为业界提供技术、效果最优,性价比最高的语音芯片产品,使语音技术在提升行业服务水平、各类机器设备产品功能与品质,造福人类生产生活中创造更大价值!