小米自研语音技术获突破:较通用远场语音识别技术性能提升10%

来源: 作者:单征宇 发布时间:2020-01-18 08:23       

  中国网科技1月17日讯 记者今日从小米语音团队获悉,在自然语音交互领域小米已取得技术上突破,在“多通道端到端语音技术”的自研能力上,取得比“传统多通道阵列增强模块加单通道语音技术”更好的性能。

小米自研语音技术获突破:较通用远场语音识别技术性能提升10%

  据小米语音工程师透露,如何让远场语音性能达到和近讲相近的水平,一直是困扰业界语音工程师的一大难题。为了在远场声音中更准确的识别出目标语音,传统多通道阵列增强技术会使用空间滤波或语音分离算法,但性能会明显下降。而多通道端到端语音技术在经过数据测试后,可让远场语音识别性能相对提升了10%,使用户与智能设备的交互更加顺畅。

  小米方面表示:“多通道端到端的语音技术不仅让用户交互方式更加自由,同时也降低了硬件的产品功耗。未来,小米将智能语音技术落地至更多应用场景,不断突破自研技术,为用户提供更加极致的语音交互体验。 ”

  据了解,目前,业内各家的近讲语音唤醒和识别能力已经达到了较高的水平,在近距离、安静的环境下,用户与智能设备的语音交互已经基本无障碍。然而,在强噪声干扰、强房间混响、说话距离远、设备自身播放音源等条件下,智能设备与用户进行连续地自然语音交互仍然具有挑战性。

   

责任编辑:晴天
免责声明:本网所有文章、照片版权均属原作者,仅代表作者个人观点,不代表本网立场、观点。本网仅出于传递更多信息而刊登,不承担法律责任。 如发现有涉嫌抄袭、侵权、等违法违规内容, 请致电010-56382977,一经核实,立刻删除。