当前位置:首页 > 企业新闻

苹果详解HomePod远场语音识别,为何机器学习是重点?

AG亚博集团:日前,苹果的音频软件工程和Siri语音团队在公司名下的《机器学习期刊》栏目中公布了一篇博文,详尽讲解了公司研究团队对HomePod智能扬声器上的Siri在远场环境中工作的优化方法。远场语音辨识是所指在用户在房间简单的布局中离HomePod比较很远的有所不同方位苏醒Siri,而构建该功能必须密切地构建各种多亚博AG真人通道信号处理技术以解决问题噪声、混响、Echo等带给的影响,比起在iPhone上工作,Siri在远场环境中的工作原理更为简单,技术上也不存在更好的难题。为了解决问题混响、噪声和语音分离出来的问题,苹果团队用于了多个麦克风阵列和机器学习的方法:1)基于掩模的多通道实时收集硬件利用深度自学展开算法研发和调优来避免Echo和背景噪声;2)有语音重合的情况下,利用无监督自学分离出来声源和基于音频流自由选择的语音苏醒避免阻碍语音。苹果团队搭起了一个系统,构建了监督式深度自学的模型和无监督在线自学的算法,能利用和处置多个麦克风信号,通过用于自上而下的科学知识为语音识别器从“HeySiri”语音苏醒探测器中自由选择合适的音频流。

亚博集团

亚博集团

该团队回应,远场语音辨识大大强化的性能归功于深度自学。【AG亚博集团】。

本文来源:亚博集团-www.paastalk.com