天猫精灵、小爱同学、Hi Siri,语音智能音箱“名字”大有玄机!燚智能硬件开发周教授
觉得有道理? 左侧有“公众号”、“微信号”、“头条号”,随便你想加哪个都行!还不过瘾,直接Call我们吧!
这两年,智能音箱很火,天猫精灵卖出了百万台,京东的叮咚音箱、小米的小爱同学也好评颇多。亚马逊的Echo系列卖了上千万台了。
有些智能语音识别的软件,还能支持“自定义唤醒词”,用户可以设定一个自己喜欢的名字,来叫醒设备。
那么,这些名字有哪些奥秘呢?
什么是唤醒词
唤醒词,就是智能音箱的“名字”,叫了它的名字它就理你,叫错了就不理了。
智能音箱内部有一组麦克风,7x24小时不停的录音,和内置的“唤醒词模型”比对,一旦对比成功,就认为你在叫它了,就开始做语句识别。
不光是智能音箱,像iPhone的“hi siri”也是这样的,iPhone6没有独立的低功耗声音比对处理器(唤醒处理器),语音唤醒的功耗很高,因此只能在插电的情况下叫“hi siri”,后续机型都有了独立处理器,功耗低了,就可以随时随地叫醒Siri了。
语音唤醒的核心:唤醒词+硬件+算法
那么,如何做99.99%的唤醒率?(当前各家都没做到这么高,略差一些)
高识别率是一个非常系统的工程,主要有麦克风选型、声学的设计、降噪和识别算法、唤醒词设计。
一个语音智能产品,叫半天都不理你,肯定想把它摔了。唤醒词选择非常重要。
固定唤醒词比自定义唤醒词更好,唤醒率更高、距离更远。自定义唤醒词采用的是通用化模型,固定唤醒词用的是算法公司优化过的模型,所以会更好。(但是要付出几十万的调试费用)
唤醒词选择的几个原则
-
1:爆破音更好
唤醒中最好含有带爆破音的字:例如“胖”“朋”,能量高,易唤醒.
-
2:嘴巴张的越大越好
韵母,宜选择大口型,开口音韵母的音节。a、an、ang、ia、ian、iang、ai、ao、ua、uan、uang等。避免e、en、eng,i、in、ing 等。
例如 :霞,芭,娃,哈 等词比较好。
避免:基尼,咪咪这样的唤醒词。
-
3:声母尽量爆破音
声母,宜选择包含爆破音声母的音节。如,d、b、t、l、z、zh等 (但相对来说,韵母的选择更重要)。
-
4:无连音
音节之间避免连音。如无声母、前一个韵母与后面声母相同或近似。例如避免“天安门”、“第一视频”。
-
5:避免使用常用词
为避免误唤醒,唤醒词尽量为平常讲话很少触及到的用词,音节数尽量≥3。其中4字较理想。不建议过长(大于6),过短易误唤醒,过长不利于用户记忆与频繁朗读。
哪家的唤醒词最好?
天猫精灵:普通,识别度一般,读出来感觉是在打广告。
小爱同学:较好,易于识别,亲和力也很高。
叮咚叮咚:普通,识别度一般,叫起来感觉比较傻
Hi Siri:较好,易于识别,读出来很通畅。
Alexa:最好,智能音箱领军引擎,各方面都不错(除了不能在国内使用)
OK Google:较好,识别度一般,但读出来很自然