发布时间 : 2022-09-16 阅读量 : 364
随着人工智能的发展,对于声纹识别很多人已不陌生。声纹识别就是将声信号转换成电信号,再用计算机进行识别。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。
此前小米推出的降噪耳机4 pro采用了骨声纹降噪的方式,支持通话降噪功能。其实骨声纹早在2020年就装载在华为freebuds 3上发行。但很多人依然不知道何为骨声纹识别?骨声纹识别之于我们普通的声纹识别又有那些优势,能够先一步落地于耳机这样的应用场景?
「骨声纹识别」
声音传导由于传导介质不同,所收录的语音特色也不同。人体骨骼可以传导声音,我们一般听到自己的声音和他人听到自己的声音的音色有所不同,就是因为我们自己听到的自己的声音是通过空气传导加骨传导进入我们耳朵的,而他人听到的我们的声音是通过空气传播。骨传导没有空气传播容易,它产生的阻力会导致声波频率下降,因此音调会变的更加低沉。下图描述了骨传导耳机到耳蜗之间的传导:
什么是骨声纹识别?确切的说应该是根据骨传导语音进行声纹识别,如同人的dna、指纹一样, 每个人的头骨是独一无二的,所以声音的骨骼间的反射也是独一无二的,每个人的骨传导语音反射不同,用头戴耳机收集后就可以用于识别此人的身份。
目前支持骨传导声纹的耳机主要有南卡runner pro3、韶音openrun pro运动耳机、骨聆ss900 tws、艾刻ikko itg01骨传导耳机、索爱gd06、联想x4还有近期的华为freebuds 3和小米降噪耳机4 pro。这些骨传导耳机之前一直由国外骨传导传感器垄断,目前华为采用歌尔骨传导传感器替换国外器件,这预示着国产骨传导耳机以后可能会占据更多市场份额。
「对比普通声纹识别的优点」
对比under-air的普通声纹识别,骨传导声纹识别的优点如下:
(1) 由于每个人的头骨是独一无二的,加上每个人的音色也是独一无二的,二者双重判定,有更高的安全性。
(2) 骨传导声纹识别受到混响噪声干扰小,降低噪声对识别准确率的影响,声纹识别中域的不匹配问题也会降低,因此可以带来更高的识别准确度。
「对比普通声纹识别的缺点」
对于普通声纹识别,骨传导声纹识别需要佩戴无线耳机或者麦克风,异物感明显,价格相比普通耳机较贵,且不是所有人都喜欢戴耳机。每次声纹身份验证都需要佩戴,便捷程度不足,应用场景有限。用户与智能家居设备之间的指令通常都是随意且under-air的交流方式,让用户佩戴耳机与之交流恐怕不符合用户习惯和应用场景,因此推广市场有限。
此外,目前市场上没有开源骨传导与语音数据集,需要为产品应用录制数据,对比普通声纹识别录制,骨传导语音录制成本更高,需要更专业的团队提供数据支撑研究。magic data作为全球领先ai数据凯发体育网的解决方案提供商,具有完善的采集流程和高效采集工具,采集数据符合全球数据安全规定,同时magic data自研标注平台annotator提供一站式标注,并支持3d点云、多模态等数据标注。最终通过专业的数据测试模型校验数据,保证数据质量。