声纹的意义
在实际生活中,每个人说话时的语声,都有自己的特点。很熟悉的人之间,可以只听声音而相互辨别出来,这就是语声人各不同的特性。
人的语声为什么会人不同?因为人的发声器官实际上存在着
大小、形态及功能上的差异。发声控制器官包括
声带、软颚、舌头、牙齿、唇等;发声共鸣器包括
咽腔、口腔、鼻腔。这些器官的
微小差异都会导致发声气流的改变,造成音质、音色的差别。此外,人发声的习惯亦有快有慢,用力有大有小,也造成音强、音长的差别。
音高、音强、音长、音色在语言学中被称为
语音“四要素”,这些因素又可分解成
九十余种特征。这些特征表现了不同声音的不同
波长、频率、强度、节奏。语图仪可以把
声波的变化转换成电讯号的强度、波长、频率、节奏变化,仪器又把这些电讯号的变化绘制成波谱图形,就成了声纹图。
人的发声具有特定性和稳定性。从理论上讲,它同指纹一样具有身份识别(认定个人)的作用。虽然由于技术和经验的问题,暂时不能说完全达到了指纹那样的精确程度,但它已经被越来越多的国家认可为
法庭科学的一项新技术。一九八一年在美国密执安州成立了“国际声纹鉴定学会”,旨在进一步完善声纹鉴定技术,加强推动、培训和宣传,促使声纹鉴定成为世界公认的一种人身识别的
科学方法。
许多国家都已把声纹鉴定作为辨认犯罪嫌疑人的重要手段,为侦查工作提供新的线索和证据。
(1)在获得了犯罪人的语声录音资料时,如在电话中进行的恐吓、勒索,或在其他性质的犯罪中录到了罪犯说话的声音,那么可以通过收集嫌疑人语音样本进行声纹鉴定,为认定或否定犯罪人提供鉴定结论;
(2)在案件的侦讯或审理中(包括民事案件),通过声纹鉴定可以审查录音证据材料的真伪;
(3)通过声纹分析,判断说话人的性别、年龄、方言(生活地区)特征,为侦查工作提供方向和范围。
声纹鉴定的步骤和注意事项
应用的语图仪可以制作七种声纹图:宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹(又分宽带、窄带二种)。其中,前二种显示语声的频率与强度随时间推移的变化特征;中间三种显示语音强度或声压随时间变化的特征;断面声纹只是显示某一时间点上声波强度和频率特征的声纹图。
在声纹鉴定中最常用的是宽带声纹图。它是用带宽为300HZ的带通滤波器分析出来的声纹。声纹图的
横坐标为时间,纵坐标为频率,浓淡表示音强(见附图)。每一字的声纹前部(乱纹)是清辅音的频谱,后部是元音频谱;元音频谱中由加强的纵线条构成的水平方向的黑带为
共振峰。共振峰的数量、走向及其频率是声纹分析的重要特征。
声纹鉴定依如下程序和要求进行:
采集检材语声(录音)
在采集犯罪人或证人的语声作检材时,录音宜采用高保真录音机。采集语声的要求是:
①录音应当尽量在不被对方发觉的情况下进行,以减少假象的干扰,保证语声的真实;
②应尽量防止环境噪声和录音设备的干扰。麦克风与被录对象保持适当距离。尽量不用失真大 的袖珍盒式录音机,电源最好用市电,保持电流稳定。电话录音时应使用传感器,不要将听筒直接对着“麦克”录音。磁带应选用优质新带。
采集样本语声(录音)
除了遵照采取检材时要求的器材和注意事项外,应尽量保持同采集检材时相同、相近的语声环境、距离、设备及速度;并建议在样本中有与检材相同的词句,以供特征比对。
审听和选择
鉴定人员要先对捡材和样本分别反复审听和记录,从中选择正常而清晰的语声段落,再进一步选取相同的字、词、句,作为供比较的部分。然后使用语图仪分别将选好的检材与样本中的字、词、句做出声纹图。
声纹特征的选择
在被比较的两种声纹图谱中,分别选取明显、稳定的特征作为比较特征。一般说,
共振峰的频率值及其走向是最稳定的特征,而且具有很强的特定性,利用价值最高;而时长、音强、波形等特征稳定性较差,可做参考。在天聪鉴定过程中,还可以从同一个人的语声中选择多个相同字、词或句的语图,在分析比较中抓住其稳定而特殊的特征作为依据。
比较
比对检材与样本中相同字、词的声纹中的同类特征(如共振峰频率、走向及波形),进行比较分析,找出相同点和差异点。
综合评断
①如果被比较的全部特征完全吻合;或者稳定性强的特征完全吻合,而只是稳定性差的特征有些差异,均可做同一认定结论;
②如果被比较的稳定性强的特征差异较大,还可以补充样本再做语图比较,倘仍有差异,又无法解释,则可做否定结论。
声纹送检时的注意事项
说话人在不同的环境和不同的心态下,以及不同的语气、不同的健康状况都会引起语音的某些变异。录音环境(
噪音、回声、距离)的干扰以及录音设备不良,也会使录制的语音产生假性变异。因此,送检时,要把录制检材和样本时的
环境状况、录制距离、录制方式、使用机器、以及在什么情况下录制等情况加以详细记载,一并提交鉴定人,以便对差异点进行客观的分析评断。
声纹鉴定的发展状况
辨声之举,自古有之,说明人早知道声音人各不同。但那仅仅是凭
听觉器官的分辨能力。科学的声纹研究是以完善的录音设备为基础的,而且最先是为战争服务的。第二次世界大战后期,为了提高军事通讯效率的需要,电话电报公司的贝尔实验室研究和发明了
“音响光谱图象显示器”,
把声波用光谱图象加以显示。战争结束,这项研究亦中止。
到了五、六十年代,美国纽约市的绑票、电话恐吓案件骤增,为了侦讯工作的需要,贝尔实验室受执法部门委托,恢复对声纹的研究。他们对一百二十三名健康美国人的“I、you、it(我、你、是)等词语的二万五千个声纹图进行了五万多项鉴定分析,
个人识别的准确率达到97- 99·65%。从一九六六年开始,贝尔实验室开始培训警官,推广应用这项技术。至七十年代,日本、罗马尼亚、西德等都相继开展了声纹鉴定技术,以对付恐怖犯罪活动。随着科学技术的进步,声纹鉴定手段也日益先进。国际声纹鉴定并行两套系统:一是声纹的自动识别系统,它以电子计算机为主体,具备分析、储存、检索、鉴定多项功能,可以根据语声进行全自动分析,最后给出结论,如天聪的TS-VPR声纹鉴定分析系统。但这种结论的准确性同专家设定的特征吻合量(
阈值)有关。二是声纹的人工识别系统,它以语图仪为支持,鉴定人直接观察和分析声纹,寻找特征,测量数据并进行比较与评断,最后得出结论。
在声纹资料的存储技术上,已发展到激光光盘存储,先以激光源对待储声纹图谱进行扫描,获得傅立叶光谱,再通过电脑把光谱记录的声纹特征转换成数据,最后通过电脑控制的激光针将待储声纹特征的数据存入光盘纹线中。当需检索时,再用激光针通过电脑系统输出光盘中的信号,即可进行声纹比较。这种存储技术容量很大,一张光盘可以储存数百万人的声纹。
过去,我国对声纹鉴定技术长期持保守态度,因而起步很晚。直到一九八八年,中国刑警学院才率先在
文检系成立了全国第一个声纹鉴定实验室,引进了美国KAY 公司生产的7800型语图仪,进行实验研究,并推动了在办案中的实际应用。一九九零年,公安部第二研究所文检室引进了美国KAY公司5500型语图仪。这两家均已应用于办案,取得了很好的成效。南京、上海也已同有关部门合作,进行了声纹鉴定的研究与应用。国内也有一些专业公司,可提供声纹鉴定软件和服务。