声纹识别电话架起监狱亲情帮教的桥梁
监狱的会见有助于家庭的亲情作用参与到服刑人员的教育改造过程中。但是监狱传统的会见方式受时间、地点的限制比较大,同时,监狱管理上也要承担大量的工作。通过一系列的监狱信息化应用项目,可以提高监狱的管理水平、工作效率,推进监狱的信息化建设。 针对监狱行业特点,监狱建设了“监狱声纹识别亲情电话管理系统”,平台主要应用已经获得国家发明专利及国家实用新型专利: 基于声纹识别技术的亲情电话系统与亲情电话通讯方法获国家发明专利,专利号ZL 2010 1 0274490.6
一种基于声纹识别的亲情电话系统获国家实用新型专利,专利号ZL 2010 2 0520121.6
监狱声纹识别亲情电话管理系统介绍
监狱的会见工作是监狱管理中不可缺少的一环,有助于家庭的亲情作用参与到服刑人员的教育改造过程中。监狱传统的会见方式是服刑人员亲属从四面八方,在规定时间内赶到监狱,在指定地点进行面对面的会见,受时间、地点的限制比较大,也给犯属带来舟车劳顿、经济负担等问题。同时,监狱管理上也要承担大量现场管理工作,如犯属的物品登记、侯见室、会见室秩序的维持等等。
远程会见系统充分利用网络技术、通信技术、视频音频媒体技术、数据库技术以及生物认证技术等多种现代信息技术,采用远程认证、远程视频会见,拉近了服刑人员和犯属的距离,实现远程“面对面”的会见。并且,监狱部门可以对整个会见流程进行审批、监视、插话、拆线、复播等任何操作。远程会见系统能更好地提高监管的管理水平、工作效率,推进监狱的现代文明建设。
声纹识别系统
目前市场上常见的几种生物特征识别技术比较如表1:
本系统主要采用声纹认证的方式来完成,即根据说话人的声音特征确定说话人身份。声纹识别技术及其产品,作为生物特征认证技术之一,在安全性、易用性与普适性等方面具有天然优势。如表2。
1. 声纹识别中跨信道问题的存在
电话管理系统是由运营商提供中继专线,按ISDN-PRI 的方式提供呼叫信令和语音电路。数字交换系统进行电话呼叫控制、电路交换控制、通话录音、监听、插话、截断等。在一定的条件下,识别效果与实际应用要求仍有一定的距离,主要表现在跨信道问题。
2. 跨信道问题成因:
跨信道问题的成因在于语音的传输信道或语音采集设备会对说话人的语音产生畸变。对于语音信号的传输信道,其压缩编码损失、传输误码损失等原因会使语音产生畸变,监狱亲情电话网络中含有GSM 、CDMA 、小灵通等移动传输信道,也有PSTN 、IP 电话等固定电话传输信道,同时也包括无绳电话的短距离传输信道,不同类型的传输信道对语音造成的畸变是各不相同的。
不同的语音采集设备由于本身的硬件特性原因也会使监狱亲情电话产生一定的畸变,不同的语音采集设备包括不同型号的手机、座机的电话话筒,不同型号、品质的麦克风等,这些不同语音采集设备产生的监狱亲情电话语音畸变也是各不相同的。因此,一个服刑人员亲属的语音,在经过不同的传输信道或语音采集设备后,得到的语音信号也是各有不同的。
3. 监狱亲情电话系统的跨信道问题:
监狱亲情电话系统中服刑人员亲属声纹认证时,基本只能是一次性的声纹认证,即一次性对服刑人员亲属在某一种传输信道下的某一种设备采集的语音进行采集,并进行声纹登记。但后续服刑人员亲属进行亲情通话时,系统的声纹识别语音则会可能来自于不同的传输信道或语音采集设备,由此会造成识别语音畸变与采集登记的声纹语音不匹配,即说话人识别的跨信道问题,这种不匹配会对说话人识别的性能产生很大的负面影响。
4. 解决跨信道问题方法
为解决跨信道问题,国内外研究学者提出了各种方法。一种解决的方式是为说话人分别采集在不同信道下的语音信号训练信道相关的说话人模型,在识别时使用与识别语音匹配的信道下训练的说话人
模型进行识别。但是由于实际应用条件的限制,简单地采用为一名说话人训练不同信道下的多个模型的策略是比较困难甚至是不可行的。
监狱亲情电话的传输信道种类较多,仅中国国内的移动电话网就有GSM 、CDMA 、小灵通三种传输信道,而同一种传输信道下手机的型号又种类繁多,在操作成本和使用者的可接受程度上不可能要求每个服刑人员亲属在不同的信道下都进行多个通话,并进行不同的声纹登记。因此,必须寻找一种信道鲁棒的识别方法,减轻或消除跨信道对说话人识别的负面影响,使说话人识别的性能达到实用中要求的水平。
支持向量机解决方案:
支持向量机(support vector machine,SVM )是一种基于统计学习理论的机器学习方法,它是由Boser ,Guyon ,Vapnik 在COLT-92上首次提出,从此迅速发展起来。SVM 可以有效地解决分类、回归以及分布估计等问题,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。
说话人识别系统本质上是一个基于统计模式的识别系统,其核心是分类问题,而支持向量机SVM 正是一个分类器。高斯混合模型虽然在解决说话人识别问题上能取得很好的效果,但是受到极大似然准则的限制,类区分能力较弱,它反映的是同类样本之间的相似度,而SVM 则能区分异类样本之间的差异,具有很强的分类能力。SVM 应用于说话人识别系统,对信道有较高的鲁棒性。
针对跨信道技术难题,监狱亲情电话将基于SVM ,重点研究高斯超级向量(Gaussian Supervector,GSV ),把UBM 自适应后的GMM 作为GSV ,并和SVM 相结合,构建区别性模型。我们将对SVM 核函数的选择、说话人确认系统中的阈值设置和评分规整等方面进行深入研究。GSV 作为前级模型主要起了两个作用,对特征数据集进行有区分性的特征变换及数据压缩,并以其多维概率输出作为后级模型SVM 的输入矢量。同时,我们考虑集成分数规整T-Norm 及联合因
素分析(Joint factor analysis,JFA )方法,最大限度减少信道对说话人识别的干扰,使得系统能够依据较短的语音,在跨信道领域,可靠地鉴别说话人的身份。
系统体系结构
系统采用三层Client/Server体系结构如图1。
系统硬件组网结构
数字交换系统:
运营商提供中继专线,按ISDN-PRI 的方式提供呼叫信令和语音电路。数字交换系统进行电话呼叫控制、电路交换控制、通话录音、监听、插话、截断等。
数模分流交换机:
提供模拟音频电话接口,外接电话分机。数模分流交换机和数字交换系统通过中继线连接。
声纹识别引擎:
在通话过程中,数字交换系统进行家属的声音特征采集,把采集数据送给声纹识别引擎进行身份认证。
应用服务器:
应用服务承载业务数据库,录音文件存放、备份,通话流程模块运行等。
管理终端:
管理终端提供管理员进行业务登记,通话监控,系统查询,录音管理等。
业务功能介绍
系统管理分为3种角色使用:
第1种是监狱管理方,可以设置多个管理员可以分配不同权限,每个管理员使用工号和密码对自己进行管理。管理员可以管理整个系统的所有业务功能。
第2种是电话监管人,对犯人的一起业务应用进行监控管理。 第3种是犯人,犯人是系统的最终用户,可以进行和家属电话联系。
在会见实施过程中,管理人员可以实时监控,并依据不同情况进行干预。系统包含以下模块:
1. 数据库管理
2. 远程会见管理功能
3. 会见预约及查询、确认功能
4. 通话音频录制功能
5. 自动提醒和报警功能
6. 文件管理功能
7. 实时认证功能
声纹识别电话架起监狱亲情帮教的桥梁
监狱的会见有助于家庭的亲情作用参与到服刑人员的教育改造过程中。但是监狱传统的会见方式受时间、地点的限制比较大,同时,监狱管理上也要承担大量的工作。通过一系列的监狱信息化应用项目,可以提高监狱的管理水平、工作效率,推进监狱的信息化建设。 针对监狱行业特点,监狱建设了“监狱声纹识别亲情电话管理系统”,平台主要应用已经获得国家发明专利及国家实用新型专利: 基于声纹识别技术的亲情电话系统与亲情电话通讯方法获国家发明专利,专利号ZL 2010 1 0274490.6
一种基于声纹识别的亲情电话系统获国家实用新型专利,专利号ZL 2010 2 0520121.6
监狱声纹识别亲情电话管理系统介绍
监狱的会见工作是监狱管理中不可缺少的一环,有助于家庭的亲情作用参与到服刑人员的教育改造过程中。监狱传统的会见方式是服刑人员亲属从四面八方,在规定时间内赶到监狱,在指定地点进行面对面的会见,受时间、地点的限制比较大,也给犯属带来舟车劳顿、经济负担等问题。同时,监狱管理上也要承担大量现场管理工作,如犯属的物品登记、侯见室、会见室秩序的维持等等。
远程会见系统充分利用网络技术、通信技术、视频音频媒体技术、数据库技术以及生物认证技术等多种现代信息技术,采用远程认证、远程视频会见,拉近了服刑人员和犯属的距离,实现远程“面对面”的会见。并且,监狱部门可以对整个会见流程进行审批、监视、插话、拆线、复播等任何操作。远程会见系统能更好地提高监管的管理水平、工作效率,推进监狱的现代文明建设。
声纹识别系统
目前市场上常见的几种生物特征识别技术比较如表1:
本系统主要采用声纹认证的方式来完成,即根据说话人的声音特征确定说话人身份。声纹识别技术及其产品,作为生物特征认证技术之一,在安全性、易用性与普适性等方面具有天然优势。如表2。
1. 声纹识别中跨信道问题的存在
电话管理系统是由运营商提供中继专线,按ISDN-PRI 的方式提供呼叫信令和语音电路。数字交换系统进行电话呼叫控制、电路交换控制、通话录音、监听、插话、截断等。在一定的条件下,识别效果与实际应用要求仍有一定的距离,主要表现在跨信道问题。
2. 跨信道问题成因:
跨信道问题的成因在于语音的传输信道或语音采集设备会对说话人的语音产生畸变。对于语音信号的传输信道,其压缩编码损失、传输误码损失等原因会使语音产生畸变,监狱亲情电话网络中含有GSM 、CDMA 、小灵通等移动传输信道,也有PSTN 、IP 电话等固定电话传输信道,同时也包括无绳电话的短距离传输信道,不同类型的传输信道对语音造成的畸变是各不相同的。
不同的语音采集设备由于本身的硬件特性原因也会使监狱亲情电话产生一定的畸变,不同的语音采集设备包括不同型号的手机、座机的电话话筒,不同型号、品质的麦克风等,这些不同语音采集设备产生的监狱亲情电话语音畸变也是各不相同的。因此,一个服刑人员亲属的语音,在经过不同的传输信道或语音采集设备后,得到的语音信号也是各有不同的。
3. 监狱亲情电话系统的跨信道问题:
监狱亲情电话系统中服刑人员亲属声纹认证时,基本只能是一次性的声纹认证,即一次性对服刑人员亲属在某一种传输信道下的某一种设备采集的语音进行采集,并进行声纹登记。但后续服刑人员亲属进行亲情通话时,系统的声纹识别语音则会可能来自于不同的传输信道或语音采集设备,由此会造成识别语音畸变与采集登记的声纹语音不匹配,即说话人识别的跨信道问题,这种不匹配会对说话人识别的性能产生很大的负面影响。
4. 解决跨信道问题方法
为解决跨信道问题,国内外研究学者提出了各种方法。一种解决的方式是为说话人分别采集在不同信道下的语音信号训练信道相关的说话人模型,在识别时使用与识别语音匹配的信道下训练的说话人
模型进行识别。但是由于实际应用条件的限制,简单地采用为一名说话人训练不同信道下的多个模型的策略是比较困难甚至是不可行的。
监狱亲情电话的传输信道种类较多,仅中国国内的移动电话网就有GSM 、CDMA 、小灵通三种传输信道,而同一种传输信道下手机的型号又种类繁多,在操作成本和使用者的可接受程度上不可能要求每个服刑人员亲属在不同的信道下都进行多个通话,并进行不同的声纹登记。因此,必须寻找一种信道鲁棒的识别方法,减轻或消除跨信道对说话人识别的负面影响,使说话人识别的性能达到实用中要求的水平。
支持向量机解决方案:
支持向量机(support vector machine,SVM )是一种基于统计学习理论的机器学习方法,它是由Boser ,Guyon ,Vapnik 在COLT-92上首次提出,从此迅速发展起来。SVM 可以有效地解决分类、回归以及分布估计等问题,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。
说话人识别系统本质上是一个基于统计模式的识别系统,其核心是分类问题,而支持向量机SVM 正是一个分类器。高斯混合模型虽然在解决说话人识别问题上能取得很好的效果,但是受到极大似然准则的限制,类区分能力较弱,它反映的是同类样本之间的相似度,而SVM 则能区分异类样本之间的差异,具有很强的分类能力。SVM 应用于说话人识别系统,对信道有较高的鲁棒性。
针对跨信道技术难题,监狱亲情电话将基于SVM ,重点研究高斯超级向量(Gaussian Supervector,GSV ),把UBM 自适应后的GMM 作为GSV ,并和SVM 相结合,构建区别性模型。我们将对SVM 核函数的选择、说话人确认系统中的阈值设置和评分规整等方面进行深入研究。GSV 作为前级模型主要起了两个作用,对特征数据集进行有区分性的特征变换及数据压缩,并以其多维概率输出作为后级模型SVM 的输入矢量。同时,我们考虑集成分数规整T-Norm 及联合因
素分析(Joint factor analysis,JFA )方法,最大限度减少信道对说话人识别的干扰,使得系统能够依据较短的语音,在跨信道领域,可靠地鉴别说话人的身份。
系统体系结构
系统采用三层Client/Server体系结构如图1。
系统硬件组网结构
数字交换系统:
运营商提供中继专线,按ISDN-PRI 的方式提供呼叫信令和语音电路。数字交换系统进行电话呼叫控制、电路交换控制、通话录音、监听、插话、截断等。
数模分流交换机:
提供模拟音频电话接口,外接电话分机。数模分流交换机和数字交换系统通过中继线连接。
声纹识别引擎:
在通话过程中,数字交换系统进行家属的声音特征采集,把采集数据送给声纹识别引擎进行身份认证。
应用服务器:
应用服务承载业务数据库,录音文件存放、备份,通话流程模块运行等。
管理终端:
管理终端提供管理员进行业务登记,通话监控,系统查询,录音管理等。
业务功能介绍
系统管理分为3种角色使用:
第1种是监狱管理方,可以设置多个管理员可以分配不同权限,每个管理员使用工号和密码对自己进行管理。管理员可以管理整个系统的所有业务功能。
第2种是电话监管人,对犯人的一起业务应用进行监控管理。 第3种是犯人,犯人是系统的最终用户,可以进行和家属电话联系。
在会见实施过程中,管理人员可以实时监控,并依据不同情况进行干预。系统包含以下模块:
1. 数据库管理
2. 远程会见管理功能
3. 会见预约及查询、确认功能
4. 通话音频录制功能
5. 自动提醒和报警功能
6. 文件管理功能
7. 实时认证功能