设备,比如键盘、鼠标、手写板、显示器等,利用这些方式虽然可以满足信息输入和输出,实现基本人机交互,但是针对越来越多的智能设备的出现,传统的输入方式逐渐显得力不从心。
通过语音合成技术,可以将信息通过声音的方式与人进行交流,通过自动语音识别,不但可以完成文本输入工作,还可以进行设备控制,从而实现更为简便、有效的人机交互。人机交互可以应用于智能手机、智能家电、汽车控制、有声校对、语音应答系统、信息库查询系统、残疾人辅助发音等多个方面。
(五)身份确认
身份确认主要采用声纹识别技术,其主要应用场景是确认说话人是否为特定人。声纹识别技术已经逐渐走向实际应用,很多公司都根据这项技术应用到业务系统,比如ATT应用声纹识别技术研制出的智慧卡(SmartCard),将其应用于自动提款机上;Nua
ce公司推出了Nua
ceVerifier,在电信网上实现文本激励的说话人识别,已经可靠应用于金融服务等系统。其他一些商用系统还包括:ITT公司的SpeakerKey、Keyware公司的VoiceGuardia
、TNETIX公司的SpeakEZ等。
(六)身份辨认
身份辨认同样也主要采用声纹识别技术,其主要应用场景为对特定语音进行分析,确认其身份,这种应用可应用于公安司法以及军队和国防。如:对于各种电话勒索、绑架、电话人身攻击等案件,身份辨认可以在一段录音中查找出嫌疑人或缩小侦察范围;身份辨认可以发现电话交谈过程中是否有特定说话人出现,继而对交谈的内容进行跟踪,并可以对发出命令的人的身份进行确认(敌我指战员鉴别),目前此术在国外军事方面已有所应用。
二、存在问题
尽管智能语音技术在技术上已经获得突破性进展,然而在实际应用过程中语音识别技术仍然面临着一些难点,特别是针对语音识别技术:
(一)对环境依赖性较大,抗干扰能力较差
f龙源期刊网httpwwwqika
comc
语音采集时,不可避免会混入环境噪声,同时由于采集设备的不同也会对采集结果造成影响,这些影响都会影响到最终识别结果。
(二)地方口音的差异造成影响
语音往往存在地域性,他不同于语种。比如北方与南方人同样讲普通话,差异还是非常明显,这些都对识别工作造成一定的影响。
(三)自然语言的随机性、多变性
针对于语音朗读,目前的语音识别技术已经有很好的效果,但是实际生活中,人们讲话都较为随意,同时伴随讲话时的情绪,这些都会对语音识别结果造成较大影响。
但我们相信,随着技术的不断发展,通过语音素材数据的不断积累,相信这些问题将会逐步被解决。
三、结束语
人与r