语音转写操作手册
(三层)
一、用脚本打开语音文件
1点击praatope
readfromfile找到你打开的文件打开选中同一个文件名的两个文件ViewEdit;
2Ctrl2可以同时两层打点,AltBackspace可以删除时间点;做完以后CtrlS保存到根文件下面;请参看培训视频。
二、开始标注语音文件
时间边界定位:按Tab键可以播放语音,再次按Tab键Esc键可以停止播放语音按Ctrli可以放大波形;Ctrlo可以缩小波形。建议放大12标注。听音,在整段电话语音的基础上,根据语义和停顿时间等因素,在音频信号中每一句话的句首和句尾分别添加时间边界。
添加时间边界的方法为:将鼠标移动到语音波形的相应位置,这时
f会出现一条虚线以及圆圈,分别点击SPEAKER层和CONTENT层对应的圆圈即可。或者直接Ctrl2可以自动同时在SPEAKER层和
CONTENT层打上时间点。在整个语音文件中,SPEAKER层和CONTENT层的时间边界的数目是完全一致的,每一对时间边界也
是完全相等的。请注意,SPEAKER层和CONTENT层的时间边界必须保持一致。也就是说不管点击哪一层的时间边界,另外一层一定是空心蓝色,而不是实心蓝色
文件标注:GLOBAL层主要标注语音文件的一些全局信息,包括说话人性别信息和语种信息(方言区)。标注格式如下:
fspeaker空格1空格性别空格2空格性别空格la
guage空格1空格方言区空格2空格方言区例如:
speaker1male2femalela
guage1普通话2普通话
speaker1male2malela
guage1普通话2普通话
speaker1female2femalela
guage1普通话2普通话
speaker1female2malela
guage1普通话2普通话
SPEAKER层需要标注的是说话人信息,“说话人”取值为以下两种:1、2,分别表示说话人1、说话人2。(说话人1、2仅标注在文字段上,符号段不标注)
如果是客服类对话,则SPEAKER层的“说话人”取值为1的语音,必须是话务员;用户的语音取值为2
客服定义为奇数,用户为偶数;(客服一定是和用户有直接对话,否则不算客服)如果第三个人是用户的情况:speaker1female2female4femalela
guage1普通话
2普通话4普通话
fCONTENT层需要标注的是该句对应的文字,如果是汉语交谈,则只能用简体汉字。对于语音中的数字部分需根据发音情况转换为对应的汉字,例如“27”→“二十七”;“我的电话是2381832”→“我的电话是二三八幺八三二(与发音相同)”。
fCONTENT层正常语音的标注如果此语段为某一个人的汉语对话语音,请在SPEAKER和CONTEr