全球旧事资料 分类
NT标注时间边界,SPEAKER层标注1或者2,CONTENT层输入相应的文本。如果此语段为两个人交叉语音,关于重叠(交叉)的语音,即对于某个人的一句话未完,另一个人的一句话已经开始的情况:请在SPEAKER层和CONTENT层标注时间边界,SPEAKER层不标注内容,CONTENT层标注“”对于叠加,必须是真实的。不能将大段的听不清语音和叠加混在一起。叠加段内的非叠加部分,前后最多不得超过1个字。至于由于添加叠加的时间边
f界导致的半个语音(即切掉头或者尾)可用或UNK来表示。和UNK取决于是单段的听不清,还是在语音中听不清。在整个语音中,需根据说话人的变换来增加时间边界。如果同一说话人说话时间较长,则应根据其语义来增加时间边界,每个时间段的长度最多不能超过8s,但断句也不要太散太短。每个自然语言段平均在56秒左右即可。每个时间边界的最佳位置在音频能量的最低点(即波谱图上黑色部分最淡的地方),如果仅有几个字包含不进来,那么建议舍弃这几个字
英文:英文小写【单词】对于语音中简单的英文单词,在能听懂的情况下,直接标出即可。特殊符号用发音标注,不写特殊符号。例如:“网址是三w点si
a点com”;“二三八幺八三二艾特qq点com”;(不要写)“请以井号键结束”;(不要写)
【字母】每个字母中间用空格隔开。例如:good表
f示单词读音,good则表示字母读音。例如:我的编号是fms幺三二
如果发音是表示应答的“嗯”,统一都用“嗯”,不要用“恩”或者“厄”。其他的这种口头发音,也需要用带口字旁的汉字标注。比如哦,啊,唉等
CONTENT层短暂噪音的标注短暂噪音是指非常短暂的突发的声音,所有此类标注都是中括号与语音内容的组合,不要标注时间边界。
1听不清的一个字英文单词直接在句子中标注UNK。例如:二三八幺八UNK二
f2两个或者两个以上听不懂的字,标注听不清的长句方言大段的英文句子拿着话筒和其他人说话
3短暂的笑声:直接在句子中标注LAUGH。4短暂的由说话人发出的干扰浊音:直接在句子中标注
SONANT
咳嗽声
打喷嚏清嗓子
f5系统提示音,即系统播出的语音提示:PROMPT系统自动播放的语音内容,而非说话人的语音内容(第二层不用标说话人)
例如:PROMPT欢迎致电我公司现在由一号客服代表为您服务
CONTENT层持续噪音的标注持续噪音是指比较长的一段声音,所有此类标注都是单独的噪音类型,需要标注中括号和时间边界,SPEAKER层不标注内容1r
好听全球资料 返回顶部