音助手软件规格说明书(SRS)
青岛大学FirstDreamTeam小组
32功能一语音识别与输入
321功能说明
此功能应该是本系统实现主功能的基础重要功能,优先级高。
322功能描述
要求系统能够准确识别用户通过终端输入的语音,在任何可以输入文字的地方根据用户语音命令输入文字,并也可以帮助用户使用语音进行Wi
dows的常规操作(涉及语音控制)。语音识别是大赛要求中提到的技术难点之一。用户对着麦克风说话,实现和计算机的互动,实际上是我们的产品接受了用户说的内容,然后把声音转换为文字,在命令模式下,实现了用户说什么计算机则会根据用户所说的命令执行相应的操作。当用户的命令计算机不存在或用户说的不准确时,我们的精灵则会提醒用户没有该命令,或说的命令不准确提醒用户请再说一遍。在输入模式下,实现了完全取代键盘和鼠标的操作,使用户不用再利用鼠标和键盘向计算机传输输入的信息文字,在此模式下,用户说什么,计算机就会“写”什么。同时,输入模式和命令模式可以相互转换。
33功能二屏幕取词
331功能说明
屏幕取词功能同样是实现主控制功能的重要基础功能,是实现语音识别的重要基石之一。其优先级别也较高。
332功能描述
通过此功能能够取得桌面,系统窗体,以及任务栏、选项卡、标签等其内部的任何文本,在命令模式下,根据用户说出的命令,在打开的窗体中进行“查找”和“匹配”,在模糊匹配的协助下,找到用户说出的命令然后执行相应的操作。此功能在描述上简单,但是实现上将是一个难点,屏幕取词同样也是大赛要求中提到的技术难点之二。
34功能三语音控制
341功能说明
16
fWi
dows语音助手软件规格说明书(SRS)
青岛大学FirstDreamTeam小组
语音控制功能是本系统的主功能及核心功能,语音控制计算机的各个内部操作。其优先级别最高。
342功能描述
在语音识别,屏幕取词的基础上实现的语音控制最终达到协助用户在任何可以输入文字的地方根据用户语音命令输入文字,并也可以帮助用户使用语音进行Wi
dows的常规操作,如启动某某软件,关闭当前窗口,关闭Wi
dows,点击特定按钮或选择指定的菜单项,激活某个正在运行的软件窗口(即使得该软件窗口获得焦点),拷贝屏幕区域,上翻或下翻当前正在浏览的网页或阅读的文章,删除文件,清空文件垃圾桶等等基础操作。同时,基于屏幕取词和模糊匹配的协助下,语音控制实现了更深一层的突破,使用户想要计算机执行什么操作,只要对我们的产品下命令,应用程序就会r