语音技术带来的表单查询交互改进

语音形式分层

命令

每下达一次命令,就相当于触发一次事件。
如何提高语音命令转化文字的准确性?

  1. 提供上下文
    例如:表单重置就比重置的识别率高。

  2. 提前打标
    例如:把同志,通知,通吃都当做重置。

  3. 机器学习改进
    例如:发音在谐音库范围内,统统识别成重置。

  4. 消除环境噪音
    例如重置的,重置嘿。
    方法一:
    不用笔记本内置麦克风,用耳麦。
    方法二:
    通过(文本编辑距离/文字个数)函数,设定一个临界值。
    其中0算是匹配OK。除0外,值越靠近1匹配越精确。

一句话

命令能触发事件,调用方法。
一句话则不仅能调用方法,还能传参。
例如:查询工号007的薪资
经分析,查询薪资是用户意图;工号007是参数。
然后调用预设的方法,输出结果即可。
怎么分析呢?
使用依存句法分析

依存句法分析通过分析语言单位内成分之间的依存关系揭示其句法结构。
直观来讲依存句法分析识别句子中的“主谓宾”、“定状补”这些语法成分,并分析各成分之间的关系。

例如:
查询工号007的薪资
依存句法分析标注关系 (共15种) 及含义如下:
依存句法分析标注关系

实际使用存在的问题:
环境噪音和个人说话习惯。
即语音输出的文字,不是一个完整结构的句子。
这会导致句法分析结果错误。
改进方法:
还是得靠提前打标 和 机器学习改进,把结构不完整的句子 自动修复成 完整结构句子。

对话问答

有了能传参、能调用方法的一句话,我们还需要引导。
例如:查询
你可以查询员工薪资,还可以查询员工基本信息
查询员工薪资
你可以通过工号查具体某人,也可查某部门下所有员工。
你可以说查询工号007的薪资,也可以说查询信息平台的员工薪资

对话的沟通细节很多,关键在于构建对话流程。
以后会出现面向对话编程

语音交互对报表网页的改进

  1. 快速填写部分表单域。
  2. 快速完成简单查询功能。
  3. 快速进行表单新增操作。
  4. 国际化句子的本地化比网页中的单词本地化更自然。
  5. 当前的视觉交互可能会作为语音交互的辅助。
posted @ 2017-11-23 12:03  草珊瑚  阅读(569)  评论(0编辑  收藏  举报