作业一

简介

语音识别作为常见的人工智能应用,它可以将口语单词转换为文本,对文本进行处理以得出其含义。由于人类经常以口语,缩写和首字母缩写讲话,因此需要对自然语言进行大量的计算机分析才能产生准确的转录。

应用

语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。

语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

原理

语音识别的本质是一种基于语音特征参数的模式识别,通过提取语音中的关键点,对语音进行一定的处理,然后按一定模式进行分类,进而依据判定准则找出最佳匹配结果。

分类

从语音识别算法的发展来看,语音识别技术主要分为三大类,第一类是模型匹配法,包括矢量量化(VQ) 、动态时间规整(DTW)等;
第二类是概率统计方法,包括高斯混合模型(GMM) 、隐马尔科夫模型(HMM)等;
第三类是辨别器分类方法,如支持向量机(SVM) 、人工神经网络(ANN)和深度神经网络(DNN)等以及多种组合方法。下面对主流的识别技术做简单介绍:

不足

对于方言和杂音的识别率不够.作为一种常见及经常使用的技术,语音识别应该需要继续降低成本,降低识别所需语料库的大小.

我国

我国数据来源丰富,可以为研究提供更多的语料,而且有诸如迅飞等发展迅猛,技术成熟的公司

但是,我国方言众多,口音繁杂,语音识别离可以全民使用还有一段距离.

posted @ 2020-04-23 07:51  纪华裕  阅读(181)  评论(2编辑  收藏  举报