摘要:
前言:自己动手推导了一下经典的前向反馈神经网络的算法公式,记录一下。由于暂时没有数据可以用作测试,程序没有实现并验证。以后找到比较好的数据,再进行实现。一:算法推导 神经网络通过模拟人的神经元活动,来构造分类器。它的基本组成单元称为”神经元”,离线情况下如果输入大于某值时,设定神经元处于兴奋状态,产生输出,否则不响应。而这个输入来自于所有其它的神经元。而神经元的响应函数有多种(需要满足可微,这种简单的函数可以拟合任何非线性函数),本文选择sigmod函数。关于基础知识在此不在多说,这里主要介绍一下BP神经网络,并推导权值和阈值的更新公式。 BP网络通过前向反馈误差来改变权值和阈值,当网络的.. 阅读全文
随笔分类 - 语音识别算法
HTK代码中的log-add算法实现
2012-12-07 10:44 by 钱吉, 1490 阅读, 收藏,
摘要:
在语音识别处理中,一般采用基于高斯混合模型的HMM框架。在模型的训练中(如htk的代码),涉及到大量的概率值计算,这些概率值往往是很小的浮点数。而且概率值相乘后会越变越小,计算起来会损失精度,为了保持准确度,统一将这些概率值进行log处理,再参与运算。也就是说,在代码中处理的概率是对数域的值,即:p1' = logp1p2' = logp2在对数域中,乘法和除法变换为:loga*b = loga + logb; loga/b = loga - logb;所以对于p=p1*p2,则转换到对数域后变为:p' = logp = logp1*p2 = logp1+logp2 = 阅读全文
plp特征提取原理和方法
2012-10-12 12:06 by 钱吉, 9531 阅读, 收藏,
摘要:
LPC(Linear Predictive Coding,线性预测分析):由于语音信号的发音特性,提取特征后的帧与帧之间是不独立的,那么我们可以用前面的帧或后面的帧预测当前帧。所求的的预测系数就是我们要用到的特征。线性预测分析中,我们可以用一个全极点滤波器为声道响应函数建模,即y(z)=x(z).H(z).以最小化预测误差为目标优化系数a,就可以得到特征系数。通常采用自相关方法,利用durbin算法求解方程。这里给出参数计算公式:1) 给定一个窗内的采样点信号{sn,n=1,N},它的自相关序列计算公式为:,i=0,p.2) 滤波器还有一个反射系数{ki},可以理解为声道的反射系数,和预测误差 阅读全文
(转:htk中命令行参数的读取)
2012-10-12 11:28 by 钱吉, 844 阅读, 收藏,
摘要:
由于不知道来源出处了,请原作者见谅,如有需要请告知源地址。这里只是贴出来mark一下,以后便于查看。#include <stdio.h>#include <stdlib.h>#include <string.h>#include <ctype.h>static int argcount; /* total args = argc */static int nextarg=1; /* next arg to return in GetxxxArg */static char **arglist;/* ----------- Command Line 阅读全文