2014年5月16日

PCFG -- 基于统计方法生成语法树

摘要: 语法树的作用 一棵语法树不仅包括了词性(part of speech), 还包括了短语(如名词短语, 动词短语)和结构化的信息(如主语, 谓语和宾语). 这些信息是进行机器翻译所必须的, 例如机器翻译中就需要使用到结构化信息, 来根据不同的语言规定调整主谓宾的顺序.上下文无关语法 上下文无关语法... 阅读全文
posted @ 2014-05-16 21:26 zhouksh 阅读(6603) 评论(0) 推荐(1)

线性判别分析

摘要: 阅读全文
posted @ 2014-05-16 11:36 zhouksh 阅读(141) 评论(0) 推荐(0)
2013年6月24日

通用线性模型

摘要: 监督学习解决这样一个问题:给定一组带标签的样本,要求为样本集建立一个模型/假设(hypothesis),使得模型可以较准确的预测未知对象的标签。模型可以表示为h(x) = y,而每个样本可表示为(x, y),其中x为输入变量,称作特征,而y为输出变量,称作目标变量(即标签)。对于待预测的标签如果是离散值,则称该类监督学习问题为分类问题;如果是连续值,则称作回归问题。 显然监督学习要解决的第一个问题是选择一个什么样的模型。选择了某一个模型之后,接下来的问题是如何训练这个模型以确定模型的参数(好比如假设随机变量遵从某个分布之后,如何运用样本做参数假设)。下面将从解决一个简单的线性回归问题开始... 阅读全文
posted @ 2013-06-24 23:26 zhouksh 阅读(1280) 评论(0) 推荐(0)