摘要:
1. 问题 这节我们请出最后的有关成分分析和回归的神器PLSR。PLSR感觉已经把成分分析和回归发挥到极致了,下面主要介绍其思想而非完整的教程。让我们回顾一下最早的Linear Regression的缺点:如果样例数m相比特征数n少(m<n)或者特征间线性相关时,由于(n*n矩阵)的秩小于特征个数( 阅读全文
posted @ 2016-04-27 19:04
加拿大小哥哥
阅读(702)
评论(0)
推荐(0)
摘要:
1 问题 模型选择问题:对于一个学习问题,可以有多种模型选择。比如要拟合一组样本点,可以使用线性回归,也可以用多项式回归。那么使用哪种模型好呢(能够在偏差和方差之间达到平衡最优)? 还有一类参数选择问题:如果我们想使用带权值的回归模型,那么怎么选择权重w公式里的参数? 形式化定义:假设可选的模型集合 阅读全文
posted @ 2016-04-27 13:17
加拿大小哥哥
阅读(4202)
评论(0)
推荐(1)
摘要:
问题:假设在IR中我们建立的文档-词项矩阵中,有两个词项为“learn”和“study”,在传统的向量空间模型中,认为两者独立。然而从语义的角度来讲,两者是相似的,而且两者出现频率也类似,是不是可以合成为一个特征呢? 《模型选择和规则化》谈到的特征选择的问题,就是要剔除的特征主要是和类标签无关的特征 阅读全文
posted @ 2016-04-27 12:38
加拿大小哥哥
阅读(901)
评论(0)
推荐(0)
摘要:
听说这是一篇论文 不过我没详细看。 一、概述 主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差- 协方差结构。综合指标即为主成分。所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。 因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变 阅读全文
posted @ 2016-04-27 12:08
加拿大小哥哥
阅读(2439)
评论(1)
推荐(0)

浙公网安备 33010602011771号