随笔分类 -  概率&统计

贝叶斯方法(Bayesian approach) —— 一种概率解释(probabilistic interpretation)
摘要:1. Bayesian approach对于多项式拟合问题,我们可通过最小二乘(least squares)的方式计算得到模型的参数,最小二乘法又可视为最大似然(maximum likelihood)的一种特例,当模型选择过于复杂时,很容易在测试集上造成过拟合(ove... 阅读全文
posted @ 2017-01-11 16:51 未雨愁眸 阅读(1150) 评论(0) 推荐(0)
贝叶斯方法(Bayesian approach) —— 一种概率解释(probabilistic interpretation)
摘要:1. Bayesian approach对于多项式拟合问题,我们可通过最小二乘(least squares)的方式计算得到模型的参数,最小二乘法又可视为最大似然(maximum likelihood)的一种特例,当模型选择过于复杂时,很容易在测试集上造成过拟合(ove... 阅读全文
posted @ 2017-01-11 16:51 未雨愁眸 阅读(225) 评论(0) 推荐(0)
exponential family distribution(指数族分布)
摘要:1. exponential family给定参数 η,关于 x 的指数族分布定义为如下的形式:p(x∣∣η)=h(x)g(η)exp{ηTu(x)}其中 x 可以为标量也可以为矢量,可以为离散也可是连续。其中 η 被称为分布的自然系数(natural paramet... 阅读全文
posted @ 2017-01-09 11:51 未雨愁眸 阅读(572) 评论(0) 推荐(0)
exponential family distribution(指数族分布)
摘要:1. exponential family给定参数 η,关于 x 的指数族分布定义为如下的形式:p(x∣∣η)=h(x)g(η)exp{ηTu(x)}其中 x 可以为标量也可以为矢量,可以为离散也可是连续。其中 η 被称为分布的自然系数(natural paramet... 阅读全文
posted @ 2017-01-09 11:51 未雨愁眸 阅读(548) 评论(0) 推荐(0)
Frequentist 观点和 Bayesian 观点
摘要:1. Frequentist viewFrequentist approach views the model parameters as unknown constants(未知的常数,而不是一个变量,variable) and estimates them(参数估... 阅读全文
posted @ 2016-12-11 16:11 未雨愁眸 阅读(176) 评论(0) 推荐(0)
Frequentist 观点和 Bayesian 观点
摘要:1. Frequentist viewFrequentist approach views the model parameters as unknown constants(未知的常数,而不是一个变量,variable) and estimates them(参数估... 阅读全文
posted @ 2016-12-11 16:11 未雨愁眸 阅读(277) 评论(0) 推荐(0)
隐变量模型(latent variable model)
摘要:连续隐变量模型(continuous latent model)也常常被称为降维(dimensionality reduction) PCAFactor AnalysisICA连续的情形比离散的情况更有效在信息表示上; 阅读全文
posted @ 2016-12-10 21:05 未雨愁眸 阅读(3720) 评论(0) 推荐(0)
隐变量模型(latent variable model)
摘要:连续隐变量模型(continuous latent model)也常常被称为降维(dimensionality reduction) PCAFactor AnalysisICA连续的情形比离散的情况更有效在信息表示上; 阅读全文
posted @ 2016-12-10 21:05 未雨愁眸 阅读(1524) 评论(0) 推荐(0)
概率分布的 perplexity
摘要:1. 一种 measurement信息论中,perplexity is a measurement of how well a probability distribution or probability model predicts a sample. 其越低,... 阅读全文
posted @ 2016-11-27 16:19 未雨愁眸 阅读(331) 评论(0) 推荐(0)
概率分布的 perplexity
摘要:1. 一种 measurement信息论中,perplexity is a measurement of how well a probability distribution or probability model predicts a sample. 其越低,... 阅读全文
posted @ 2016-11-27 16:19 未雨愁眸 阅读(283) 评论(0) 推荐(0)
Analysis of variance(ANOVA)
摘要:方差分析,也称为“变异数分析”,用于两个及两个以上样本均值(group means)差别的显著性检验。在 ANOVA 的环境下,一个观测得到的方差视为是由不同方差的源组合而成。 阅读全文
posted @ 2016-11-24 12:20 未雨愁眸 阅读(182) 评论(0) 推荐(0)
Analysis of variance(ANOVA)
摘要:方差分析,也称为“变异数分析”,用于两个及两个以上样本均值(group means)差别的显著性检验。在 ANOVA 的环境下,一个观测得到的方差视为是由不同方差的源组合而成。 阅读全文
posted @ 2016-11-24 12:20 未雨愁眸 阅读(191) 评论(0) 推荐(0)
正态分布(normal distribution)与偏态分布(skewed distribution)
摘要:存在正太分布的概念,自然也少不了偏态分布。正态分布(normal distribution)偏态分布(skewed distribution) 左偏态:left skewed distribution,负偏态(negatively skewed distributio... 阅读全文
posted @ 2016-11-20 10:39 未雨愁眸 阅读(3231) 评论(0) 推荐(0)
正态分布(normal distribution)与偏态分布(skewed distribution)
摘要:存在正太分布的概念,自然也少不了偏态分布。正态分布(normal distribution)偏态分布(skewed distribution) 左偏态:left skewed distribution,负偏态(negatively skewed distributio... 阅读全文
posted @ 2016-11-20 10:39 未雨愁眸 阅读(3548) 评论(0) 推荐(0)
‘3 sigma’rule(68–95–99.7 rule)
摘要:不限标准正太分布,任一正太分布(normal distribution)均可、围绕均值附近求得的区间概率; (μ−k⋅σ,μ+k⋅σ)Pr(μ−σ≤x≤μ+σ)≈0.6827Pr(μ−2σ≤x≤μ+2σ)≈0.9545Pr(μ−3σ≤x≤μ+3σ)≈0.9973(... 阅读全文
posted @ 2016-11-18 22:03 未雨愁眸 阅读(222) 评论(0) 推荐(0)
‘3 sigma’rule(68–95–99.7 rule)
摘要:不限标准正太分布,任一正太分布(normal distribution)均可、围绕均值附近求得的区间概率; (μ−k⋅σ,μ+k⋅σ)Pr(μ−σ≤x≤μ+σ)≈0.6827Pr(μ−2σ≤x≤μ+2σ)≈0.9545Pr(μ−3σ≤x≤μ+3σ)≈0.9973(... 阅读全文
posted @ 2016-11-18 22:03 未雨愁眸 阅读(346) 评论(0) 推荐(0)
统计学基本概念(及辨异)
摘要:1. 样本(sample)与总体(population)样本均值:X¯=1n∑ni=1Xi,总体均值:μ2. 均值与期望事实上不严谨地讲,一个概率分布其实定义了随机变量输出值出现的相对频度,期望值可以视为一种对输出的加权平均,权重便是相对频度。Why is expec... 阅读全文
posted @ 2016-11-18 18:46 未雨愁眸 阅读(154) 评论(0) 推荐(0)
狄利克雷过程(Dirichlet Process)
摘要:0. 引入现观察得到两个样本 θ1,θ2,来推测它们可能来自的分布:假设来自于连续型概率密度函数, θ1,θ2∼H(θ) 则 θ1,θ2 相等的概率为 0,p(θ1=θ2)=0概率为 0,不代表不可能发生,仍有发生的可能,只不过概率的测度为 0;(详见测度论相关知识)... 阅读全文
posted @ 2016-11-13 18:32 未雨愁眸 阅读(382) 评论(0) 推荐(0)
狄利克雷过程(Dirichlet Process)
摘要:0. 引入现观察得到两个样本 θ1,θ2,来推测它们可能来自的分布:假设来自于连续型概率密度函数, θ1,θ2∼H(θ) 则 θ1,θ2 相等的概率为 0,p(θ1=θ2)=0概率为 0,不代表不可能发生,仍有发生的可能,只不过概率的测度为 0;(详见测度论相关知识)... 阅读全文
posted @ 2016-11-13 18:32 未雨愁眸 阅读(500) 评论(0) 推荐(0)