2019 年 2月 15 日随笔档案 - nxf_rabbit75

2019年2月15日

摘要：一. 谱聚类概述 1、谱聚类谱聚类是从图论中演化出来的算法，后来在聚类中得到了广泛的应用。它的主要思想是把所有的数据看做空间中的点，这些点之间可以用边连接起来。距离较远的两个点之间的边权重值较低，而距离较近的两个点之间的边权重值较高，通过对所有数据点组成的图进行切图，让切图后不同的子图间边权重和尽阅读全文

posted @ 2019-02-15 11:54 nxf_rabbit75 阅读(1036) 评论(0) 推荐(0)

19.受限玻尔兹曼机(Restricted Boltzmann Machine)

摘要：一、背景介绍玻尔兹曼机 = 马尔科夫随机场 + 隐结点二、RBM的Representation BM存在问题：inference 精确：untractable；近似：计算量太大因此为了使计算简便，引入了RBM，RBM假设h,v之间有连结，h,v内部无连结从NB（朴素贝叶斯）推导到RBM的过阅读全文

posted @ 2019-02-15 10:57 nxf_rabbit75 阅读(510) 评论(0) 推荐(0)

18.高斯过程回归(GPR)

摘要：一、高斯(分布)过程(随机过程)是什么？一维高斯分布多维高斯分布无限维高斯分布高斯网络高斯过程简单的说，就是一系列关于连续域（时间或空间）的随机变量的联合，而且针对每一个时间或是空间点上的随机变量都是服从高斯分布的。举个例子：倘若你人生的每一个时刻看做一个随机变量，且都是满足高斯分布，阅读全文

posted @ 2019-02-15 10:56 nxf_rabbit75 阅读(3720) 评论(0) 推荐(0)

17.贝叶斯线性回归(Bayesian Linear Regression)

摘要：本文顺序一、回忆线性回归线性回归用最小二乘法，转换为极大似然估计求解参数W，但这很容易导致过拟合，由此引入了带正则化的最小二乘法（可证明等价于最大后验概率）二、什么是贝叶斯回归？基于上面的讨论，这里就可以引出本文的核心内容：贝叶斯线性回归。贝叶斯线性回归不仅可以解决极大似然估计中存在的过拟阅读全文

posted @ 2019-02-15 10:55 nxf_rabbit75 阅读(8509) 评论(0) 推荐(7)

16.高斯网络(GN)

摘要：一、高斯网络（高斯图模型）总体介绍概率图模型分为三种：贝叶斯网络，马尔科夫随机场以及高斯网络；而高斯网络又可以根据有向无向细分为高斯贝叶斯网络和高斯马尔科夫随机场二、高斯贝叶斯网络 1、高斯贝叶斯网络是有向图，x服从高斯分布，y|x服从高斯分布高斯贝叶斯网络（global model）是基于线阅读全文

posted @ 2019-02-15 10:54 nxf_rabbit75 阅读(1717) 评论(0) 推荐(0)

15.条件随机场(CRF)

摘要：一、CRF的由来HMM->MEMM->CRF 二、HMM到MEMM MEMM打破了HMM的观测条件独立假设三、MEMM到CRF CRF克服了MEMM的label bias problem问题参考文献：【1】【中文分词】条件随机场CRF 【2】【NLP】基于自然语言处理角度谈谈CRF(二) 阅读全文

posted @ 2019-02-15 10:53 nxf_rabbit75 阅读(438) 评论(0) 推荐(0)

14(2).线性动态系统---粒子滤波 particle filter

摘要：一、背景与卡曼滤波不同的是，粒子滤波假设隐变量之间（隐变量与观测变量之间）是非线性的，并且不满足高斯分布，可以是任意的关系。求解的还是和卡曼滤波一样，但由于分布不明确，所以需要用采样的方法求解。二、重要性采样（importance sampling & SIS）重要性采样（IS）需要计算p( 阅读全文

posted @ 2019-02-15 10:52 nxf_rabbit75 阅读(634) 评论(0) 推荐(0)

14(1).线性动态系统---卡曼滤波 Kalman filter

摘要：一、背景动态模型 = 图 + 时间动态模型有三种：HMM、线性动态系统（kalman filter）、particle filter 线性动态系统与HMM的区别是假设相邻隐变量之间满足线性高斯分布，观测变量与隐变量之间满足线性高斯分布二、线性动态系统两大问题：learning+inferenc 阅读全文

posted @ 2019-02-15 10:51 nxf_rabbit75 阅读(772) 评论(0) 推荐(0)

13.隐马尔科夫模型 (HMM)

摘要：隐含马尔可夫模型并不是俄罗斯数学家马尔可夫发明的，而是美国数学家鲍姆提出的，隐含马尔可夫模型的训练方法（鲍姆韦尔奇算法）也是以他名字命名的。隐含马尔可夫模型一直被认为是解决大多数自然语言处理问题最为快速、有效的方法。现实世界中有一类问题具有明显的时序性，比如路口红绿灯、连续几天的天气变化，我们说阅读全文

posted @ 2019-02-15 10:48 nxf_rabbit75 阅读(1336) 评论(0) 推荐(1)

12.MCMC

摘要：作为一种随机采样方法，马尔科夫链蒙特卡罗（Markov Chain Monte Carlo，以下简称MCMC）在机器学习,深度学习以及自然语言处理等领域都有广泛的应用，是很多复杂算法求解的基础。比如分解机(Factorization Machines)推荐算法，还有前面讲到的受限玻尔兹曼机（RBM）阅读全文

posted @ 2019-02-15 10:47 nxf_rabbit75 阅读(735) 评论(0) 推荐(0)

11.变分推断

摘要：一、背景（为什么要有变分推断？）简单来说便是需要根据已有数据推断需要的分布P；当P不容易表达，不能直接求解时，可以尝试用变分推断的方法。即，寻找容易表达和求解的分布Q，当Q和P的差距很小的时候，Q就可以作为P的近似分布代替P。二、公式推导三、总结变分推断是利用已知分布通过调整使其符合我们需要阅读全文

posted @ 2019-02-15 10:44 nxf_rabbit75 阅读(836) 评论(0) 推荐(0)

10.高斯混合模型GMM

摘要：一、什么是高斯混合模型？高斯混合模型(Gaussian Mixed Model)指的是多个高斯分布函数的线性组合，理论上GMM可以拟合出任意类型的分布，通常用于解决同一集合下的数据包含多个不同的分布的情况（或者是同一类分布，但参数不同，或者是不同类型的分布，比如正态分布和伯努利分布）。上图中的点阅读全文

posted @ 2019-02-15 09:18 nxf_rabbit75 阅读(1904) 评论(0) 推荐(0)

9.EM 算法

摘要：目录 "EM算法的适用场景：" "EM算法的入门简单例子：" EM算法的适用场景： EM算法用于估计含有隐变量的概率模型参数的极大似然估计，或者极大后验概率估计。当概率模型既含有观测值，又含有隐变量或潜在变量时，就可以使用EM算法来求解概率模型的参数。当概率模型只含有观测值时，直接使用极大似然估阅读全文

posted @ 2019-02-15 09:17 nxf_rabbit75 阅读(691) 评论(0) 推荐(0)

7.概率图模型(表示/推断/学习)

摘要：一、概率图分为三类：表示、推断、学习二、贝叶斯网络 Representation 条件独立性三、贝叶斯网络 Representation D-speration 四、贝叶斯网络 Representation 具体模型例子五、马尔可夫随机场 Representation 条件独立性六、马尔可夫阅读全文

posted @ 2019-02-15 09:16 nxf_rabbit75 阅读(1779) 评论(0) 推荐(1)

8.指数族分布

摘要：一、背景指数族分布有：高斯分布、伯努利分布、二项分布、泊松分布、beta分布、Dirichlet分布、gamma分布等指数族分布有6大性质：充分统计量共轭最大熵广义线性模型概率图模型变分推断指数族分布的标准形式：二、高斯分布的指数族形式三、对数配分函数与充分统计量的关系四、极阅读全文

posted @ 2019-02-15 09:16 nxf_rabbit75 阅读(4550) 评论(0) 推荐(1)

6.核方法

摘要：一、背景介绍二、正定核的两个定义定义1与定义2的等价性三、正定核充要条件-必要性证明阅读全文

posted @ 2019-02-15 09:14 nxf_rabbit75 阅读(359) 评论(0) 推荐(0)