摘要: 一、朴素贝叶斯 有以下几个地方需要注意: 1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单词出现的次数。 2. 计算公式如下: 其中一项条件概率可以通过朴素贝叶斯条件独立展开。要注意一点就是 的计 阅读全文
posted @ 2017-05-09 09:51 光彩照人 阅读(1739) 评论(0) 推荐(0)
摘要: 一、模型验证 进行模型验证的一个重要目的是要选出一个最合适的模型,对于监督学习而言,我们希望模型对于未知数据的泛化能力强,所以就需要模型验证这一过程来体现不同的模型对于未知数据的表现效果。 这里我们将训练集再分成训练集与验证集两部分,大概比例就是3:1吧。一般来讲不同的训练集、验证集分割的方法会导致 阅读全文
posted @ 2017-05-09 09:34 光彩照人 阅读(3340) 评论(0) 推荐(0)
摘要: Scikit-Learn库已经实现了所有基本机器学习的算法,可以直接调用里面库进行模型构建。 一、逻辑回归 大多数情况下被用来解决分类问题(二元分类),但多类的分类(所谓的一对多方法)也适用。这个算法的优点是对于每一个输出的对象都有一个对应类别的概率。 二、朴素贝叶斯 它也是最有名的机器学习的算法之 阅读全文
posted @ 2017-05-09 09:33 光彩照人 阅读(1302) 评论(0) 推荐(0)