2019年9月15日

摘要: IMDB数据集 阅读全文
posted @ 2019-09-15 12:55 一条咸鱼翻身 阅读(513) 评论(0) 推荐(0) 编辑
 

2019年3月19日

摘要: K近邻 假设我们有一些携带分类标记的训练样本,分布于特征空间中,对于一个待分类的测试样本点,未知其类别,按照‘近朱者赤近墨者黑’,我们需要寻找与这个待分类的样本在特征空间中距离最近的k个已标记样本作为参考,帮助我们最初分类决策。 #从sklearn.datasets导入iris数据加载器from s 阅读全文
posted @ 2019-03-19 21:43 一条咸鱼翻身 阅读(384) 评论(0) 推荐(0) 编辑
 

2019年3月17日

摘要: #使用sklearn来产生数据并给出线性分类from sklearn import linear_modelfrom sklearn import datasetsimport sklearnimport numpy as npimport matplotlib.pyplot as plt#显示医疗 阅读全文
posted @ 2019-03-17 21:33 一条咸鱼翻身 阅读(528) 评论(0) 推荐(0) 编辑
 

2019年3月16日

摘要: 集成模型 集成分类模型是综合考量多个分类器的预测结果,从而做出决策。 综合考量的方式大体分为两种: 1.利用相同的训练数据同时搭建多个独立的分类模型,然后通过投票的方式,以少数服从多数的原则作出最终的分类决策。(随机森林分类器) 2.按照一定次序搭建多个分类模型。这些模型之间彼此存在依赖关系。一般而 阅读全文
posted @ 2019-03-16 23:16 一条咸鱼翻身 阅读(827) 评论(0) 推荐(0) 编辑
 

2019年3月15日

摘要: 朴素贝叶斯 朴素贝叶斯分类器的构造基础是贝叶斯理论。采用概率模型来表述,定义x=<x1,x2,...,xn>为某一n维特征向量,y∈{c1,c2,...ck}为该特征向量x所有k种可能的类别,记 P(y=ci|x)为特征向量x属于类别ci的概率。贝叶斯原理: P(y|x)=P(x|y)P(y)/P( 阅读全文
posted @ 2019-03-15 09:20 一条咸鱼翻身 阅读(764) 评论(0) 推荐(0) 编辑
 

2019年3月14日

摘要: 支持向量机(分类) 支持向量机分类器根据训练样本的分布,搜索所有可能的线性分类器中最佳的那个。我们会发现决定其直线位置的样本并不是所有训练数据,而是其中的两个空间间隔最小的两个不同类别的数据点,而我们把这种可以用来真正帮助决策最优线性分类模型的数据点叫做‘支持向量’。逻辑斯蒂回归模型在训练过程中由于 阅读全文
posted @ 2019-03-14 12:35 一条咸鱼翻身 阅读(509) 评论(0) 推荐(0) 编辑
 

2019年3月13日

摘要: 监督学习经典模型 机器学习中的监督学习模型的任务重点在于,根据已有的经验知识对未知样本的目标/标记进行预测。根据目标预测变量的类型不同,我们把监督学习任务大体分为分类学习与回归预测两类。监督学习任务的基本流程:首先准备训练数据,可以是文本、图像、音频等;然后抽取所需要的特征,形成特征向量,接着把这些 阅读全文
posted @ 2019-03-13 21:59 一条咸鱼翻身 阅读(2246) 评论(0) 推荐(0) 编辑
 
摘要: 1.Python 数据类型 Python 内置的常用数据类型共有6中: 数字(Number)、布尔值(Boolean)、字符串(String)、元组(Tuple)、列表(List)、字典(Dictionary)。 数字:常用的数字类型包括整型数(Integer)、长整型(Long)、浮点数(Floa 阅读全文
posted @ 2019-03-13 15:29 一条咸鱼翻身 阅读(398) 评论(0) 推荐(0) 编辑