文章分类 -  数据挖掘的相关原理

Python 支持向量机介绍
摘要:1.线性可分SVC.LinearSVC()(官方链接:https://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html#sklearn.svm.LinearSVC) sklearn.svm.LinearSVC(p 阅读全文

posted @ 2019-08-29 14:59 LiErRui 阅读(275) 评论(0) 推荐(0)

Pyhton 支持向量回归(SVR森林火灾燃烧面积预测实战)
摘要:一、数据读取、绘制及预处理 1.数据读取(有些指标不懂,练练手而已) 结果: 2.绘制森林燃烧的面积 3.数据预处理(这里涉及一个偏峰时数据处理的问题参考博客链接:https://www.cnblogs.com/wqbin/p/10346292.html) 结果: 二、模型训练及预测 结果: 三、优 阅读全文

posted @ 2019-08-29 14:07 LiErRui 阅读(1133) 评论(0) 推荐(0)

Python PCA主成分分析
摘要:一、PCA算法流程 输入:n维样本集 输出:降维后的样本集D′D′ 1) 对所有的样本进行中心化 2) 计算样本的协方差矩阵 3) 对协方差矩阵进行特征值分解 4)取出最大的n'个特征值对应的特征向量(w1,w2,...,wn′)(w1,w2,...,wn′), 将所有的特征向量标准化后,组成特征向 阅读全文

posted @ 2019-08-29 12:43 LiErRui 阅读(767) 评论(0) 推荐(0)

Python 决策树实战(数据挖掘原理、算法及应用例子)
摘要:一、代码 阅读全文

posted @ 2019-08-29 12:43 LiErRui 阅读(676) 评论(0) 推荐(0)

Python 朴素贝叶斯算法原理及其运用
摘要:朴素贝叶斯是一种有监督机器学习,其原理通过后验概率进行有效的分类,目前常见的贝叶斯分类器有高斯贝叶斯分类器、多项式贝叶斯分类器、伯努利贝叶斯分类器。 官方链接:https://scikit-learn.org/stable/modules/naive_bayes.html (一)概率论相关概念 条件 阅读全文

posted @ 2019-08-29 12:42 LiErRui 阅读(392) 评论(0) 推荐(0)

Python 第三方库决策树算法
摘要:一、决策树分类器第三方库参数及涉及的函数参数介绍 (1)DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None,min_samples_split=2, min_samples_leaf=1,min_weigh 阅读全文

posted @ 2019-08-29 12:41 LiErRui 阅读(1223) 评论(0) 推荐(0)

Python 支持向量机(svm手写字体识别实战)
摘要:一、线性可分svm.LinearSVC() 1. 使用网格搜索法,选择线性可分SVM“类”中的最佳C值 结果: 2.模型训练与预测 结果: 3.混淆矩阵绘制 结果: 二、非线性svm.SVC() 1.使用网格搜索法,选择非线性SVM“类”中的最佳C值与核函数 结果: 2.模型训练与预测 结果: 3. 阅读全文

posted @ 2019-08-29 12:39 LiErRui 阅读(807) 评论(0) 推荐(0)

Python 决策树算法原理及实现
摘要:决策树是机器学习常见的算法,最著名的代表是ID3、C4.5和CART算法。也有其他的如:OC1算法、ID4h和ITI。他们如何选择最优划分属性不尽相同,ID3决策树是以信息增益为准则来选择划分属性的,C4.5决策树是以信息增益率来选择最优划分属性的,CART是以基尼指数来选择划分属性的,其他决策树算 阅读全文

posted @ 2019-08-17 23:08 LiErRui 阅读(417) 评论(0) 推荐(0)

Python 第三方库Knn算法
摘要:一、Knn第三方库参数及涉及的函数参数介绍(亦可见刘建平老师的博客:https://www.cnblogs.com/pinard/p/6065607.html) (1)neighbors.KNeighborsClassifier(n_neighbors=5, weights='uniform', a 阅读全文

posted @ 2019-08-15 23:08 LiErRui 阅读(1362) 评论(0) 推荐(0)

Python Knn算法原理及实现
摘要:一、Knn为伪代码及优缺点 (1) (1)计算已知类别数据集中的点与当前点之间的距离 (2)按照距离递增次序排序 (3)选取与与当前点距离最小的k个点 (4)确定前k个点所在类别的出现频率 (5)返回前k个点出现频率最高的类别作为当前点的预测分类 (2)优点:精度高、对异常数据不敏感、无数据输入假定 阅读全文

posted @ 2019-08-15 00:42 LiErRui 阅读(379) 评论(0) 推荐(0)

导航