数据挖掘的相关原理 - 文章分类 - LiErRui

Python 支持向量机介绍

摘要：1.线性可分SVC.LinearSVC()（官方链接：https://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html#sklearn.svm.LinearSVC） sklearn.svm.LinearSVC(p 阅读全文

posted @ 2019-08-29 14:59 LiErRui 阅读(275) 评论(0) 推荐(0)

Pyhton 支持向量回归（SVR森林火灾燃烧面积预测实战）

摘要：一、数据读取、绘制及预处理 1.数据读取（有些指标不懂，练练手而已）结果： 2.绘制森林燃烧的面积 3.数据预处理（这里涉及一个偏峰时数据处理的问题参考博客链接：https://www.cnblogs.com/wqbin/p/10346292.html）结果：二、模型训练及预测结果：三、优阅读全文

posted @ 2019-08-29 14:07 LiErRui 阅读(1133) 评论(0) 推荐(0)

Python PCA主成分分析

摘要：一、PCA算法流程输入：n维样本集输出：降维后的样本集D′D′ 1) 对所有的样本进行中心化 2) 计算样本的协方差矩阵 3) 对协方差矩阵进行特征值分解 4）取出最大的n'个特征值对应的特征向量(w1,w2,...,wn′)(w1,w2,...,wn′), 将所有的特征向量标准化后，组成特征向阅读全文

posted @ 2019-08-29 12:43 LiErRui 阅读(767) 评论(0) 推荐(0)

Python 决策树实战（数据挖掘原理、算法及应用例子）

摘要：一、代码阅读全文

posted @ 2019-08-29 12:43 LiErRui 阅读(676) 评论(0) 推荐(0)

Python 朴素贝叶斯算法原理及其运用

摘要：朴素贝叶斯是一种有监督机器学习，其原理通过后验概率进行有效的分类，目前常见的贝叶斯分类器有高斯贝叶斯分类器、多项式贝叶斯分类器、伯努利贝叶斯分类器。官方链接：https://scikit-learn.org/stable/modules/naive_bayes.html （一）概率论相关概念条件阅读全文

posted @ 2019-08-29 12:42 LiErRui 阅读(392) 评论(0) 推荐(0)

Python 第三方库决策树算法

摘要：一、决策树分类器第三方库参数及涉及的函数参数介绍（1）DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None,min_samples_split=2, min_samples_leaf=1,min_weigh 阅读全文

posted @ 2019-08-29 12:41 LiErRui 阅读(1223) 评论(0) 推荐(0)

Python 支持向量机（svm手写字体识别实战）

摘要：一、线性可分svm.LinearSVC() 1. 使用网格搜索法，选择线性可分SVM“类”中的最佳C值结果： 2.模型训练与预测结果： 3.混淆矩阵绘制结果: 二、非线性svm.SVC（） 1.使用网格搜索法，选择非线性SVM“类”中的最佳C值与核函数结果： 2.模型训练与预测结果： 3. 阅读全文

posted @ 2019-08-29 12:39 LiErRui 阅读(807) 评论(0) 推荐(0)

Python 决策树算法原理及实现

摘要：决策树是机器学习常见的算法，最著名的代表是ID3、C4.5和CART算法。也有其他的如：OC1算法、ID4h和ITI。他们如何选择最优划分属性不尽相同，ID3决策树是以信息增益为准则来选择划分属性的，C4.5决策树是以信息增益率来选择最优划分属性的，CART是以基尼指数来选择划分属性的,其他决策树算阅读全文

posted @ 2019-08-17 23:08 LiErRui 阅读(417) 评论(0) 推荐(0)

Python 第三方库Knn算法

摘要：一、Knn第三方库参数及涉及的函数参数介绍(亦可见刘建平老师的博客：https://www.cnblogs.com/pinard/p/6065607.html) （1）neighbors.KNeighborsClassifier(n_neighbors=5, weights='uniform', a 阅读全文

posted @ 2019-08-15 23:08 LiErRui 阅读(1362) 评论(0) 推荐(0)

Python Knn算法原理及实现

摘要：一、Knn为伪代码及优缺点（1）（1）计算已知类别数据集中的点与当前点之间的距离（2）按照距离递增次序排序（3）选取与与当前点距离最小的k个点（4）确定前k个点所在类别的出现频率（5）返回前k个点出现频率最高的类别作为当前点的预测分类（2）优点：精度高、对异常数据不敏感、无数据输入假定阅读全文

posted @ 2019-08-15 00:42 LiErRui 阅读(379) 评论(0) 推荐(0)

文章分类 - 数据挖掘的相关原理