摘要: 决策树原理实例(python代码实现) 决策数(Decision Tree)在机器学习中也是比较常见的一种算法,属于监督学习中的一种。看字面意思应该也比较容易理解,相比其他算法比如支持向量机(SVM)或神经网络,似乎决策树感觉“亲切”许多。 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失值不 阅读全文
posted @ 2020-04-09 20:49 我知道你知道我知道 阅读(929) 评论(0) 推荐(0) 编辑
摘要: 1、回归模型预测波士顿房价 代码: 截图: 性能比较: 多项式回归做出来的模型显然会好一点。因为多项式模型不仅仅是一条直线,它是一条平滑的曲线,更贴合样本点的分布。并且多项式回归模型的误差也明显比线性的小。 2、新闻文本分类: 定义函数:读数据,清洗,分词。标签存入target_list,文本存入c 阅读全文
posted @ 2018-12-11 12:37 我知道你知道我知道 阅读(650) 评论(0) 推荐(0) 编辑
摘要: 1. 导入boston房价数据集,一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 代码: 截图: 代码: 截图: 2. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 代码: 截图: 3.一元多项式回归模型,建立一个变量与房价之间的预 阅读全文
posted @ 2018-12-06 23:56 我知道你知道我知道 阅读(2424) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯应用:垃圾邮件分类 代码: 截图: 清洗后的数据: 特征向量: 模型指标: 阅读全文
posted @ 2018-11-30 17:57 我知道你知道我知道 阅读(277) 评论(0) 推荐(0) 编辑
摘要: sklearn中的朴素贝叶斯模型及其应用 使用朴素贝叶斯模型对iris数据集进行花分类(用三种不同类型的朴素贝叶斯),并使用sklearn.model_selection.cross_val_score()对模型进行验证 截图: 阅读全文
posted @ 2018-11-22 09:39 我知道你知道我知道 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 一、 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类与聚类:分类是一种有监督的算法,是在已经有目标分类的情况下对数据进行类别判断(朴素贝叶斯算法)。而聚类是一种无监督算法,是在建立模型之前还没有目标分类,将特征相似的数据自动聚为一类的算法(KMeans聚类算法)。 有监督学习和 阅读全文
posted @ 2018-11-16 11:36 我知道你知道我知道 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 利用KMeans进行图片的压缩: 代码: 截图: 贝叶斯解题过程照片: 阅读全文
posted @ 2018-11-01 20:37 我知道你知道我知道 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 聚类--K均值算法:自主实现与sklearn.cluster.KMeans调用 用python实现K均值算法,鸢尾花花瓣长度数据做聚类并用散点图显示。 代码: 截图: 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类并用散点图显示,鸢尾花完整数据做聚类并用散点图显示。 代码: 阅读全文
posted @ 2018-10-26 11:49 我知道你知道我知道 阅读(183) 评论(0) 推荐(0) 编辑
摘要: numpy统计分布显示 代码: # 正太分布图mu = np.mean(iris_length)sigma = np.std(iris_length)num = 150normal_data = np.random.normal(mu,sigma,num)count,bins,ignored = p 阅读全文
posted @ 2018-10-18 17:59 我知道你知道我知道 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 鸢尾花数据分类: 代码: 截图: 阅读全文
posted @ 2018-10-12 11:22 我知道你知道我知道 阅读(178) 评论(0) 推荐(0) 编辑