上一页 1 2 3 4 5 6 ··· 13 下一页
摘要: sklearn转换器和估计器 1、转换器和估计器 1.1 转换器 想一下之前做的特征工程的步骤? 1、实例化 (实例化的是一个转换器类(Transformer)) 2、调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 我们把特征工程的接口称之为转换器,其中转换器调用有这么几种 阅读全文
posted @ 2021-01-11 19:13 邵文 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 数据集介绍与划分 1、 数据集的划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 划分比例: 训练集:70% 80% 75% 测试集:30% 20% 30% API sklearn.model_selection.train 阅读全文
posted @ 2021-01-11 19:11 邵文 阅读(555) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-01-10 19:08 邵文 阅读(80) 评论(0) 推荐(0) 编辑
摘要: 2.6 主成分分析 2.6.1 什么是主成分分析(PCA) 定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量 作用:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。 应用:回归分析或者聚类分析当中 对于信息一词,在决策树中会进行介绍 那么更好的理解这个过 阅读全文
posted @ 2021-01-10 19:07 邵文 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 2.5 特征降维 2.5.1 降维 降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程 降低随机变量的个数 相关特征(correlated feature) 相对湿度与降雨量之间的相关 等等 正是因为在进行训练的时候,我们都是使用特征进行学习。如果特征本身存在问题或者 阅读全文
posted @ 2021-01-09 18:59 邵文 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 2.4 特征预处理 2.4.1 什么是特征预处理 # scikit-learn的解释 provides several common utility functions and transformer classes to change raw feature vectors into a repr 阅读全文
posted @ 2021-01-08 18:48 邵文 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 2.2 特征工程 2.2.1 什么是特征工程 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。 意义:会直接影响机器学习的效果 2.2.3 特征工程的位置与数据处理的比较 pandas:一个数据读取非常方便以及基本的处理格式的工具 sklearn:对于特征的 阅读全文
posted @ 2021-01-07 17:46 邵文 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 2.1 数据集 目标 知道数据集的分为训练集和测试集 会使用sklearn的数据集 应用 无 2.1.1 可用数据集 Kaggle网址:https://www.kaggle.com/datasets UCI数据集网址: http://archive.ics.uci.edu/ml/ scikit-le 阅读全文
posted @ 2021-01-06 17:28 邵文 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 1.1 什么是机器学习 1.1.1 定义 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。 1.1.2 解释 我们人从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略。 从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的 阅读全文
posted @ 2021-01-05 17:14 邵文 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 疫情可视化追踪系统 一、网页开发背景 今年上半年在我国爆发的疫情,对我们的日常生活带来了极大的影响,疫情严重期间,大家都谈“疫”色变,大家对于了解疫情的情况具有巨大的需求;并且,目前来看我国仍然存在疫情二次爆发的可能,大家对于疫情的情况跟踪也急于了解。基于这个情况,我们对疫情的数据进行了爬取和可视化 阅读全文
posted @ 2020-12-10 11:18 邵文 阅读(1625) 评论(4) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 13 下一页