摘要: 目 录 第1章 生成数据表 第2章 数据表检查 第3章 数据表清洗 第4章 数据预处理 第5章 数据提取 第6章 数据筛选 第7章 数据汇总 第8章 数据统计 第9章 数据输出 案例 990万次骑行:纽约自行车共享系统分析 百度网盘下载 链接:https://pan.baidu.com/s/1cJ7 阅读全文
posted @ 2019-07-03 11:28 desolateness 阅读(967) 评论(1) 推荐(1) 编辑
摘要: (1) 无监督和有监督算法的区别? 有监督学习: 对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。 无监督学习: 对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。这里,所 阅读全文
posted @ 2018-11-09 11:44 desolateness 阅读(3132) 评论(1) 推荐(1) 编辑
摘要: SVM有如下主要几个特点: (1) 非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射; (2) 对特征空间划分的最优超平面是SVM的目标,最大化分类边际的思想是SVM方法的核心; (3) 支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量。 (4) 阅读全文
posted @ 2018-11-05 13:53 desolateness 阅读(13666) 评论(0) 推荐(0) 编辑
摘要: 1. scikit-learn决策树算法类库介绍 scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier,而回归决策树的类对应的是DecisionTreeRegressor。两者的参 阅读全文
posted @ 2018-10-24 16:09 desolateness 阅读(488) 评论(0) 推荐(1) 编辑
摘要: Python中的pandas模块进行数据分析。 接下来pandas介绍中将学习到如下8块内容:1、数据结构简介:DataFrame和Series2、数据索引index3、利用pandas查询数据4、利用pandas的DataFrames进行统计分析5、利用pandas实现SQL操作6、利用panda 阅读全文
posted @ 2018-10-24 14:26 desolateness 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得.反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量 阅读全文
posted @ 2018-10-24 13:43 desolateness 阅读(3662) 评论(0) 推荐(0) 编辑
摘要: 信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广义线性模型。 本文重点介绍模型变量WOE以及IV原理,为表述方便,本文将模型目标标量为1记为违约用户 阅读全文
posted @ 2018-10-22 18:52 desolateness 阅读(8990) 评论(0) 推荐(3) 编辑
摘要: 1.IV的用途 IV的全称是Information Value,中文意思是信息价值,或者信息量。 我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用一些方法,从这200个自 阅读全文
posted @ 2018-10-22 18:38 desolateness 阅读(2017) 评论(0) 推荐(2) 编辑
摘要: 对于图形的平滑与滤波,但从滤波角度来讲,一般主要的目的都是为了实现对图像噪声的消除,增强图像的效果。 对于2D图像可以进行低通或者高通滤波操作 低通滤波(LPF):有利于去噪,模糊图像 高通滤波(HPF):有利于找到图像边界 (一)统一的2D滤波器cv2.filter2D Opencv提供的一个通用 阅读全文
posted @ 2018-08-31 16:03 desolateness 阅读(15004) 评论(0) 推荐(3) 编辑
摘要: 目标: 学习不同的形态操作 例如 腐蚀、膨胀、开运算、闭运算 等。 我们要学习的函数有 cv2.erode(),cv2.dilate(),cv2.morphologyEx() 等。 原理 :一般对二值化图像进行形态学转换操作。输入的第一个参数为原始图像;第二个参数为结构化元素(核),该参数决定操作性 阅读全文
posted @ 2018-08-30 15:37 desolateness 阅读(2637) 评论(0) 推荐(1) 编辑