摘要:
决策树:1、场景:最典型的应用场景是预测和分类,如新客户分类。2、特点:决策树有很好的直观性,生成模式简单,对预测和分类结果也有很好的解释性。3、相关概念:熵是无序性(或不确定性)的度量指标。假如事件A的全概率划分是(A1,A2,...,An),每部分发生的概率是(p1,p2,...,pn),那信息 阅读全文
posted @ 2019-05-19 21:22
逐梦无惧_数据分析
阅读(169)
评论(0)
推荐(0)
摘要:
描述性数据挖掘用于描述现有的规律,常见算法如下: A.聚类分析 B.关联规则分析 C.因子、主成分分析 预测性数据挖掘用于预测未来发生了什么,使用的模型算法如下: A.线性回归 B.逻辑回归 C.神经元网络 D.决策树 E.支持向量机 F.随机森林(集成算法) 阅读全文
posted @ 2019-05-19 21:10
逐梦无惧_数据分析
阅读(110)
评论(0)
推荐(0)
摘要:
数据可视化 # -*- coding:utf-8 -*-# 异常值处理import pandas as pdaimport numpy as npyimport matplotlib matplotlib.use('Agg')import matplotlib.pyplot as pylimport 阅读全文
posted @ 2019-05-19 20:40
逐梦无惧_数据分析
阅读(336)
评论(0)
推荐(0)
摘要:
缺失值处理 数据离散化处理 数据集成处理 阅读全文
posted @ 2019-05-19 20:23
逐梦无惧_数据分析
阅读(315)
评论(0)
推荐(0)
摘要:
在Python3.x中,我们可以使用urlib这个组件抓取网页,urllib是一个URL处理包,这个包中集合了一些处理URL的模块,如下:1.urllib.request模块用来打开和读取URLs;2.urllib.error模块包含一些由urllib.request产生的错误,可以使用try进行捕 阅读全文
posted @ 2019-05-19 20:09
逐梦无惧_数据分析
阅读(245)
评论(0)
推荐(0)
浙公网安备 33010602011771号