随笔分类 -  数据分析

摘要:1.单变量分析绘图 数据分布情况 kdeplot(核密度估计图) 核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。通过核密度估计图可以比较直观的看出数据样本本身的分布特征 numpy.random.gamma 从Gamma分 阅读全文
posted @ 2019-04-19 21:01 bin-y 阅读(412) 评论(0) 推荐(0)
摘要:首先找到Anaconda Prompt命令行,下载seaborn库 ,命令 pip install seaborn 1.风格设置 seaborn的5种主题风格:darkgrid、whitegrid、dark、white、ticks (背景颜色) sns.violinplot(data)sns.des 阅读全文
posted @ 2019-04-16 22:01 bin-y 阅读(1468) 评论(0) 推荐(0)
摘要:1.matplotlib-折线图 首先也是导入库 : import matplotlib.pyplot as plt 2.matplotlib-子图操作 3.matplotlib-条形图与散点图 3.1散点图 4.matplotlib-柱形图与盒图 阅读全文
posted @ 2019-04-15 21:56 bin-y 阅读(617) 评论(0) 推荐(0)
摘要:1.pandas数据读取和预处理 简述:pandas在numpy的基础上又封装了一些操作,相当于把函数做了一些简化。pandas不做可视化,主要是在预处理方面。 文件读取 numpy的数据格式为ndarray, pandas为DataFrame(数据流) pandas的dtype: int,floa 阅读全文
posted @ 2019-04-15 18:04 bin-y 阅读(282) 评论(0) 推荐(0)
摘要:Numpy numpy.array:将数组转换成向量 转换成向量取值 对象[1,4] 第二个样本的第四个,即2行4列对应的值 切片(同python) (1) 对象.[0:3] 取前三个 (2) matrix[0,1] 取第一行第二个值 matrix[:,1] 取所有行中的第二列的值 判断 对象==6 阅读全文
posted @ 2019-04-10 21:57 bin-y 阅读(259) 评论(0) 推荐(0)