博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年3月13日

摘要: 散点图 使用scatter函数可以绘制随机点,该函数需要接收x坐标和y坐标的序列——plt.scatter(x,y) matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=Non 阅读全文

posted @ 2020-03-13 22:06 兰智杰 阅读(134) 评论(0) 推荐(0) 编辑

摘要: 直方图 直方图与柱状图的分格类似,都是由若干个柱组成,但直方图和柱状图的含义却有很大的差异,直方图是用来观察分布状态的,而柱状图是用来看每一个X坐标对应的Y的值的,也就是说,直方图关注的是分布,并不关心具体的某个值,而柱状图关心的是具体的某个值 使用hist函数绘制直方图 matplot.pyplo 阅读全文

posted @ 2020-03-13 21:16 兰智杰 阅读(177) 评论(0) 推荐(0) 编辑

2020年3月11日

摘要: 柱状图 使用bar函数可以绘制柱状图,柱状图需要水平的x坐标值,以及每一个x坐标值对应的y坐标值,从而形成柱状的图 bar函数的宽度并不是像素宽度,bar函数会根据二维坐标系的尺寸,以及x坐标值的多少,自动确定每一个柱的宽度,而width指定的宽度就是这个标准柱宽度的倍数,该参数值可以是浮点数,如0 阅读全文

posted @ 2020-03-11 23:46 兰智杰 阅读(335) 评论(0) 推荐(0) 编辑

摘要: 颜色标记和线型 #导入模块 import matplotlib.pyplot as plt import matplotlib as mpl plt.figure() # 解决中文显示问题 mpl.rcParams['font.sans-serif'] = ['SimHei'] mpl.rcPara 阅读全文

posted @ 2020-03-11 13:01 兰智杰 阅读(308) 评论(0) 推荐(0) 编辑

2020年3月9日

摘要: Matplotlib概述 Matplotlib是一个Python的 2D绘图库,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等 通过学习Matplotlib,可让数据可视化,更直观的真实给用户,使数据更加客观、更具有说服力,Matplo 阅读全文

posted @ 2020-03-09 23:16 兰智杰 阅读(144) 评论(0) 推荐(0) 编辑

2020年3月8日

摘要: 唯一值、值计数以及成员资格 unique方法用于获取Series中的唯一值数组(去重数据后的数组) value_counts方法用于计算一个Series中各值的出现频率 isin方法用于判断矢量化集合的成员资格,可用于选取Series中或者DataFrame中列中数据的子集 import panda 阅读全文

posted @ 2020-03-08 18:57 兰智杰 阅读(197) 评论(0) 推荐(0) 编辑

摘要: 常用的数学统计方法 import pandas as pd import numpy as np # pd03=pd.DataFrame(np.random.randint(0,100,size=(3,3))) pd03=pd.DataFrame([[52,55,13],[52,99,61],[32 阅读全文

posted @ 2020-03-08 10:10 兰智杰 阅读(214) 评论(0) 推荐(0) 编辑

2020年3月6日

摘要: 数据文件读取 定义:指的是将磁盘、第三方数据读取到内存里 引申——数据的来源在哪里? 1、来源第三方数据(接口数据),如:京东、淘宝都有第三方接口访问提供的数据 2、来源于系统本身的访问数据,如:B/S架构的数据、保存到数据库的data 3、基于浏览器的缓存数据,这种数据也很具有参考价值,通过该数据 阅读全文

posted @ 2020-03-06 20:18 兰智杰 阅读(193) 评论(0) 推荐(0) 编辑

2020年3月5日

摘要: DataFrame 1、通过二维数组创建 import pandas as pd import numpy as np df01=pd.DataFrame([['tony','marry','tom'],[18,20,25]]) print(df01) ''' 输出为 0 1 2 0 tony ma 阅读全文

posted @ 2020-03-05 22:26 兰智杰 阅读(167) 评论(0) 推荐(0) 编辑

2020年3月1日

摘要: pandas pandas是一种Python数据分析的利器,是一个开源的数据分析包,最初是应用于金融数据分析工具而开发出来的,因此pandas为时间序列分析提供了很好的支持,pandas是PyData项目的一部分,它主要提供了五大功能: 支持文件存取操作,支持数据库(sql)、html、json、p 阅读全文

posted @ 2020-03-01 21:26 兰智杰 阅读(262) 评论(0) 推荐(0) 编辑