摘要: Pandas 数据清洗 数据清洗是对一些没有用的数据进行处理的过程。 很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况,如果要对使数据分析更加准确,就需要对这些没有用的数据进行处理。 在这个教程中,我们将利用 Pandas包来进行数据清洗。 本文使用到的测试数据 property-da 阅读全文
posted @ 2022-03-18 15:25 emanlee 阅读(527) 评论(0) 推荐(0)
摘要: Pandas JSON JSON(JavaScript Object Notation,JavaScript 对象表示法),是存储和交换文本信息的语法,类似 XML。 JSON 比 XML 更小、更快,更易解析,更多 JSON 内容可以参考 JSON 教程。 Pandas 可以很方便的处理 JSON 阅读全文
posted @ 2022-03-18 15:19 emanlee 阅读(465) 评论(0) 推荐(0)
摘要: Pandas CSV 文件 CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。 Pandas 可以很方便的处理 C 阅读全文
posted @ 2022-03-18 15:17 emanlee 阅读(285) 评论(0) 推荐(0)
摘要: Pandas 数据结构 - DataFrame DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。 DataFrame 构造方法如下: 阅读全文
posted @ 2022-03-18 15:13 emanlee 阅读(364) 评论(0) 推荐(0)
摘要: Pandas 数据结构 - Series Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。 Series 由索引(index)和列组成,函数如下: pandas.Series( data, index, dtype, name, copy) 参数 阅读全文
posted @ 2022-03-18 15:07 emanlee 阅读(87) 评论(0) 推荐(0)
摘要: Python pandas 入门 Pandas 应用 Pandas 的主要数据结构是 Series (一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。 数据结构 Series 是一种类似于一维数组的对象,它由一组数据(各种Num 阅读全文
posted @ 2022-03-18 15:03 emanlee 阅读(162) 评论(0) 推荐(0)
摘要: Matplotlib 饼图 我们可以使用 pyplot 中的 pie() 方法来绘制饼图。 pie() 方法语法格式如下: matplotlib.pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistan 阅读全文
posted @ 2022-03-18 14:20 emanlee 阅读(550) 评论(0) 推荐(0)
摘要: Matplotlib 柱形图(直方图,柱状图) 我们可以使用 pyplot 中的 bar() 方法来绘制柱形图。 bar() 方法语法格式如下: matplotlib.pyplot.bar(x, height, width=0.8, bottom=None, *, align='center', d 阅读全文
posted @ 2022-03-18 14:20 emanlee 阅读(2387) 评论(0) 推荐(0)
摘要: Matplotlib 散点图 我们可以使用 pyplot 中的 scatter() 方法来绘制散点图。 scatter() 方法语法格式如下: matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=N 阅读全文
posted @ 2022-03-18 14:18 emanlee 阅读(1036) 评论(0) 推荐(0)
摘要: Matplotlib 绘制多图 我们可以使用 pyplot 中的 subplot() 和 subplots() 方法来绘制多个子图。 subplot() 方法在绘图时需要指定位置,subplots() 方法可以一次生成多个,在调用时只需要调用生成对象的 ax 即可。 subplot subplot( 阅读全文
posted @ 2022-03-18 14:16 emanlee 阅读(1675) 评论(0) 推荐(0)
摘要: Matplotlib 网格线 我们可以使用 pyplot 中的 grid() 方法来设置图表中的网格线。 grid() 方法语法格式如下: matplotlib.pyplot.grid(b=None, which='major', axis='both', ) 参数说明: b:可选,默认为 None 阅读全文
posted @ 2022-03-18 14:13 emanlee 阅读(7030) 评论(0) 推荐(0)
摘要: Matplotlib 轴标签和标题 我们可以使用 xlabel() 和 ylabel() 方法来设置 x 轴和 y 轴的标签。 实例 import numpy as np import matplotlib.pyplot as plt x = np.array([1, 2, 3, 4]) y = n 阅读全文
posted @ 2022-03-18 13:11 emanlee 阅读(865) 评论(0) 推荐(0)
摘要: Matplotlib 绘图线 绘图过程如果我们自定义线的样式,包括线的类型、颜色和大小等。 线的类型 线的类型可以使用 linestyle 参数来定义,简写为 ls。 类型简写说明 'solid' (默认) '-' 实线 'dotted' ':' 点虚线 'dashed' '--' 破折线 'das 阅读全文
posted @ 2022-03-18 13:08 emanlee 阅读(531) 评论(0) 推荐(0)
摘要: Matplotlib 绘图标记 绘图过程如果我们想要给坐标自定义一些不一样的标记,就可以使用 plot() 方法的 marker 参数来定义。 以下实例定义了实心圆标记: 实例 import matplotlib.pyplot as plt import numpy as np ypoints = 阅读全文
posted @ 2022-03-18 13:05 emanlee 阅读(1524) 评论(0) 推荐(0)
摘要: Python matplotlib 画图入门 安装 matplotlib C:\Python310\Scripts>pip install matplotlib Matplotlib Pyplot Pyplot 是 Matplotlib 的子库,提供了和 MATLAB 类似的绘图 API。 Pypl 阅读全文
posted @ 2022-03-18 13:02 emanlee 阅读(738) 评论(0) 推荐(0)
摘要: NumPy 排序、条件刷选函数 NumPy 提供了多种排序的方法。 这些排序函数实现不同的排序算法,每个排序算法的特征在于执行速度,最坏情况性能,所需的工作空间和算法的稳定性。 下表显示了三种排序算法的比较。 种类速度最坏情况工作空间稳定性 'quicksort'(快速排序) 1 O(n^2) 0 阅读全文
posted @ 2022-03-18 10:00 emanlee 阅读(273) 评论(0) 推荐(0)
摘要: NumPy 统计函数 NumPy 提供了很多统计函数,用于从数组中查找最小元素,最大元素,百分位标准差和方差等。 函数说明如下: numpy.amin() 和 numpy.amax() numpy.amin() 用于计算数组中的元素沿指定轴的最小值。 numpy.amax() 用于计算数组中的元素沿 阅读全文
posted @ 2022-03-18 09:57 emanlee 阅读(279) 评论(0) 推荐(0)
摘要: NumPy 包含大量的各种数学运算的函数,包括三角函数,算术运算的函数,复数处理函数等。 三角函数 NumPy 提供了标准的三角函数:sin()、cos()、tan()。 实例 import numpy as np a = np.array([0,30,45,60,90]) print ('不同角度 阅读全文
posted @ 2022-03-18 09:55 emanlee 阅读(197) 评论(0) 推荐(0)
摘要: NumPy 算术函数包含简单的加减乘除: add(),subtract(),multiply() 和 divide()。 需要注意的是数组必须具有相同的形状或符合数组广播规则。 实例 import numpy as np a = np.arange(9, dtype = np.float_).res 阅读全文
posted @ 2022-03-18 09:54 emanlee 阅读(308) 评论(0) 推荐(0)
摘要: Numpy 数组操作 Numpy 中包含了一些函数用于处理数组,大概可分为以下几类: 修改数组形状 翻转数组 修改数组维度 连接数组 分割数组 数组元素的添加与删除 修改数组形状 函数描述 reshape 不改变数据的条件下修改形状 flat 数组元素迭代器 flatten 返回一份一维数组拷贝(一 阅读全文
posted @ 2022-03-18 09:51 emanlee 阅读(514) 评论(0) 推荐(0)