随笔分类 - Python_Analyze
摘要:处理缺失值 通过isnull和notnull方法,可以返回布尔值的对象。 这时通过求和可以获取每列的缺失值数量,再通过求和就可以获得整个DataFrame的缺失值数量 侦查缺失值 创建有缺失值的DataFeame >>> from pandas import Series,DataFrame >>>
阅读全文
摘要:CSV文件的读取 pandas库提供了将表格型数据读取为DataFrame数据结构的函数 文本解析函数: read_csv 从文件中加载带分隔符的数据,默认分隔符为逗号 read_table 从文件中加载带分隔符的数据,默认分隔符为制表符 写入csv文件 使用read_csv读取csv文件 使用re
阅读全文
摘要:线形图 线形图通常用于描述两组数据之间的趋势 Series数据 通过s.plot方法可以绘制线形图 DataFrame数据 柱状图 柱状图常描述各类别之间的关系。 用法是在plot函数中加入kind=”bar”,如果类别较多,可绘制水平柱状图(kind=”barh”)。 简单柱状图 班级学生性别分布
阅读全文
摘要:层次化索引简介 简单的说,层次化索引就是轴上有多个级别的索引 Series层次化索引 MultiIndex对象 数据选取 DataFrame层次化索引 数据选取 重排分级顺序 通过swaplevel方法可以对层次化索引重新排序 汇总统计 在对层次化索引的pandas数据进行汇总时统计时,可以通过le
阅读全文
摘要:算术运算 pandas的数据对象在进行算术运算时,如果有相同索引对则进行算术运算,如果没则会引入缺失值,这就是算术对齐 Series数据的算术运算 DataFrame数据的算术运算 DataFrame和Series的算术运算 函数应用和映射 map函数,将函数套用在Series的每个元素中 appl
阅读全文
摘要:重新索引 索引对象是无法进行修改的,重新索引并不是给索引重新命名,而是对索引重新排序 Series重新排序后的索引 填充缺失值(method参数实现,ffill为向前填充,bfill为向后填充) DataFrame重新索引行 DataFrame重新索引列 reindex函数参数 index 用于索引
阅读全文
摘要:创建Series数据 Series是由一组数据和一组对应的索引组成的 数组创建Series 指定索引创建Series 获取数组和索引对象 通过索引来获取Series的单个或者一组值 通过字典创建Series Series的简单运算(比较运算符,数值运算符,取绝对值) 给Series对象和索引定义名称
阅读全文
摘要:数组和标量间的运算 相同维度的数组的算术运算都可以直接应用到元素中,也就是元素级运算 矢量化 元素级运算 通用函数 通用函数(ufunc)是一种对数组中的数据执行元素级别运算的函数 一元函数 abs: 求绝对值 square: 求平方 二元函数 add: 两个数组相加 minimum: 计算元素最小
阅读全文
摘要:数组的索引 重点: 数组的切片和索引返回的都是原始数组的视图,视图上的操作会使原始数组发生改变 数组的索引1 数组的索引2 数组的索引3 二维数组的索引1 二维数组的索引2 高维数组索引1 高维数组索引2 高维数组索引3 数组的切片 一维数组切片 多维数组索引1 多维数组索引2 布尔类型的索引 数组
阅读全文
摘要:创建ndarray数组 1. 通过列表创建ndarray数组 2. 通过元祖创建ndarray数组 3. 创建多维数组 4. zeros函数 5. ones函数 6. empty函数 7. arange函数 ndarray对象属性 .ndim 数据轴的个数 .shape 数组的维度 .size 元素
阅读全文

浙公网安备 33010602011771号