2016年8月13日

利用Python进行数据分析(11) pandas基础: 层次化索引

摘要: 层次化索引 层次化索引指你能在一个数组上拥有多个索引,例如: 有点像Excel里的合并单元格对么? 根据索引选择数据子集 以外层索引的方式选择数据子集: 以内层索引的方式选择数据: 多重索引Series转换为DataFrame 层次化索引在数据重塑和分组中扮演着很重要的角色,例如,上面的层次化索引数 阅读全文

posted @ 2016-08-13 16:51 backslash112 阅读(6766) 评论(1) 推荐(0) 编辑

利用Python进行数据分析(10) pandas基础: 处理缺失数据

摘要: 数据不完整在数据分析的过程中很常见。 pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据。 pandas使用isnull()和notnull()函数来判断缺失情况。 对于缺失数据一般处理方法为滤掉或者填充。 滤除缺失数据 对于一个Series,dropna()函数返回一个包含非空数据和索引 阅读全文

posted @ 2016-08-13 16:13 backslash112 阅读(20589) 评论(0) 推荐(1) 编辑

利用Python进行数据分析(6) NumPy基础: 矢量计算

摘要: 矢量化指的是用数组表达式代替循环来操作数组里的每个元素。 NumPy提供的通用函数(既ufunc函数)是一种对ndarray中的数据进行元素级别运算的函数。 例如,square函数计算各元素的平方,rint函数将各元素四舍五入: 还有一些函数接受2个参数,叫二元ufunc,比如add函数和maxim 阅读全文

posted @ 2016-08-13 10:41 backslash112 阅读(4398) 评论(0) 推荐(1) 编辑

导航