摘要: Pandas之五数据操作 前面我们聊过了对象创建、数据查看、数据选择的相关操作,现在就要进入到数据分析阶段了。使用pandas主要原因就是其提供的数据分析功能,能实现大部分的数据统计分析工作。对数据进行操作主要有四种类型: 数据统计:常用的就是计数、平均值、最大值、最小值、标准差、分位数等等 函数应 阅读全文
posted @ 2021-09-16 16:44 行甚于言 阅读(217) 评论(0) 推荐(0)
摘要: Pandas之四缺失数据处理 在实际的数据处理过程当中,不可避免地会遇到有部分数据缺失。比如在分析股票行情数据时,有部分股票有时会停牌就会出现行情数据缺失的情况。 一般在pandas中将缺失值以np.nan来表示,其好处是会在计算时忽略,同时其类型是float,不影响总体数据计算。数据分析时就要处理 阅读全文
posted @ 2021-09-16 16:43 行甚于言 阅读(412) 评论(0) 推荐(0)
摘要: 前文介绍了如何查看dataframe数据,现在再来看看怎么样定位和修改pandas的具体数据。 官方推荐选择数据的方法为.at, .iat, .loc, .iloc,这些方法可以指定行列的信息进行数据筛选。具体功能说明如下: at:根据标签(label)定位具体元素 iat:根据位置定位具体元素 l 阅读全文
posted @ 2021-09-16 16:43 行甚于言 阅读(287) 评论(0) 推荐(1)
摘要: 上文我们聊过了在pandas中的对象创建,其中最常用的对象就是dataframe,今天我们来聊聊怎么样其中的数据。 pandas提供了丰富的查看数据的手段: head:查看最前面的几行 tail:查看最后面的几行 index:查看index columns:查看列名 describe:查看dataf 阅读全文
posted @ 2021-09-16 16:41 行甚于言 阅读(623) 评论(0) 推荐(0)
摘要: Pandas之一创建对象 pandas已经成了使用python进行数据分析的必备工具,其基于numpy使用纯python开发。本文从最简单的对象创建讲起,会逐步深入讲解。 通过pandas可以创建的对象包括Series、Index和DataFrame。 Series可以理解为一个一维数组,也有点像列 阅读全文
posted @ 2021-09-16 16:40 行甚于言 阅读(191) 评论(0) 推荐(0)
摘要: SQL实现日期自动填充 在使用SQL进行数据处理时,经常会遇到需要补齐日期的需求,今天聊一聊几个主流数据库的实现方式。 下面以生成2021-09-01到2021-09-30之间所有日期为例进行说明 Oracle connect by的递归查询还是比较强大的,实现起来也比较简单 SELECT TO_D 阅读全文
posted @ 2021-09-16 16:34 行甚于言 阅读(1708) 评论(0) 推荐(0)