摘要: 索引(index)是 Pandas 的重要工具,通过索引可以从 DataFame 中选择特定的行数和列数,这种选择数据的方式称为“子集选择”。在 Pandas 中,索引值也被称为标签(label),它在 Jupyter 笔记本中以粗体字进行显示。索引可以加快数据访问的速度,它就好比数据的书签,通过它 阅读全文
posted @ 2021-12-05 13:47 菩提浪子 阅读(6037) 评论(0) 推荐(0)
摘要: Excel 是由微软公司开发的办公软件之一,它在日常工作中得到了广泛的应用。在数据量较少的情况下,Excel 对于数据的处理、分析、可视化有其独特的优势,因此可以显著提升您的工作效率。但是,当数据量非常大时,Excel 的劣势就暴露出来了,比如,操作重复、数据分析难等问题。Pandas 提供了操作 阅读全文
posted @ 2021-12-05 13:45 菩提浪子 阅读(880) 评论(0) 推荐(0)
摘要: 当使用 Pandas 做数据分析的时,需要读取事先准备好的数据集,这是做数据分析的第一步。Panda 提供了多种读取数据的方法: read_csv() 用于读取文本文件 read_json() 用于读取 json 文件 read_sql_query() 读取 sql 语句的, 本节将对上述方法做详细 阅读全文
posted @ 2021-12-05 13:44 菩提浪子 阅读(1445) 评论(0) 推荐(0)
摘要: Pandas 在数据分析、数据可视化方面有着较为广泛的应用,Pandas 对 Matplotlib 绘图软件包的基础上单独封装了一个plot()接口,通过调用该接口可以实现常用的绘图操作。本节我们深入讲解一下 Pandas 的绘图操作。Pandas 之所以能够实现了数据可视化,主要利用了 Matpl 阅读全文
posted @ 2021-12-05 13:42 菩提浪子 阅读(178) 评论(0) 推荐(0)
摘要: 通常情况下,数据集中会存在许多同一类别的信息,比如相同国家、相同行政编码、相同性别等,当这些相同类别的数据多次出现时,就会给数据处理增添许多麻烦,导致数据集变得臃肿,不能直观、清晰地展示数据。 针对上述问题,Pandas 提供了分类对象(Categorical Object),该对象能够实现有序排列 阅读全文
posted @ 2021-12-05 13:41 菩提浪子 阅读(480) 评论(0) 推荐(0)
摘要: 随机抽样,是统计学中常用的一种方法,它可以帮助我们从大量的数据中快速地构建出一组数据分析模型。在 Pandas 中,如果想要对数据集进行随机抽样,需要使用 sample() 函数。sample() 函数的语法格式如下: DataFrame.sample(n=None, frac=None, repl 阅读全文
posted @ 2021-12-05 13:40 菩提浪子 阅读(169) 评论(0) 推荐(0)
摘要: 顾名思义,时间序列(time series),就是由时间构成的序列,它指的是在一定时间内按照时间顺序测量的某个变量的取值序列,比如一天内的温度会随时间而发生变化,或者股票的价格会随着时间不断的波动,这里用到的一系列时间,就可以看做时间序列。时间序列包含三种应用场景,分别是: 特定的时刻(timest 阅读全文
posted @ 2021-12-05 13:39 菩提浪子 阅读(1127) 评论(0) 推荐(0)
摘要: Pandas 通过 concat() 函数能够轻松地将 Series 与 DataFrame 对象组合在一起,函数的语法格式如下: pd.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False) 参数说明如下所示: 参数名称 阅读全文
posted @ 2021-12-05 13:34 菩提浪子 阅读(519) 评论(0) 推荐(0)
摘要: Pandas 提供的 merge() 函数能够进行高效的合并操作,这与 SQL 关系型数据库的 MERGE 用法非常相似。从字面意思上不难理解,merge 翻译为“合并”,指的是将两个 DataFrame 数据表按照指定的规则进行连接,最后拼接成一个新的 DataFrame 数据表。 merge() 阅读全文
posted @ 2021-12-05 13:33 菩提浪子 阅读(570) 评论(0) 推荐(0)
摘要: 在数据分析中,经常会遇到这样的情况:根据某一列(或多列)标签把数据划分为不同的组别,然后再对其进行数据分析。比如,某网站对注册用户的性别或者年龄等进行分组,从而研究出网站用户的画像(特点)。在 Pandas 中,要完成数据的分组操作,需要使用 groupby() 函数,它和 SQL 的GROUP B 阅读全文
posted @ 2021-12-05 13:32 菩提浪子 阅读(1326) 评论(0) 推荐(0)