一、Pandas简介
Pandas是Python里处理数据的神器,尤其适合表格数据的分析和操作。它用起来简单高效,能帮你快速完成数据清洗、分析和可视化,是数据科学领域的必备工具。
核心功能:
1). 数据结构:提供Series(一维)和DataFrame(二维)两种核心结构,支持多种数据类型。
2). 数据处理:支持CSV、SQL、Excel等格式的读写,内置筛选、分组、聚合等操作。
可视化:可直接绘制图表,方便数据展示。
官方文档:pandas.pydata.org
代码示例:
创建DataFrame:演示从字典创建表格数据
数据筛选:通过条件过滤行
数据分组:按列值分组计数
数据聚合:生成统计摘要
数据可视化:直接绘制柱状图
这些示例覆盖了Pandas的核心功能,适合初学者快速上手。
import pandas as pd
# 创建DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
# 数据筛选
adults = df[df['Age'] > 25]
# 数据分组
grouped = df.groupby('Age').size()
# 数据聚合
summary = df.describe()
# 数据可视化
df.plot(kind='bar', x='Name', y='Age')
浙公网安备 33010602011771号