Pandas 支持哪些数据对象?

Pandas 的核心数据对象有3类,是数据处理的基础,底层均基于 NumPy 优化内存布局:

1. Series(一维带标签数组)

  • 核心特点:单列数据,索引(标签)可自定义(默认整数序列),数据类型(dtype)支持数值、字符串、时间等。
  • 通俗类比:像带行号的 Excel 单列,或字典(键=索引,值=数据)。

2. DataFrame(二维表格型数据)

  • 核心特点:多列异构数据(每列可不同 dtype),行/列均有索引,支持行筛选、列操作、缺失值处理等。
  • 通俗类比:Excel 工作表、SQL 数据表,是 Pandas 最常用的对象。

3. Index(索引对象)

  • 核心特点:不可变(保证数据一致性),支持集合运算(交集、并集),作为 Series/DataFrame 的“标签基准”。
  • 常见类型:默认整数索引(RangeIndex)、标签索引(Index)、时间索引(DatetimeIndex)等。

此外还有 Panel(三维数据,较少用,已被 xarray 替代)、PeriodIndex(时间周期索引)等辅助对象,核心工作流围绕前3类展开。

需要我用代码示例演示这3类对象的创建与核心操作吗?可以直观展示索引特性和数据交互逻辑。

posted @ 2025-11-25 13:09  wangya216  阅读(41)  评论(0)    收藏  举报