Pandas 是一个数据结构

Pandas 的主要数据结构是两种核心对象:Series 和 DataFrame。

  • Series 是一维标记数组,类似于带有标签的数组。它可以存储任何数据类型,并且每个元素都与一个唯一的标签相关联。
  • DataFrame 是二维标记数据结构,类似于电子表格或 SQL 表。它由多个列组成,每列可以是不同的数据类型,可以将 DataFrame 视为一系列 Series 对象的集合。

用途:

处理excel

和numpy的区别:

  nump没索引,pandas有

  1. 数据结构:

    • ndarray是一个多维数组对象,可以包含具有相同数据类型的元素,通常用于进行数值计算和数组操作。它是NumPy库的核心数据结构。
    • DataFramepandas库中的数据结构,它是一个二维标记数据表,类似于电子表格或SQL表。DataFrame可以包含不同数据类型的列,可以方便地处理结构化数据。
  2. 数据类型:

    • ndarray要求所有元素具有相同的数据类型,通常是数值类型(如整数、浮点数)。
    • DataFrame允许每列具有不同的数据类型,因此可以容纳混合数据,包括数值、文本、日期时间等。
  3. 索引:

    • ndarray没有内置的行或列标签,只能通过位置索引来访问元素。
    • DataFrame具有灵活的行和列标签,使数据更容易理解和操作。你可以自定义行和列的标签,还可以使用标签进行数据选择和操作。
  4. 功能:

    • ndarray主要用于执行数学和数组操作,例如加法、乘法、广播等。
    • DataFrame是设计用于数据分析和处理的,它提供了许多功能,如数据过滤、合并、聚合、透视表、时间序列操作等。
  5. 用途:

    • ndarray适用于数值计算、科学计算、机器学习等领域,特别是需要处理大量数值数据的情况。
    • DataFrame更适用于数据探索、数据清洗、数据可视化、数据分析以及结构化数据的存储和操作。它在数据科学和数据分析中广泛使用。

 

posted on 2023-05-29 18:12  黑逍逍  阅读(182)  评论(0)    收藏  举报