pandas是干什么的

Pandas 是一个数据结构

Pandas 的主要数据结构是两种核心对象：Series 和 DataFrame。

Series 是一维标记数组，类似于带有标签的数组。它可以存储任何数据类型，并且每个元素都与一个唯一的标签相关联。
DataFrame 是二维标记数据结构，类似于电子表格或 SQL 表。它由多个列组成，每列可以是不同的数据类型，可以将 DataFrame 视为一系列 Series 对象的集合。

处理excel

　　nump没索引，pandas有

数据结构:
- ndarray是一个多维数组对象，可以包含具有相同数据类型的元素，通常用于进行数值计算和数组操作。它是NumPy库的核心数据结构。
- DataFrame是pandas库中的数据结构，它是一个二维标记数据表，类似于电子表格或SQL表。DataFrame可以包含不同数据类型的列，可以方便地处理结构化数据。
数据类型:
- ndarray要求所有元素具有相同的数据类型，通常是数值类型（如整数、浮点数）。
- DataFrame允许每列具有不同的数据类型，因此可以容纳混合数据，包括数值、文本、日期时间等。
索引:
- ndarray没有内置的行或列标签，只能通过位置索引来访问元素。
- DataFrame具有灵活的行和列标签，使数据更容易理解和操作。你可以自定义行和列的标签，还可以使用标签进行数据选择和操作。
功能:
- ndarray主要用于执行数学和数组操作，例如加法、乘法、广播等。
- DataFrame是设计用于数据分析和处理的，它提供了许多功能，如数据过滤、合并、聚合、透视表、时间序列操作等。
用途:
- ndarray适用于数值计算、科学计算、机器学习等领域，特别是需要处理大量数值数据的情况。
- DataFrame更适用于数据探索、数据清洗、数据可视化、数据分析以及结构化数据的存储和操作。它在数据科学和数据分析中广泛使用。

posted on 2023-05-29 18:12 黑逍逍阅读(204) 评论(0) 收藏举报

刷新页面返回顶部