Pandas创建数据
Pandas创建数据
pandas可以通过多种方式创建数据。可以导入现有的数据文件,或者直接从Python数据结构创建DataFrame。
这里主要介绍直接从Python数据结构创建DataFrame的方法。
方法一 直接从Python数据结构创建DataFrame
这里通过一个简单的例子来演示如何从Python数据结构创建DataFrame。
import pandas as pd
import numpy as np
# 创建一个DataFrame
df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006],
"date":pd.date_range('20130102', periods=6),
"city":['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '],
"age":[23,44,54,32,34,32],
"category":['100-A','100-B','110-A','110-C','210-A','130-F'],
"price":[1200,np.nan,2133,5433,np.nan,4432]},
columns =['id','date','city','category','age','price'])
df
| id | date | city | category | age | price | |
|---|---|---|---|---|---|---|
| 0 | 1001 | 2013-01-02 | Beijing | 100-A | 23 | 1200.0 |
| 1 | 1002 | 2013-01-03 | SH | 100-B | 44 | NaN |
| 2 | 1003 | 2013-01-04 | guangzhou | 110-A | 54 | 2133.0 |
| 3 | 1004 | 2013-01-05 | Shenzhen | 110-C | 32 | 5433.0 |
| 4 | 1005 | 2013-01-06 | shanghai | 210-A | 34 | NaN |
| 5 | 1006 | 2013-01-07 | BEIJING | 130-F | 32 | 4432.0 |
创建DataFrame的格式
pd.DataFrame(data, index=None, columns=None, dtype=None, copy=False)
data: dict, array-like, or DataFrame 数据可以是字典、数组或另一个DataFrame。
index: array-like, optional 自定义索引,如果不提供,则使用默认的整数索引。
columns: array-like, optional 自定义列名,如果不提供,则使用数据的默认列
dtype: dtype, optional 指定数据类型,如果不提供,则自动推断。
copy: bool, default False 是否复制数据,如果为True,则创建数据的副本。
data用字典时键为列名,值为列数据。data用数组时每个数组元素为一行数据。

浙公网安备 33010602011771号