pandas 数据处理入门
-
pip install pandas
- 导入pandans
import pandas as pd #为了方便使用pandas 采用pd简写
- pandas的初体验 (使用DataFrame和Series)
#DataFrame 是一种二维数据结构,可以在列中存储不同类型的数据 #手动将数据存储在表中,创建DataFrame #使用python的列表字典时,字典键将用作标题,而每个列表中的值用作DataFrame import pandas as pd #导包 df = pd.DataFrame({ 'Name':['徐欣','张德阳','韩磊'], 'Age':[22,30,29], 'Sex':['male','male','male'] }) print(df) #结果为: ''' Name Age Sex 0 徐欣 22 male 1 张德阳 30 male 2 韩磊 29 male ''' #爬取某一类数据 print(df['Name']) print(df.get('Age')) #两种方法,根据python字典的特性 #查询表中同学的最大年龄 print(df['Age'].max()) # 查询数据表中数值数据的基本统计信息 print(df.describe())
#a中的每一列DataFrame都是一个Series #上述例子也可以从头开始创建,Series没有列标签,因为它只是单列的DataFrame,系统只具有行标签 #这种方法我不怎么喜欢,相对来说较麻烦,单列的,如果创建多个比较麻烦,而DataFrame是多行多列 import pandas as pd #导包 ages = pd.Series([22,35,58],name='Age') print(ages) ''' 结果为: 0 22 1 35 2 58 Name: Age, dtype: int64 ''' #查询表中同学最大的年龄 print(ages.max())
本文来自博客园,作者:手可摘星辰/*,转载请注明原文链接:https://www.cnblogs.com/u-damowang1/p/13575508.html