2-Pandas数据初探索之数据类型与数据筛选

一、数据类型

1、Pandas的数据类型主要结合了pandas和numpy两个模块中的数据类型,包括以下几种:

  • float
  • int
  • bool
  • datetime64[ns]------>日期类型
  • datetime64[ns,tz]--->日期类型
  • timedelta[ns]------->时间差类型
  • category
  • object---->当一个Series仅包括字符串或是包括多种数据类型时为object类型

2、通过DateFrame对象的dtypes属性,可得到各个特征的数据类型。

  例如:df.dtypes

3、类型转换:

  (1)通过astype()转换数据类型,默认情况下会产生对象转换后的一个副本

    df['A'] = df['A'].astype('int8')

  (2)对多列进行类型转换时,对astype()传入一个字典。字典的键值对格式为列名:目标数据类型

    df = df.astype({'A':'int8','B':'int32'})

二、数据筛选

select_dtypes()筛选出特定数据类型的特征

  包括两个参数:

  • include:筛选时选取的数据类型
  • exclude:筛选时排除的数据类型

df.select_dtypes(include=['float'],exclude=['int'])

 

posted @ 2020-07-26 18:58  大脸猫12581  阅读(916)  评论(0编辑  收藏  举报