数据预处理4之数据类型转换

import numpy as np
import pandas as pd

  

data1 = pd.read_csv("F:/tianic_train.csv")

  

#查看数据类型

data1["Age"].dtype

  

#转换函数astype()进行数据的转换

data1["Age"].astype("float")# int:整型,float:浮点型,str:字符型,bool:布尔型,object.

  

#日期与时间数据转换
from datetime import datetime
date2 = pd.DataFrame({"string":["19/10/01/12","18/02/02/2","19/11/01/4"]})
date2

  

#字符串转换为时间格式

pd.to_datetime(date2["string"]    #value
              ,format="%y/%m/%d/%I"  #格式,必须保持与字符串一样分割
              )

# %Y:四位年份   %y:两位年份   %m:两位月份 %d:两位日期  %H:24小时制  %I:12小时制  %M:lia

  

#使用映射进行数据转换

rule = {"S":1,"C":2,"Q":3}  #映射对应关系

data1["AAA"] = data1["Embarked"].map(rule)  #进行映射

  

#使用函数进行数据转换

data1["Name"].str.lower()   #upper(),title()

  

posted @ 2020-01-15 19:26  数据骆驼  阅读(565)  评论(0)    收藏  举报