数据预处理4之数据类型转换
import numpy as np
import pandas as pd
data1 = pd.read_csv("F:/tianic_train.csv")
#查看数据类型
data1["Age"].dtype
#转换函数astype()进行数据的转换
data1["Age"].astype("float")# int:整型,float:浮点型,str:字符型,bool:布尔型,object.
#日期与时间数据转换
from datetime import datetime
date2 = pd.DataFrame({"string":["19/10/01/12","18/02/02/2","19/11/01/4"]})
date2
#字符串转换为时间格式
pd.to_datetime(date2["string"] #value
,format="%y/%m/%d/%I" #格式,必须保持与字符串一样分割
)
# %Y:四位年份 %y:两位年份 %m:两位月份 %d:两位日期 %H:24小时制 %I:12小时制 %M:lia
#使用映射进行数据转换
rule = {"S":1,"C":2,"Q":3} #映射对应关系
data1["AAA"] = data1["Embarked"].map(rule) #进行映射
#使用函数进行数据转换
data1["Name"].str.lower() #upper(),title()
1.本篇所有数据文件小博已上传,需要的小伙伴到“文件”进行下载使用。数据文件纯属学习教学所用,纯属虚构。
2.文章中的代码都是经过小博的真实操作,可以执行。(注:Anaconda3的Jupyter notebook)
浙公网安备 33010602011771号