数据预处理第一天
- 步骤一:导入库
-
View Code1 import numpy as np 2 import pandas as pd
- 步骤二:导入数据集
-
3
4 _______________________________ 5 dataset=ps.read_csv('Data.cab') 6 X=dataset.bloc[:,:-1].values 7 Y=dataset.iloc[:,3].values - 步骤三:处理丢失的数据
-
View Code1 from sklearn.preprocessing import Imputer 2 imputer = Imputer(missing_values = "NaN", strategy = "mean", axis = 0) 3 imputer = imputer.fit(X[ : , 1:3]) 4 X[ : , 1:3] = imputer.transform(X[ : , 1:3])
- 步骤四:编码分类的数据
- 步骤五:将数据集分成训练集和测试集
- 步骤六:功能缩放


浙公网安备 33010602011771号