pandas笔记 熟练使用 df
直接进行一个cf的查询
自用字典
1、对读入的文件 进行一个数据的写入特征指定 比如一串全是数字的文本 可能会被读成int float 需要指定类型
data_set = pd.read_csv(file_name, encoding='utf8',dtype={'kol_id':str})
2、数据集划分
train_ratio = 0.7
T_train = df_data.sample(frac=train_ratio)
T_test = df_data[~df_data.index.isin(T_train.index)]