pandas笔记 熟练使用 df

直接进行一个cf的查询
自用字典

1、对读入的文件 进行一个数据的写入特征指定 比如一串全是数字的文本 可能会被读成int float 需要指定类型
data_set = pd.read_csv(file_name, encoding='utf8',dtype={'kol_id':str})

2、数据集划分
train_ratio = 0.7
T_train = df_data.sample(frac=train_ratio)
T_test = df_data[~df_data.index.isin(T_train.index)]
posted @ 2022-11-07 15:38  -DP-  阅读(26)  评论(0编辑  收藏  举报