摘要: 经历了先前的探索性数据分析、数据清洗与数据重构之后,就可以准备进行模型的搭建和评估了 模型搭建前的工作可以概括为特征工程,主要包括缺失值处理、重复值处理、分类变量编码 一、模型搭建 监督学习:已有的数据集中既有特征(feature)又有标签(label),通过训练,让机器/程序可找到特征和标签之间的 阅读全文
posted @ 2021-12-15 20:34 宝joM 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 对数据进行了清洗之后,就可以对数据进行重构了 一、数据合并 第一种方式,pandas的方法 # concat 拼接两个df a=pd.concat([df1,df2],axis=0,join='outer',ignore_index=True] # axis默认0,垂直方向,增加行;为1,水平方向, 阅读全文
posted @ 2021-12-15 14:38 宝joM 阅读(82) 评论(0) 推荐(0) 编辑