关于随机森林预测天气模型如何进行数据可视化
按照之前发的随笔,忘记说明怎么进行数据的可视化,将数据特征进行分类以及转换为合适的格式并导入算法
先来建立随机森林模型啦,首先导入工具包,先建立1000个树试试吧,其他参数先用默认值,之后会再深入到调参任务中。
由于数据样本量还是非常小的,所以很快就可以得到结果了,这里先用MAPE指标来进行评估,也就是平均绝对百分误差,其实对于回归任务,评估方法还是比较多,很简单就可以实现出来,也可以选择其他指标来进行评估:
下载graphviz并导入
生成照片如图照片局部

由于照片过大,数据多,我进行了减小数据的处理。处理完后如图
为了确定特征对项目的重要性,

选取了两个重要特征进行处理。结果为损失上升但速度变快。结果显明特征对此项目十分重要,但为了处理速度可以适当省略。再对数据分类
生成对比图片。转换日期格式,再创建表格存日期,对比真实值与预测值

看起来还可以,这个走势的模型已经基本能够掌握了。
浙公网安备 33010602011771号