机器学*:01篇- 5分钟带你快速跑通Baseline!!!(持续更新ing)
Task 01 : 跑通Baseline模型
本博客主要结合DataWhale文章以及个人学*到的知识,深入研究电力预测方向的Baseline模型如何进行构建,以及使用Baseline模型在机器学*中的重要性。
电力预测的Baseline模型
1. 引言
通常我们又称BaseLine模型为分类模型,往往入门都是用它来实现一个分类任务。但这些模型不仅仅出现在分类任务中,而是整个CV领域的基石。在后面接触到的检测、分割、关键点回归等任务,都离不开一个关键的步骤——特征提取;这个关键步骤都是基于特征提取后的特征图进行后续的操作,BaseLine模型在这些任务中都是必不可少的,并且选取不同的模型,对整个任务的性能也有很大影响(当然不排除自己设计模型进行特征提取)
2. 电力预测的重要性
电力预测是能源行业的关键组成部分。通过准确预测电力需求,能源公司可以更有效地规划和管理能源生产和分配。这种精确预测有助于避免能源浪费和过剩,从而降低能源生产的成本,并减少对环境的不良影响。因此,机器学*模型通过分析历史数据和实时数据,可以生成基于数据的决策支持,帮助能源公司和政府制定更精准和可持续的能源政策。除此之外,我其实还同时在进行LLM的研究,电力这个问题让我联想到我们组里的一位老师属于电气方向,他提出一个问题就是其实LLM也在研究如何和电力领域进行结合,由于电力方面的数据一般都是离线的,这要求对LLM进行本地部署来进行研究。
3. 什么是Baseline模型?
Baseline模型是一种基础的预测模型,通常用作比较其他更复杂模型性能的参考点。尽管它们通常比较简单,但在许多情况下,它们可以提供相当准确的预测。而且在我们进行机器学*模型训练之前,一般都要先进行Baseline模型的部署,之后再进行optimize等等的时候,如果发现模型的performance还不如baseline模型,那就说明当前训练模型的方法肯定是有问题的,相当于反向优化了,此时就要去考虑是optimize的问题还是模型选择的问题等等。
4. Baseline模型在电力预测中的应用
这里我们使用的Baseline模型是使用过去11-20天的平均电力需求来预测未来的需求,尽管这种方法忽略了可能影响电力需求的许多因素,但它提供了一个快速且易于实现的解决方案。因此这种Baseline模型也是实际操作过程中经常采用的一种Baseline模型。
5. 如何构建一个Baseline模型?
构建Baseline模型的步骤包括数据收集、数据预处理、模型训练和模型评估。这里的每一步其实代码都有给出,只是比较简单而已,只是单纯的读入数据,计算一下mse,跟测试集做了一个合并,然后就就没有然后了,楽~
6. 结论
刚刚接触机器学*时,先初步跑通一个Baseline模型,并深入理解Baseline模型是什么,为什么要使用Baseline模型等问题,不仅仅有助于我们感觉机器学*其实*在咫尺,减少畏难情绪,把机器学*这一抽象的概念可视化到眼前,虽然没有涉及底层的原理,但是对于入门使用上还是很有帮助的~ (不管怎么说,我还是觉得挺好玩儿的(doge))

浙公网安备 33010602011771号