【数据比赛】5.回归预测baseLine--以房价预测为例
摘要:参考:https://www.kaggle.com/lavanyashukla01/how-i-made-top-0-3-on-a-kaggle-competition 导入相关的python包 import numpy as np import pandas as pd import dateti
阅读全文
【数据比赛】4.FFT在时序数据上的应用
摘要:理论上,所有的波形数据,都可以通过不同频率和相位的正弦波或者余弦波叠加而成。所以,可以对时效数据进行FFT,找出其周期特点。 参考:https://www.kaggle.com/muonneutrino/wikipedia-traffic-data-exploration 如图所示,为各个不同语音国
阅读全文
【数据比赛】3.回归预测中对中位数预测友好的loss function
摘要:# -*- coding: utf-8 -*- """ Created on Sat Oct 10 15:21:10 2020 分析SMAPE这个指标,特别是对中位数预测的结果评估上 https://www.kaggle.com/cpmpml/smape-weirdness @author: sir
阅读全文
【数据比赛】2.指标评估转换
摘要:比赛中原始的指标并不能直接作为模型训练中的loss function ,需要我们去进行转换,或者用相近的替代。原始指标:评估指标为 root mean squared logarithmic error (RMSLE) 参考:https://mp.weixin.qq.com/s?__biz=MzU1
阅读全文
【数据比赛】1.时间序列模型基础
摘要:1.1 对传统时序中的方法进行深入理解 ①、通过画出随时间变化的销量,来看数据是否有趋势、季节、周期等特性 ②、再对其进行分解(加法、乘法都需要试一下)。 ③、对其进行平稳性分析,主要有观察法(均值、方差是否随时间变化而变化)和单位根检验法(P值是否小于5%,小于5%才能认为是平 稳,不然需要对其进
阅读全文