• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
白粥送榨菜
博客园 首页 新随笔 联系 订阅 订阅 管理

2020年10月20日

【数据比赛】5.回归预测baseLine--以房价预测为例
摘要: 参考:https://www.kaggle.com/lavanyashukla01/how-i-made-top-0-3-on-a-kaggle-competition 导入相关的python包 import numpy as np import pandas as pd import dateti 阅读全文
posted @ 2020-10-20 15:02 白粥送榨菜 阅读(583) 评论(0) 推荐(0)
 
【数据比赛】4.FFT在时序数据上的应用
摘要: 理论上,所有的波形数据,都可以通过不同频率和相位的正弦波或者余弦波叠加而成。所以,可以对时效数据进行FFT,找出其周期特点。 参考:https://www.kaggle.com/muonneutrino/wikipedia-traffic-data-exploration 如图所示,为各个不同语音国 阅读全文
posted @ 2020-10-20 11:38 白粥送榨菜 阅读(570) 评论(0) 推荐(0)
 
【数据比赛】3.回归预测中对中位数预测友好的loss function
摘要: # -*- coding: utf-8 -*- """ Created on Sat Oct 10 15:21:10 2020 分析SMAPE这个指标,特别是对中位数预测的结果评估上 https://www.kaggle.com/cpmpml/smape-weirdness @author: sir 阅读全文
posted @ 2020-10-20 11:04 白粥送榨菜 阅读(256) 评论(0) 推荐(0)
 
【数据比赛】2.指标评估转换
摘要: 比赛中原始的指标并不能直接作为模型训练中的loss function ,需要我们去进行转换,或者用相近的替代。原始指标:评估指标为 root mean squared logarithmic error (RMSLE) 参考:https://mp.weixin.qq.com/s?__biz=MzU1 阅读全文
posted @ 2020-10-20 11:01 白粥送榨菜 阅读(145) 评论(0) 推荐(0)
 
【数据比赛】1.时间序列模型基础
摘要: 1.1 对传统时序中的方法进行深入理解 ①、通过画出随时间变化的销量,来看数据是否有趋势、季节、周期等特性 ②、再对其进行分解(加法、乘法都需要试一下)。 ③、对其进行平稳性分析,主要有观察法(均值、方差是否随时间变化而变化)和单位根检验法(P值是否小于5%,小于5%才能认为是平 稳,不然需要对其进 阅读全文
posted @ 2020-10-20 10:53 白粥送榨菜 阅读(490) 评论(0) 推荐(0)
 
 

公告


博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3