随笔分类 - Kaggle
摘要:上篇 "4_Random Forests and K Nearest Neighbours" 5 总结 5.1 关于这个项目 我们的目标是根据历史数据,利用时间和天气来预测建筑的能源需求。该模型将产生准确的能源需求预测,这将有助于智能电网技术的发展。如果哈佛大学能够预测所有校园建筑的能源需求,他们将
阅读全文
摘要:上篇 "3_Gaussian Process Regression" 4.1 随机森林 在这次笔记中,将训练一个随机森林回归模型来预测基于历史能源数据和几个天气变量的建筑能耗。我们将使用每日能源数据和天气数据来预测能源消耗。 在这次笔记本,我们将训练一个随机森林回归模型来预测基于历史能源数据和几个天
阅读全文
摘要:使用不同的机器学习方法进行预测 上篇 "2_Linear Regression and Support Vector Regression" 高斯过程回归 从数据预处理中读取数据 chilledWater TonDays startDay endDay RH % T C Tdew C pressur
阅读全文
摘要:介绍 看电影是目前人们休闲娱乐,消遣时光的选择之一。我们都知道,有些电影的票房很高,有的电影票房却很低,那么决定票房的因素是什么呢?本次将介绍,如何根据电影上映前的一些信息来预测出该电影的票房。 知识点 数据预处理 建立预测模型 电影票房预测介绍 电影产业在 2018 年估计达到 417 亿美元,电
阅读全文
摘要:介绍 对于金融机构的贷款业务来说,一个顾客的信用信息是极其重要的。因为只有了解客户的信用情况,才能决定是否通过客户的贷款申请。本次将会介绍如何根据用户的一些基本信息来判断顾客的信用或贷款偿还能力。 知识点 数据导入与预览 数据可视化 plotly 特征工程 预测模型的选择 贷款信用评估介绍 本次的内
阅读全文
摘要:上篇 "1_Project Overview, Data Wrangling and Exploratory Analysis" 使用不同的机器学习方法进行预测 线性回归 在这本笔记本中,将训练一个线性回归模型来预测基于历史能源数据、几个天气变量、一天中的小时、一周中的一天、周末和假期的电源能耗。
阅读全文
摘要:分销商产品未来销售情况预测 介绍 前面的几个实验中,都是根据提供的数据特征来构建模型,也就是说,数据集中会含有许多的特征列。本次将会介绍如何去处理另一种常见的数据,即时间序列数据。具体来说就是如何根据以往的销售额来预测未来短期内的销售额。 知识点 时间序列数据 数据预处理 未来销售额预测介绍 对于一
阅读全文
摘要:为提高提高大学能源效率进行建筑能源需求预测 本文翻译哈佛大学的能源分析和预测报告,这是 "原文" 暂无数据源,个人认为学习分析方法就足够 内容: 1. 项目概述 2. 了解数据 3. 探索性分析 4. 使用不同的机器学习方法进行预测 5. 总结 6. 结论 7. 讨论 1. 项目概述 用机器学习来进
阅读全文
摘要:Introduction In this competition you will predict how many yards a team will gain on a rushing play in an NFL regular season game. 在这场比赛中,你可以预测在NFL的常规
阅读全文
摘要:neural networks + feature engineering for the win 导入需要的库 全面分析 特征工程 分类特征 对其中一些特性进行预处理。 球场类型 已经看到一些拼写错误了,下面来改正它们。 根据pareto's原则,我们只关注这些词: outdoor, indoor
阅读全文
摘要:绝地求生游戏最终排名预测 知识点 数据读取与预览 数据可视化 构建随机森林预测模型 导入数据并预览 先导入数据并预览。本次实验同样来源于 Kaggle 上的一个竞赛: " 绝地求生排名预测" ,由于原始数据较大,我们只取了其中一部分的数据来进行分析。如果你想分析所有的数据可以去 " 下载原始数据"
阅读全文

浙公网安备 33010602011771号