随笔分类 - 竞赛
科研竞赛
摘要:这是KDD Debiasing赛道结束后各位前排大佬分享的方案,感觉看完之后获益匪浅,从中学习到了很多东西,也对RS这个领域有了更深层次的理解。同时也对领域之间的知识点的相互应用借鉴有了一些新的想法。本次记录我在学习之后的一些理解与想法,在往后希望有用。 纵观每一个方案,除了TOP5方案使用了端到端
阅读全文
摘要:思考与想法 不同损失函数是在不同场景下应用的,每一种损失函数背后都有一种假设,满足假设的前提下,利用损失函数训练出来的模型才有比较好的效果 损失函数MSE背后的假设是要满足误差分布满足高斯分布,或者不严谨的来说,MSE适用于高斯分布的数据,常用在回归问题的应用场景中;类似的,MAE背后的假设是误差满
阅读全文
摘要:这是比赛的最后一个阶段,模型的集成融合 在传统的机器学习中,模型集成融合有stack,投票等方式,在深度学习中,竟然也可以使用模型集成融合,这让我学到了很多,下面就将这些方法进行一下罗列记录,方便日后思考学习: ###方法一:Droupout droupout经常用作防止模型拟合来使用,但是由于其对
阅读全文
摘要:这是比赛的第四阶段,模型的相关训练与验证 选好模型之后,需要建立训练集与验证集进行模型的效果验证,保证模型的预测结果正确符合,以及不过拟合训练与验证主要有以下几种方法: ###交叉验证法 交叉验证法的作用就是尝试利用不同的训练集/测试集划分来对模型做多组不同的训练/测试,来应对单词测试结果过于片面以
阅读全文
摘要:本文是街景字符识别比赛第三阶段,关于模型搭建的相关问题 在baseline中,使用了比较简单的神经网络的搭建,并且为了加快模型的收敛,使用了预训练分类模型 class SVHN_Model1(nn.Module): def __init__(self): super(SVHN_Model1, sel
阅读全文
摘要:这是街景字符识别的第二阶段,数据的读取以及数据的扩增 在我们理解了赛题,知道自己所要完成的任务以及优化目标之后,我们就要对赛题的数据进行处理。本赛题的baseline本质来说,就是对每个字符进行单独的分类,因为只有数字,所以简单处理作为分类任务也是可以的,但是对于带有字符(包括英文或者中文),简单的
阅读全文
摘要:这是入门深度学习——具体来说是CV比赛的入门级比赛,有点类似手写数字识别,具体的赛题链接如下:https://tianchi.aliyun.com/competition/entrance/531795/information 入门深度学习比赛,我想把参加比赛的全过程包括:赛题理解,数据处理(或者可
阅读全文
摘要:kaggle上关于时序数据预测的案例,链接:https://www.kaggle.com/c/competitive data science predict future sales 赛题描述:在本次比赛中,您将使用具有挑战性的时间序列数据集,其中包括每日销售数据,该数据集由俄罗斯最大的软件公司之
阅读全文
摘要:前言:最近开始kaggle的一些竞赛,从一开始的懵懵懂懂,到后面的逐渐熟练,在kaggle上真的学到了很多,特此将自己的一些想法与思考记录下来,希望能和大家一起探讨学习,如果有不对的地方,希望大家可以指出来! 赛题描述:要求购房者描述他们梦dream以求的房子,他们可能不会从地下室天花板的高度或与东
阅读全文

浙公网安备 33010602011771号