摘要: 这是比赛的第四阶段,模型的相关训练与验证 选好模型之后,需要建立训练集与验证集进行模型的效果验证,保证模型的预测结果正确符合,以及不过拟合训练与验证主要有以下几种方法: ###交叉验证法 交叉验证法的作用就是尝试利用不同的训练集/测试集划分来对模型做多组不同的训练/测试,来应对单词测试结果过于片面以 阅读全文
posted @ 2020-05-30 23:19 青衣素 阅读(252) 评论(0) 推荐(0)
摘要: 本文是街景字符识别比赛第三阶段,关于模型搭建的相关问题 在baseline中,使用了比较简单的神经网络的搭建,并且为了加快模型的收敛,使用了预训练分类模型 class SVHN_Model1(nn.Module): def __init__(self): super(SVHN_Model1, sel 阅读全文
posted @ 2020-05-27 09:49 青衣素 阅读(350) 评论(0) 推荐(0)
摘要: 这是街景字符识别的第二阶段,数据的读取以及数据的扩增 在我们理解了赛题,知道自己所要完成的任务以及优化目标之后,我们就要对赛题的数据进行处理。本赛题的baseline本质来说,就是对每个字符进行单独的分类,因为只有数字,所以简单处理作为分类任务也是可以的,但是对于带有字符(包括英文或者中文),简单的 阅读全文
posted @ 2020-05-23 22:39 青衣素 阅读(508) 评论(0) 推荐(0)
摘要: 这是入门深度学习——具体来说是CV比赛的入门级比赛,有点类似手写数字识别,具体的赛题链接如下:https://tianchi.aliyun.com/competition/entrance/531795/information 入门深度学习比赛,我想把参加比赛的全过程包括:赛题理解,数据处理(或者可 阅读全文
posted @ 2020-05-20 21:35 青衣素 阅读(1045) 评论(0) 推荐(0)
摘要: 在参加了推荐系统比赛之后,发现自己基础不是很稳固,打算把推荐系统基础知识好好强化一下,希望这个系列的文章写完之后,自己的水平能有一定的提高。 本文是《推荐系统实践》笔记系列的开始,想将自己的一些学习思考记录下来;自己也是该领域的初学者,可能会有一些观点的错误,希望大家能够指正出来。也希望和大家一起学 阅读全文
posted @ 2020-04-30 14:48 青衣素 阅读(261) 评论(0) 推荐(0)
摘要: 最近开始研究图像分割的相关技术,打算从综述文章入手,先了解整个领域的研究情况,再具体到各个算法的实现与原理上面去。文章主要以翻译以及个人对文章的理解为主,翻译成中文,便于后续查找相关的知识点。这篇综述总结了到2019年为止常见的图像分割的方法,可以说是一个相关资料的大汇总吧。 Abstract 机器 阅读全文
posted @ 2020-04-25 14:56 青衣素 阅读(4847) 评论(1) 推荐(3)
摘要: kaggle上关于时序数据预测的案例,链接:https://www.kaggle.com/c/competitive data science predict future sales 赛题描述:在本次比赛中,您将使用具有挑战性的时间序列数据集,其中包括每日销售数据,该数据集由俄罗斯最大的软件公司之 阅读全文
posted @ 2020-03-31 23:25 青衣素 阅读(979) 评论(4) 推荐(1)
摘要: 论文链接:https://arxiv.org/abs/1411.4038v2 对论文的详细翻译以及解读,在网上可以找到很多,作为初学者,我只是将我自己阅读的过程中所产生的问题记录下来,以便以后进行回顾 问题提出: 卷积层可实现任意大小的图像输入,而全连接层不能 答:全连接层与前一层之间的参数确定好的 阅读全文
posted @ 2020-03-27 20:43 青衣素 阅读(350) 评论(0) 推荐(0)
摘要: 前言:最近开始kaggle的一些竞赛,从一开始的懵懵懂懂,到后面的逐渐熟练,在kaggle上真的学到了很多,特此将自己的一些想法与思考记录下来,希望能和大家一起探讨学习,如果有不对的地方,希望大家可以指出来! 赛题描述:要求购房者描述他们梦dream以求的房子,他们可能不会从地下室天花板的高度或与东 阅读全文
posted @ 2020-03-10 21:36 青衣素 阅读(710) 评论(0) 推荐(0)