随笔分类 -  深度学习 专栏

摘要:【GiantPandaCV导语】上学期快结束的时候参加了华为和CCF组织的零售商品识别的比赛,队伍名称为GiantPandaCV队,比赛大约持续了两个月,期间从开始摸索MindSpore框架,配置环境,上手ModelArts花费了不少功夫。现在比赛终于告一段落,本文进行一下复盘。 背景 CCF大数据 阅读全文
posted @ 2022-01-26 09:26 pprp 阅读(459) 评论(0) 推荐(0) 编辑
摘要:【GiantPandaCV导语】来自商汤和南洋理工的工作,也是使用卷积来增强模型提出low-level特征的能力,增强模型获取局部性的能力,核心贡献是LCA模块,可以用于捕获多层特征表示。 引言 针对先前Transformer架构需要大量额外数据或者额外的监督(Deit),才能获得与卷积神经网络结构 阅读全文
posted @ 2022-01-08 16:21 pprp 阅读(466) 评论(0) 推荐(0) 编辑
摘要:A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP 【GiantPandaCV导语】ViT的兴起挑战了CNN的地位,随之而来的是MLP系列方法。三种架构各有特点,为了公平地比较几种架构,本文提 阅读全文
posted @ 2021-12-24 10:23 pprp 阅读(1440) 评论(0) 推荐(0) 编辑
摘要:【GiantPandaCV引言】 知识回顾(KR)发现学生网络深层可以通过利用教师网络浅层特征进行学习,基于此提出了回顾机制,包括ABF和HCL两个模块,可以在很多分类任务上得到一致性的提升。 摘要 知识蒸馏通过将知识从教师网络传递到学生网络,但是之前的方法主要关注提出特征变换和实施相同层的特征。 阅读全文
posted @ 2021-11-21 16:53 pprp 阅读(296) 评论(0) 推荐(0) 编辑
摘要:【GiantPandaCV导读】learning rate对模型调优重要性不言而喻,想到超参数调优第一个可能想到的方法就是网格搜索Grid Search,但是这种方法需要大量的计算资源。之前使用fastai的时候发现其集成了一个功能叫lr_finder(), 可以快速找到合适的学习率,本文就主要分析 阅读全文
posted @ 2021-07-06 09:33 pprp 阅读(1064) 评论(0) 推荐(1) 编辑
摘要:ICLR 2021 Workshop 接收 Measuring Uncertainty through Bayesian Learning of Deep Neural Network Structure Zhijie Deng, Yucen Luo and Jun Zhu PDF AutoHAS: 阅读全文
posted @ 2021-06-22 09:40 pprp 阅读(486) 评论(0) 推荐(0) 编辑
摘要:Neural Architecture Search with Random Labels Landmark Regularization: Ranking Guided Super-Net Training in Neural Architecture Search AttentiveNAS: I 阅读全文
posted @ 2021-06-22 09:15 pprp 阅读(244) 评论(0) 推荐(0) 编辑
摘要:【前言】现在深度学习项目代码量越来越大,并且单个文件的量也非常的大。笔者总结了一些专家的经验并结合自己看的一些项目,打算总结一下如何探索和深入一个深度学习项目库。笔者pprp,未经允许不得擅自转发。 1. 基础知识 首先,需要保证有一定的深度学习基础知识,吴恩达的深度学习课还有斯坦福大学的CS231 阅读全文
posted @ 2021-05-27 21:48 pprp 阅读(1439) 评论(0) 推荐(0) 编辑
摘要:【GiantPandaCV】DARTS将离散的搜索空间松弛,从而可以用梯度的方式进行优化,从而求解神经网络搜索问题。本文首发于GiantPandaCV,未经允许,不得转载。 1. 简介 此论文之前的NAS大部分都是使用强化学习或者进化算法等在离散的搜索空间中找到最优的网络结构。而DARTS的出现,开 阅读全文
posted @ 2021-03-02 09:25 pprp 阅读(3242) 评论(0) 推荐(1) 编辑
摘要:【GiantPandaCV导语】Neural Network Intelligence 是一个工具包,可以有效帮助用户设计并调优汲取学习模型的神经网络架构,以及超参数。具有易于使用、可扩展、灵活、高效的特点。本文主要讲NNI基础的概念以及一个训练MNIST的入门教程。本文首发于GiantPandaC 阅读全文
posted @ 2021-03-01 18:13 pprp 阅读(1116) 评论(0) 推荐(0) 编辑
摘要:【GiantPandaCV导语】混合精度是一个非常简单并且实用的技术,由百度和谷歌联合发表于ICLR2018,可以让模型以半精度的方式训练模型,既能够降低显存占用,又可以保持精度。这篇文章不是最先提出使用更低精度来进行训练,但是其影响力比较深远,很多现在的方案都是基于这篇文章设计的。 1. 摘要 提 阅读全文
posted @ 2020-12-20 22:03 pprp 阅读(722) 评论(0) 推荐(0) 编辑
摘要:【GiantPandaCV导语】Pytorch Lightning是在Pytorch基础上进行封装的库,为了让用户能够脱离PyTorch一些繁琐的细节,专注于核心代码的构建,提供了许多实用工具,可以让实验更加高效。本文将介绍安装方法、设计逻辑、转化的例子等内容。 PyTorch Lightning中 阅读全文
posted @ 2020-12-08 10:45 pprp 阅读(6713) 评论(1) 推荐(1) 编辑
摘要:【GiantPandaCV导语】本科期间只是将线代学了,并且通过做题拿到了一个不错的分数,但是掌握并不牢靠。到了研究生阶段以后,模式识别、机器学习、应用数学等课程都需要大量运用线代进行推导或者证明,线代知识的匮乏让我很吃力,所以借祝老师在模式识别绪论课程上展示的需要的矩阵相关的数学基础,在此总结、快 阅读全文
posted @ 2020-11-16 15:01 pprp 阅读(484) 评论(0) 推荐(0) 编辑
摘要:【DataWhale打卡】第一天:学习周博磊讲的强化学习结合《深入理解AutoML和AutoDL》这本书中的强化学习的章节总结了基础部分。 参考资料:https://github.com/zhoubolei/introRL 先导课程:线性代数、概率论、机器学习/数据挖掘/深度学习/模式识别 编程基础 阅读全文
posted @ 2020-10-19 21:27 pprp 阅读(469) 评论(0) 推荐(0) 编辑
摘要:【GiantPandaCV导语】本文主要介绍最最最基础的tikz命令和一些绘制CNN时需要的基础的LaTeX知识,希望能在尽可能短的时间内学会并实现使用tikz这个LaTeX工具包来绘制卷积神经网络示意图。 之前看到tikz可以画出这种图,感觉特别专业,所以萌发出了解一下tikz的想法。 1. ov 阅读全文
posted @ 2020-09-16 13:01 pprp 阅读(3947) 评论(0) 推荐(0) 编辑
摘要:【GiantPandCV导语】本文将介绍BBuf、小武和笔者一起在过年期间完成的一个目标检测项目,将描述我们模型改进的思路、实验思路、结果汇总和经验性总结。声明:这篇文章经过了三人同意,并且所有创新点也将被公布。此外,由于经验上的不足,可能整个实验思路不够成熟,比不上CV大组的严谨性和完备性,如有问 阅读全文
posted @ 2020-09-10 09:47 pprp 阅读(4966) 评论(0) 推荐(1) 编辑
摘要:【GiantPandaCV导语】本文是笔者出于兴趣搞了一个小的库,主要是用于定位红外小目标。由于其具有尺度很小的特点,所以可以尝试用点的方式代表其位置。本文主要采用了回归和heatmap两种方式来回归关键点,是一个很简单基础的项目,代码量很小,可供新手学习。 1. 数据来源 数据集:数据来源自小武, 阅读全文
posted @ 2020-09-03 09:22 pprp 阅读(2271) 评论(0) 推荐(0) 编辑
摘要:《CenterNet原理与代码解析》是首发于GiantPandaCV公众号的电子书教程,由pprp总结并整理CenterNet相关解析,这本电子书是基于非官方的CenterNet实现,https://github.com/zzzxxxttt/pytorch_simple_CenterNet_45,这 阅读全文
posted @ 2020-09-02 15:36 pprp 阅读(3347) 评论(0) 推荐(0) 编辑