杨国峰

2019年11月6日

Fine-Grained Image (细粒度图像) – Papers, Codes and Datasets

摘要： Table of contents Introduction Survey papers Benchmark datasets Fine-grained image recognition Fine-grained recognition by localization-classification 阅读全文

posted @ 2019-11-06 12:59 杨国峰阅读(3833) 评论(0) 推荐(0)

2019年7月3日

Pytorch在colab和kaggle中使用TensorBoard/TensorboardX可视化

摘要：在colab和kaggle内核的Jupyter notebook中如何可视化深度学习模型的参数对于我们分析模型具有很大的意义，相比tensorflow, pytorch缺乏一些的可视化生态包，但是幸好pytorch1.1官方添加了tensorboard的库，可以直接从TORCH.UTILS.TENS 阅读全文

posted @ 2019-07-03 14:53 杨国峰阅读(1661) 评论(0) 推荐(0)

2019年7月1日

训练集，验证集，测试集比例

摘要：当数据量比较小时，可以使用 7 ：3 训练数据和测试数据，或者 6：2 : 2 训练数据，验证数据和测试数据。 (西瓜书中描述常见的做法是将大约 2/3 ~ 4/5 的样本数据用于训练，剩余样本用于测试）当数据量非常大时，可以使用 98 : 1 : 1 训练数据，验证数据和测试数据。传统机器学习阅读全文

posted @ 2019-07-01 11:23 杨国峰阅读(23816) 评论(0) 推荐(1)

2019年6月21日

学习速率过大 or 过小

摘要：阅读全文

posted @ 2019-06-21 22:37 杨国峰阅读(724) 评论(0) 推荐(0)

2019年5月15日

深度学习模型评估指标

摘要：一个深度学习模型在各类任务中的表现都需要定量的指标进行评估，才能够进行横向的对比比较，包含了分类、回归、质量评估、生成模型中常用的指标。 1 分类评测指标图像分类是计算机视觉中最基础的一个任务，也是几乎所有的基准模型进行比较的任务，从最开始比较简单的10分类的灰度图像手写数字识别mnist，到后来阅读全文

posted @ 2019-05-15 16:06 杨国峰阅读(9867) 评论(1) 推荐(2)

2019年4月30日

注意力机制（Attention Mechanism）应用——自然语言处理（NLP）

摘要：近年来，深度学习的研究越来越深入，在各个领域也都获得了不少突破性的进展。基于注意力（attention）机制的神经网络成为了最近神经网络研究的一个热点，下面是一些基于attention机制的神经网络在自然语言处理（NLP）领域的论文，现在来对attention在NLP中的应用进行一个总结，和大家一起阅读全文

posted @ 2019-04-30 16:43 杨国峰阅读(2386) 评论(1) 推荐(0)

自注意力机制（Self-attention Mechanism）——自然语言处理（NLP）

摘要：近年来，注意力（Attention）机制被广泛应用到基于深度学习的自然语言处理(NLP)各个任务中。随着注意力机制的深入研究，各式各样的attention被研究者们提出。在2017年6月google机器翻译团队在arXiv上放出的《Attention is all you need》论文受到了大家广阅读全文

posted @ 2019-04-30 16:39 杨国峰阅读(2420) 评论(0) 推荐(0)

2019年4月19日

语言模型预训练方法（ELMo、GPT和BERT）——自然语言处理（NLP）

摘要： 1. 引言在介绍论文之前，我将先简单介绍一些相关背景知识。首先是语言模型（Language Model），语言模型简单来说就是一串词序列的概率分布。具体来说，语言模型的作用是为一个长度为m的文本确定一个概率分布P，表示这段文本存在的可能性。在实践中，如果文本的长度较长，P(wi | w1, w2, 阅读全文

posted @ 2019-04-19 11:29 杨国峰阅读(1286) 评论(0) 推荐(0)

2019年4月4日

Focal Loss 的前向与后向公式推导

摘要：解决分类问题中类别不平衡、分类难度差异的一个 Loss。阅读全文

posted @ 2019-04-04 16:25 杨国峰阅读(923) 评论(0) 推荐(0)

2018年12月22日

Eigenface与PCA人脸识别算法实验

摘要：简单的特征脸识别实验实现特征脸的过程其实就是主成分分析（Principal Component Analysis，PCA）的一个过程。关于PCA的原理问题，它是一种数学降维的方法。是为了简化问题。在二维的坐标空间内，找到一个单位向量U，使得所有数据在U上的投影之和最大。这样就能把数据分的尽可能的开阅读全文

posted @ 2018-12-22 14:31 杨国峰阅读(2583) 评论(0) 推荐(0)

2018年12月20日

图示NP, P, NP-Complete和NP-Hard问题

摘要： P问题是一类可以通过确定性图灵机（以下简称图灵机）在多项式时间(Polynomial time)内解决的问题集合。 NP问题是一类可以通过非确定性图灵机( Non-deterministic Turing Machine)在多项式时间(Polynomial time)内解决的决策问题集合。 P问题是阅读全文

posted @ 2018-12-20 15:31 杨国峰阅读(898) 评论(0) 推荐(0)

Sequential Minimal Optimization（SMO，序列最小优化算法）初探

摘要：什么是SVM SVM是Support Vector Machine（支持向量机）的英文缩写，是上世纪九十年代兴起的一种机器学习算法，在目前神经网络大行其道的情况下依然保持着生命力。有人说现在是神经网络深度学习的时代了，AI从业者可以不用了解像SVM这样的古董了。姑且不说SVM是否真的已经没有前途了，阅读全文

posted @ 2018-12-20 13:05 杨国峰阅读(1289) 评论(1) 推荐(0)

2018年12月19日

分布问题（二元，多元变量分布，Beta，Dir）

摘要：这涉及到数学的概率问题。二元变量分布：伯努利分布，就是0-1分布(比如一次抛硬币，正面朝上概率) 那么一次抛硬币的概率分布如下：假设训练数据如下：那么根据最大似然估计（MLE）,我们要求u：求值推导过程如下：所以可以求出：以上的推导过程就是极大似然估计，我们可以看出u就是样本出现的频率阅读全文

posted @ 2018-12-19 23:00 杨国峰阅读(1054) 评论(0) 推荐(0)

防止过拟合：L1/L2正则化

摘要：正则化方法：防止过拟合，提高泛化能力在训练数据不够多时，或者overtraining时，常常会导致overfitting（过拟合）。其直观的表现如下图所示，随着训练过程的进行，模型复杂度增加，在training data上的error渐渐减小，但是在验证集上的error却反而渐渐增大——因为训练出阅读全文

posted @ 2018-12-19 20:25 杨国峰阅读(950) 评论(0) 推荐(0)

2018年12月18日

图像的上采样（upsampling）与下采样（subsampled）

摘要：缩小图像（或称为下采样（subsampled）或降采样（downsampled））的主要目的有两个：1、使得图像符合显示区域的大小；2、生成对应图像的缩略图。放大图像（或称为上采样（upsampling）或图像插值（interpolating））的主要目的是放大原图像，从而可以显示在更高分辨率的显阅读全文

posted @ 2018-12-18 17:08 杨国峰阅读(16297) 评论(0) 推荐(0)

Ph.D. student. Focus: crop optical imaging, high-throughput plant phenotyping analysis, drone low-altitude remote sensing. WeChat: tectal

公告