随笔分类 - 计算机视觉
摘要:多模态文本分类技术 1. 多模态表示学习(Representation) 1.1 联合表示(Joint Representation) 定义:将多个模态的信息一起映射到一个统一的多模态向量空间 论文:Multimodal learning with deep boltzmann machines,
阅读全文
摘要:CNN卷积类型有哪些? 1. 卷积类型 1.1 普通卷积:2D-Convolution 原始的conv操作可以看做一个2D版本的无隐层神经网络。 代表模型: LeNet:最早使用stack单卷积+单池化结构的方式,卷积层来做特征提取,池化来做空间下采样 AlexNet:后来发现单卷积提取到的特征不是
阅读全文
摘要:CNN卷积和通道? 1. CNN基本结构 全连接, 局部连接 权值共享 2. 卷积和通道的区别是什么 参考资料: https://www.cnblogs.com/shine-lee/p/10243114.html https://blog.yani.ai/filter-group-tutorial/
阅读全文
摘要:CNN模型 1. CNN模型发展 1.1 AlexNet 卷积核一定越大越好吗?-- 小卷积核 分组卷积首先在在AlexNet中出现,还用到一些非常大的卷积核,比如11×11、5×5卷积核,先前的观念是:卷积核越大,receptive field(感受野)越大,获取到的图片信息越多,因此获得的特征越
阅读全文
摘要:NLP三大特征抽取器(CNN/RNN/TF)比较 参考知乎张俊林:https://zhuanlan.zhihu.com/p/54743941 1. NLP任务 1.1 NLP任务特点 输入是一个线性序列 输入是不定长的 单词或句子的相对位置关系很重要,两个词位置互换可能导致完全不同的意思 句子中的长
阅读全文

浙公网安备 33010602011771号