计算机视觉 - 随笔分类 - MissHsu

多模态文本分类技术

摘要：多模态文本分类技术 1. 多模态表示学习（Representation） 1.1 联合表示（Joint Representation）定义：将多个模态的信息一起映射到一个统一的多模态向量空间论文：Multimodal learning with deep boltzmann machines, 阅读全文

posted @ 2021-04-22 19:32 MissHsu 阅读(5112) 评论(0) 推荐(0)

CNN卷积类型有哪些？

摘要：CNN卷积类型有哪些？ 1. 卷积类型 1.1 普通卷积：2D-Convolution 原始的conv操作可以看做一个2D版本的无隐层神经网络。代表模型： LeNet：最早使用stack单卷积+单池化结构的方式，卷积层来做特征提取，池化来做空间下采样 AlexNet：后来发现单卷积提取到的特征不是阅读全文

posted @ 2021-04-22 19:15 MissHsu 阅读(2389) 评论(0) 推荐(1)

CNN卷积和通道

摘要：CNN卷积和通道？ 1. CNN基本结构全连接，局部连接权值共享 2. 卷积和通道的区别是什么参考资料： https://www.cnblogs.com/shine-lee/p/10243114.html https://blog.yani.ai/filter-group-tutorial/ 阅读全文

posted @ 2021-04-22 19:06 MissHsu 阅读(836) 评论(0) 推荐(0)

CNN模型

摘要：CNN模型 1. CNN模型发展 1.1 AlexNet 卷积核一定越大越好吗？-- 小卷积核分组卷积首先在在AlexNet中出现，还用到一些非常大的卷积核，比如11×11、5×5卷积核，先前的观念是：卷积核越大，receptive field（感受野）越大，获取到的图片信息越多，因此获得的特征越阅读全文

posted @ 2021-04-22 18:58 MissHsu 阅读(1758) 评论(0) 推荐(0)

NLP三大特征抽取器（CNN/RNN/TF）比较

摘要：NLP三大特征抽取器（CNN/RNN/TF）比较参考知乎张俊林：https://zhuanlan.zhihu.com/p/54743941 1. NLP任务 1.1 NLP任务特点输入是一个线性序列输入是不定长的单词或句子的相对位置关系很重要，两个词位置互换可能导致完全不同的意思句子中的长阅读全文

posted @ 2021-04-19 09:47 MissHsu 阅读(1330) 评论(0) 推荐(0)

SOULXU

随笔分类 - 计算机视觉

公告