上一页 1 ··· 338 339 340 341 342 343 344 345 346 ··· 400 下一页
摘要: Single Shot Multibox Detection (SSD)实战(上) 介绍了边界框、锚框、多尺度对象检测和数据集。现在,我们将利用这些背景知识构建一个目标检测模型:单次多盒检测(SSD)。这种快速简便的模式已经被广泛应用。该模型的一些设计思想和实现细节也适用于其他对象检测模型。 1. 阅读全文
posted @ 2020-06-30 14:07 吴建明wujianming 阅读(273) 评论(0) 推荐(0)
摘要: Anchor Boxes示例实战 目标检测算法通常对输入图像中的大量区域进行采样,判断这些区域是否包含感兴趣的目标,并调整这些区域的边缘,以便更准确地预测目标的真实边界框。不同的模型可能使用不同的区域采样方法。在这里,我们介绍一种这样的方法:它生成多个大小和纵横比不同的边框,同时以每个像素为中心。这 阅读全文
posted @ 2020-06-30 12:56 吴建明wujianming 阅读(381) 评论(0) 推荐(0)
摘要: 全卷积网络Fully Convolutional Networks (FCN)实战 使用图像中的每个像素进行类别预测的语义分割。全卷积网络(FCN)使用卷积神经网络将图像像素转换为像素类别。与之前介绍的卷积神经网络不同,FCN通过转置卷积层将中间层特征映射的高度和宽度转换回输入图像的大小,使得预测结 阅读全文
posted @ 2020-06-30 11:08 吴建明wujianming 阅读(1474) 评论(0) 推荐(0)
摘要: 目标检测数据集The Object Detection Dataset 在目标检测领域,没有像MNIST或Fashion MNIST这样的小数据集。为了快速测试模型,我们将组装一个小数据集。首先,我们使用一个开源的3D Pikachu模型生成1000张不同角度和大小的Pikachu图像。然后,我们收 阅读全文
posted @ 2020-06-30 10:29 吴建明wujianming 阅读(836) 评论(0) 推荐(0)
摘要: 多尺度目标检测 Multiscale Object Detection 我们在输入图像的每个像素上生成多个锚框。这些定位框用于对输入图像的不同区域进行采样。但是,如果锚定框是以图像的每个像素为中心生成的,很快就会有太多的锚框供我们计算。例如,我们假设输入图像的高度和宽度分别为561和728像素。如果 阅读全文
posted @ 2020-06-30 10:01 吴建明wujianming 阅读(1246) 评论(0) 推荐(0)
摘要: 转置卷积Transposed Convolution 我们为卷积神经网络引入的层,包括卷积层和池层,通常会减小输入的宽度和高度,或者保持不变。然而,语义分割和生成对抗网络等应用程序需要预测每个像素的值,因此需要增加输入宽度和高度。转置卷积,也称为分步卷积或反卷积,就是为了达到这一目的。 from m 阅读全文
posted @ 2020-06-30 09:25 吴建明wujianming 阅读(855) 评论(0) 推荐(0)
摘要: Fine-Tuning微调原理 如何在只有60000张图片的Fashion-MNIST训练数据集中训练模型。ImageNet,这是学术界使用最广泛的大型图像数据集,它拥有1000多万幅图像和1000多个类别的对象。然而,我们经常处理的数据集的大小通常比第一个大,但比第二个小。 假设我们想在图像中识别 阅读全文
posted @ 2020-06-30 09:06 吴建明wujianming 阅读(1423) 评论(0) 推荐(0)
摘要: 语义分割与数据集 Semantic Segmentation and the Dataset 在目标检测问题中,我们只使用矩形边界框来标记和预测图像中的对象。在这一节中,我们将对不同的语义区域进行语义分割。这些语义区域在像素级标记和预测对象。图1显示了一个语义分割的图像,区域标记为“dog”、“ca 阅读全文
posted @ 2020-06-29 19:49 吴建明wujianming 阅读(2673) 评论(0) 推荐(0)
摘要: 深度学习Anchor Boxes原理与实战技术 目标检测算法通常对输入图像中的大量区域进行采样,判断这些区域是否包含感兴趣的目标,并调整这些区域的边缘,以便更准确地预测目标的地面真实边界框。不同的模型可能使用不同的区域采样方法。在这里,我们介绍一种这样的方法:它生成多个大小和纵横比不同的边框,同时以 阅读全文
posted @ 2020-06-29 19:15 吴建明wujianming 阅读(957) 评论(0) 推荐(0)
摘要: CVPR2020:4D点云语义分割网络(SpSequenceNet) SpSequenceNet: Semantic Segmentation Network on 4D Point Clouds 论文地址: https://openaccess.thecvf.com/content_CVPR_20 阅读全文
posted @ 2020-06-29 18:02 吴建明wujianming 阅读(1757) 评论(0) 推荐(0)
上一页 1 ··· 338 339 340 341 342 343 344 345 346 ··· 400 下一页