摘要: 数据读取 monodepth2的数据读取比较简单主要是首先声明了一个基础的MonoDataset类,这个类继承了Dataset,内部主要实现了python中Dataset需要实现数据读取的三个方法—init,getitem,len,用于读取图片数据。这图片读取完成后,还实现了图片处理,进行了尺寸和亮 阅读全文
posted @ 2022-09-11 09:29 black-world 阅读(437) 评论(0) 推荐(0)
摘要: 几何基元 对于2D的点,同城我们可以用一对数值来表示,$x=(x,y)$,或者以另一种形式: $$ x=\left[ \begin{matrix} x \ y \end{matrix} \right] $$ 但对于使用笛卡尔标系情况下,并不能表示无穷远的点,对于无穷远的点坐标为$(\infty,\i 阅读全文
posted @ 2022-09-04 11:24 black-world 阅读(218) 评论(0) 推荐(0)
摘要: 训练学习 monodepth2的训练过程由于存在多个训练模式和网络结构导致部分比较难以理解,这里我们结合网上的资料和自己对代码的理解进行简要地介绍,个人能力有限,对计算机视觉接触较少,如果有错误欢迎指正。 三种训练模式 monodepth2在readme中表示他们采用了三种训练方式,单目(Mono) 阅读全文
posted @ 2022-08-20 15:12 black-world 阅读(1156) 评论(0) 推荐(0)
摘要: 代码目录讲解 这里对个人对代码的理解进行讲解,个人由于设备不太行,没有去对模型进行复现,仅集合了网上内容对代码进行了解读,希望可以有帮助。 目录结构 asserts:这个主要是包含readme中需要使用的图片 datasets:这个文件内包含kitti_dataset.py和mono_dataset 阅读全文
posted @ 2022-08-20 11:01 black-world 阅读(978) 评论(0) 推荐(0)
摘要: KITTI数据集介绍 monodepth2采用KITTI数据集进行训练,KITTI数据集主要是针对自动驾驶领域的图形处理技术,主要应用在评测立体图像(stereo)、光流(optical flow)、3D物体检查等计算机视觉领域。KITTI数据集采用配备有两个灰度摄像头,两个彩色摄像头和一个Velo 阅读全文
posted @ 2022-08-20 10:00 black-world 阅读(1008) 评论(0) 推荐(1)
摘要: monodepth2介绍 monodepth2是在2019年CVPR会议上提出的一种三维重建算法,monodepth2是基于monodepth进行了改进,采用的是基于自监督的神经网络,提出了一下三点优化: 一个最小重投影误差,用来提升算法处理遮挡场景的鲁棒性 一种全分辨率多尺度采样方法,可以减少视觉 阅读全文
posted @ 2022-08-19 22:36 black-world 阅读(2471) 评论(0) 推荐(1)
摘要: 优化算法 本次主要对动量梯度下降算法,RMSprop算法,Adam优化算法的学习进行一个总结,主要对这几个算法的公式和原理进行介绍,对于代码部分可以参考: https://blog.csdn.net/u013733326/article/details/79907419 mini-batch梯度下井 阅读全文
posted @ 2022-08-11 10:53 black-world 阅读(60) 评论(0) 推荐(0)
摘要: 正则化 通常出现过拟合的情况下是我们的拟合的函数过于复杂,在没有没有足够数据的情况下进行了,函数对特殊小概率进行了错误的分类,比如下图中蓝色部分内的红色区域一样,函数分类过于细致。这种情况下对于w和b我们需要让w尽量减小,减小w对分类的影响,消除部分隐藏单元的影响,让神经网络更加简单,简化拟合函数。 阅读全文
posted @ 2022-08-10 11:20 black-world 阅读(104) 评论(0) 推荐(0)
摘要: 偏差 偏差出现通常是指训练的网络在训练集上准确率较低,模型欠拟合。但具体到不同模型如何判断是否欠拟合是需要和实际情况相结合。通常我们希望模型可以实现人类完成的任务,表现接近甚至优于人的表现,所以党模型准确率远远低于人的准确率时就是可以称为欠拟合,偏差较大。 $$ bias^2=(\bar{f}(x) 阅读全文
posted @ 2022-08-09 09:56 black-world 阅读(124) 评论(0) 推荐(0)
摘要: 神经网络的原理 对于一个神经网络我们可以分为输入层,隐藏层,输出层,对于神经网络的训练可以分为正向传播和反向传播。这里对神经网络不同层次的数据表示进行约定。这里我们以一个二层的神经网络模型进行演示。 在这里我们将A0定义为输入层数据,将A1定义为隐藏层数据,最后的A2定义为输出层数据。这A0时输入的 阅读全文
posted @ 2022-08-08 21:12 black-world 阅读(520) 评论(0) 推荐(0)