博客园 - MSTK
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=151866
2024-02-24T09:49:33Z
MSTK
https://www.cnblogs.com/mstk/
feed.cnblogs.com
https://www.cnblogs.com/mstk/p/18031261
Linux安装DevEco Device Tool - MSTK
1. 安装Python,默认已经安装; 2. 安装VSCode,默认已经安装,如果版本低,可以更新到最新版本; 3. 在https://device.harmonyos.com/cn/develop/ide#download下载DevEco Device Tool 4.0 Release,选择Lin
2024-02-24T09:50:00Z
2024-02-24T09:50:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】1. 安装Python,默认已经安装; 2. 安装VSCode,默认已经安装,如果版本低,可以更新到最新版本; 3. 在https://device.harmonyos.com/cn/develop/ide#download下载DevEco Device Tool 4.0 Release,选择Lin <a href="https://www.cnblogs.com/mstk/p/18031261" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17997558
Failed to initialize NVML: Driver/library version mismatch - MSTK
跑Cifar,发现训练时间很长,仔细一看,原来cudaGetDeviceCount()返回的是0,就是说没有找到GPU,没有用GPU跑,是在用CPU跑,难怪时间这么长. 在终端输入nvidia-smi,出现了以下错误: Failed to initialize NVML: Driver/librar
2024-01-30T09:24:00Z
2024-01-30T09:24:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】跑Cifar,发现训练时间很长,仔细一看,原来cudaGetDeviceCount()返回的是0,就是说没有找到GPU,没有用GPU跑,是在用CPU跑,难怪时间这么长. 在终端输入nvidia-smi,出现了以下错误: Failed to initialize NVML: Driver/librar <a href="https://www.cnblogs.com/mstk/p/17997558" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17937709
安装PyQt5 - MSTK
1. 在命令窗口中输入下面两个命令: pip install pyqt5 pip install pyqt5-tools 2. 打开PyCharm的File->Settings->Tools->External Tools,单击Add,在弹出的窗口中输入: Name: QtDisigner Prog
2023-12-31T08:47:00Z
2023-12-31T08:47:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】1. 在命令窗口中输入下面两个命令: pip install pyqt5 pip install pyqt5-tools 2. 打开PyCharm的File->Settings->Tools->External Tools,单击Add,在弹出的窗口中输入: Name: QtDisigner Prog <a href="https://www.cnblogs.com/mstk/p/17937709" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17857442.html
Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection (5) - MSTK
Qualitative Results如下图所示:
2023-11-26T08:30:00Z
2023-11-26T08:30:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】Qualitative Results如下图所示: <a href="https://www.cnblogs.com/mstk/p/17857442.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17799148.html
Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection (4) - MSTK
实验结果如下图所示:
2023-10-30T15:03:00Z
2023-10-30T15:03:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】实验结果如下图所示: <a href="https://www.cnblogs.com/mstk/p/17799148.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17737548.html
Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection (3) - MSTK
损失函数分为3种类型: (1) 对于热力图,用以下的Focal Loss计算: (2) 对于深度,采用Laplacian aleatoric uncertainty loss function for depth计算: (3) 对于尺寸采用L1 Loss计算:
2023-09-29T15:55:00Z
2023-09-29T15:55:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】损失函数分为3种类型: (1) 对于热力图,用以下的Focal Loss计算: (2) 对于深度,采用Laplacian aleatoric uncertainty loss function for depth计算: (3) 对于尺寸采用L1 Loss计算: <a href="https://www.cnblogs.com/mstk/p/17737548.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17665905.html
Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection (2) - MSTK
Feature backbone采用DLA,输入维度为3×H×W的RGB图,得到维度D×h×w的特征图F,然后将特征图送入几个轻量级regression heads,2D bouding boxes的中心特征图用下面的模块得到: 其中AN是Attentive Normalization.用公式表示:
2023-08-29T13:30:00Z
2023-08-29T13:30:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】Feature backbone采用DLA,输入维度为3×H×W的RGB图,得到维度D×h×w的特征图F,然后将特征图送入几个轻量级regression heads,2D bouding boxes的中心特征图用下面的模块得到: 其中AN是Attentive Normalization.用公式表示: <a href="https://www.cnblogs.com/mstk/p/17665905.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17585669.html
Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection (1) - MSTK
MonoCon的网络结构和MonoDLE几乎一样,只是添加了辅助学习(Auxiliary Learning, AL)模块. 网络结构如上图所示,对于3D目标检测来说,预测2D框是没有必要的,但是MonoCon在训练阶段仍然计算了2D框的损失函数,但是在推理的时候,并不会预测2D框,这就是所谓的辅助学
2023-07-27T09:43:00Z
2023-07-27T09:43:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】MonoCon的网络结构和MonoDLE几乎一样,只是添加了辅助学习(Auxiliary Learning, AL)模块. 网络结构如上图所示,对于3D目标检测来说,预测2D框是没有必要的,但是MonoCon在训练阶段仍然计算了2D框的损失函数,但是在推理的时候,并不会预测2D框,这就是所谓的辅助学 <a href="https://www.cnblogs.com/mstk/p/17585669.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17497993.html
Probabilistic and Geometric Depth: Detecting Objects in Perspective - MSTK
作者认为单目3D目标检测可以简化为深度估计问题,深度估计不准确限制了检测的性能.已有的算法直接使用孤立实例或者像素估计深度,没有考虑目标之间的集合关系,因此提出了构建预测的目标之间的几何关系图,来促进深度预测. 将深度值划分成若干个区间,然后通过分布的期望来计算深度值,在精度和速度上都取得了不错的性
2023-06-22T09:32:00Z
2023-06-22T09:32:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】作者认为单目3D目标检测可以简化为深度估计问题,深度估计不准确限制了检测的性能.已有的算法直接使用孤立实例或者像素估计深度,没有考虑目标之间的集合关系,因此提出了构建预测的目标之间的几何关系图,来促进深度预测. 将深度值划分成若干个区间,然后通过分布的期望来计算深度值,在精度和速度上都取得了不错的性 <a href="https://www.cnblogs.com/mstk/p/17497993.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17391282.html
创建Git仓库并使用PyCharm提交 - MSTK
进入git目录,输入以下命令: sudo git init --bare 仓库名.git sudo chown -R 用户名:用户名 仓库名.git 仓库的URL地址为: 用户名@IP:git目录/仓库名.git 在PyCharm中右键单击项目文件夹,选择Git->Manage Remotes,添加
2023-05-11T07:50:00Z
2023-05-11T07:50:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】进入git目录,输入以下命令: sudo git init --bare 仓库名.git sudo chown -R 用户名:用户名 仓库名.git 仓库的URL地址为: 用户名@IP:git目录/仓库名.git 在PyCharm中右键单击项目文件夹,选择Git->Manage Remotes,添加 <a href="https://www.cnblogs.com/mstk/p/17391282.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17370803.html
E:无法定位软件包yum - MSTK
运行: sudo apt update 提示: E: 有几个软件包无法下载,要不运行 apt-get update 或者加上 --fix-missing 的选项再试试? 于是运行: apt-get update --fix-missing 运行: sudo apt-get install build
2023-05-04T04:16:00Z
2023-05-04T04:16:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】运行: sudo apt update 提示: E: 有几个软件包无法下载,要不运行 apt-get update 或者加上 --fix-missing 的选项再试试? 于是运行: apt-get update --fix-missing 运行: sudo apt-get install build <a href="https://www.cnblogs.com/mstk/p/17370803.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17364724.html
An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale - MSTK
模型如下图所示: 将H×W×C的图像reshape成了N×(P2×C),其中(H,W)是图像的原始分辨率,C是通道数,(P,P)是每个图像块的分辨率,N=H×W/P2为图像块的数量,将一个图像块使用可学习的线性层映射到维度为D的隐藏向量,如式(1)所示,线性映射的输出称为patch embeddin
2023-04-29T15:46:00Z
2023-04-29T15:46:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】模型如下图所示: 将H×W×C的图像reshape成了N×(P2×C),其中(H,W)是图像的原始分辨率,C是通道数,(P,P)是每个图像块的分辨率,N=H×W/P2为图像块的数量,将一个图像块使用可学习的线性层映射到维度为D的隐藏向量,如式(1)所示,线性映射的输出称为patch embeddin <a href="https://www.cnblogs.com/mstk/p/17364724.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17274439.html
MMDetection3D的学习率设置 - MSTK
MMDetection的学习率设置文件放在目录mmdetection3d\configs\_base_\schedules\下面,如下图所示. 各文件的含义如下: consine.py: SGDR policy, 40epochs; cyclic_20e.py: CLR policy, 20 epo
2023-03-30T13:39:00Z
2023-03-30T13:39:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】MMDetection的学习率设置文件放在目录mmdetection3d\configs\_base_\schedules\下面,如下图所示. 各文件的含义如下: consine.py: SGDR policy, 40epochs; cyclic_20e.py: CLR policy, 20 epo <a href="https://www.cnblogs.com/mstk/p/17274439.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17138048.html
SGDR: Stochastic Gradient Descent with Warm Restarts - MSTK
SGDR和CLR比较类似,都是给学习率设置周期和变化范围,按照下面的公式让学习率周期性的变化: 总的来说,就是在一个周期开始时,将学习率设置为最大值,然后按照余弦函数减小到最小值,再开始下一个周期的循环.尝试了各种超参数的设置.
2023-02-20T08:52:00Z
2023-02-20T08:52:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】SGDR和CLR比较类似,都是给学习率设置周期和变化范围,按照下面的公式让学习率周期性的变化: 总的来说,就是在一个周期开始时,将学习率设置为最大值,然后按照余弦函数减小到最小值,再开始下一个周期的循环.尝试了各种超参数的设置. <a href="https://www.cnblogs.com/mstk/p/17138048.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/17069220.html
Cyclical Learning Rates - MSTK
学习率的设置是深度学习中一个比较重要的问题,Cyclical Learning Rates(CLR)提出了一种新的方法,即让学习率周期性的变化,而不是像之前的方法那样让学习率单调递减变化. Cyclical learning rates其实比较简单,只需要3个参数: (1)base_lr:学习率的最
2023-01-27T11:30:00Z
2023-01-27T11:30:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】学习率的设置是深度学习中一个比较重要的问题,Cyclical Learning Rates(CLR)提出了一种新的方法,即让学习率周期性的变化,而不是像之前的方法那样让学习率单调递减变化. Cyclical learning rates其实比较简单,只需要3个参数: (1)base_lr:学习率的最 <a href="https://www.cnblogs.com/mstk/p/17069220.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/16989542.html
Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics - MSTK
很多深度学习都是多任务学习(Multi-Task Learning, MTL),需要对多个Loss同时优化,模型的性能受各Loss的权重的影响,手工选择权重成本太高,是不可能的,于是提出了基于Uncertainty的自动学习权重的方式. 下图是一个典型的多任务学习场景,需要同时满足语义分割,实例分割
2022-12-17T13:04:00Z
2022-12-17T13:04:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】很多深度学习都是多任务学习(Multi-Task Learning, MTL),需要对多个Loss同时优化,模型的性能受各Loss的权重的影响,手工选择权重成本太高,是不可能的,于是提出了基于Uncertainty的自动学习权重的方式. 下图是一个典型的多任务学习场景,需要同时满足语义分割,实例分割 <a href="https://www.cnblogs.com/mstk/p/16989542.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/16880378.html
ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection - MSTK
ImVoxelNet这是一种基于单目或多视图 RGB 图像的 3D 对象检测的新型全卷积方法,根据RGB图进行3D检测. 这种方法其实比较简单,先在多张2D RGB图上进行卷积操作(共享2D卷积核),然后将特征映射到3D体素上,同一个体素有多个特征的进行简单的平均池化操作,然后用3D卷积核进行卷积操
2022-11-13T06:40:00Z
2022-11-13T06:40:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】ImVoxelNet这是一种基于单目或多视图 RGB 图像的 3D 对象检测的新型全卷积方法,根据RGB图进行3D检测. 这种方法其实比较简单,先在多张2D RGB图上进行卷积操作(共享2D卷积核),然后将特征映射到3D体素上,同一个体素有多个特征的进行简单的平均池化操作,然后用3D卷积核进行卷积操 <a href="https://www.cnblogs.com/mstk/p/16880378.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/16824361.html
From Points to Parts: 3D Object Detection from Point Cloud with Part-aware and Part-aggregation Network - MSTK
Part-A2是一个两阶段,基于点的3D目标检测器,由part-aware和part-aggregation模块组成.类似于两阶段的2D检测器,第一阶段提出Proposals,第二阶段进行Refine. 1. Part-aware模块 负责生成3D Proposals.先将3D空间体素化,每个体素大
2022-10-30T09:12:00Z
2022-10-30T09:12:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】Part-A2是一个两阶段,基于点的3D目标检测器,由part-aware和part-aggregation模块组成.类似于两阶段的2D检测器,第一阶段提出Proposals,第二阶段进行Refine. 1. Part-aware模块 负责生成3D Proposals.先将3D空间体素化,每个体素大 <a href="https://www.cnblogs.com/mstk/p/16824361.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/16743053.html
FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection - MSTK
FCOS3D是在2D检测器FCOS的基础上提出的,是一种单目3D检测算法,根据RGB图像进行3D目标检测.FCOS预测的是一个前景点到边界框的4个距离,而FCOS3D需要预测更多的东西,包括3D中心点,3D尺寸,以及目标的方向. 整体结构上,FCOS3D和FCOS非常类似,Backbone和Neck
2022-09-29T12:56:00Z
2022-09-29T12:56:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】FCOS3D是在2D检测器FCOS的基础上提出的,是一种单目3D检测算法,根据RGB图像进行3D目标检测.FCOS预测的是一个前景点到边界框的4个距离,而FCOS3D需要预测更多的东西,包括3D中心点,3D尺寸,以及目标的方向. 整体结构上,FCOS3D和FCOS非常类似,Backbone和Neck <a href="https://www.cnblogs.com/mstk/p/16743053.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/mstk/p/16585508.html
安装MMdetection3D和MinkowskiEngine - MSTK
MMdetection3D更新了,只好再次安装,由于CUDA,cuDNN,PyTorch以前已经安装了,这次就不需要安装了,只需要安装MMdetection3D就行了. 1. 安装MMCV 输入以下命令: pip install mmcv-full -f https://download.openm
2022-08-14T07:27:00Z
2022-08-14T07:27:00Z
MSTK
https://www.cnblogs.com/mstk/
【摘要】MMdetection3D更新了,只好再次安装,由于CUDA,cuDNN,PyTorch以前已经安装了,这次就不需要安装了,只需要安装MMdetection3D就行了. 1. 安装MMCV 输入以下命令: pip install mmcv-full -f https://download.openm <a href="https://www.cnblogs.com/mstk/p/16585508.html" target="_blank">阅读全文</a>