深度学习 - 随笔分类 - Eslzzyl

Lift-Splat-Shoot 复现

摘要：我理解的复现，就是把代码跑通，完整训练一遍，然后测试，争取达到论文里报告的效果。虽然大部分工作复现出来可能都到不了论文里的性能，比较玄学。概述 Lift-Splat-Shoot (LSS) 是 BEV 方法的开山之作，作者来自 NVIDIA。该方法是一个纯视觉的感知方法，用来做 BEV 分割任务的阅读全文

posted @ 2024-10-26 16:29 Eslzzyl 阅读(659) 评论(0) 推荐(0)

训练PaddleOCR文本方向分类模型

摘要：最近在做一个项目，涉及到扫描答题卡的方向判断。其中一种方法是训练一个文本方向分类模型来判断方向。此处记录一下训练的过程。环境准备在一处空闲空间足够大的地方克隆 PaddleOCR 仓库：https://github.com/PaddlePaddle/PaddleOCR PaddleOCR 仓库体阅读全文

posted @ 2024-08-27 08:08 Eslzzyl 阅读(1390) 评论(3) 推荐(0)

ArchLinux配置OpenCV C++环境

摘要：本文将简单介绍在 ArchLinux 中安装 OpenCV C++ 库并运行一个简单的 OpenCV 程序的过程。参考：https://github.com/donaldssh/Install-OpenCV 我的环境最新的 ArchLinux KDE Plasma 6 桌面环境 OpenCV 4 阅读全文

posted @ 2024-08-20 09:32 Eslzzyl 阅读(392) 评论(0) 推荐(0)

C# 中图像和 OnnxRuntime.Tensor 的互转

摘要：因毕设需要，尝试了将 PyTorch 模型转为 ONNX 然后用 C# 做推理，记录一下经验。总的来说，C# 对深度学习的支持远不如 Python，缺少很多必要的库，不少代码需要自己编写。思路毕设做的是 image-to-image 的 low-level 视觉任务，因此需要 3 个主要步骤：阅读全文

posted @ 2024-04-18 21:48 Eslzzyl 阅读(2007) 评论(1) 推荐(0)

einops 学习笔记：基础篇

摘要：参考： https://einops.rocks/1-einops-basics/ einops（Einstein Operations）提供了一种语法来便捷地操纵张量。einops 支持大多数张量库（当然包括 numpy 和 pytorch）。einops 针对所有张量库的语法都完全一致。eino 阅读全文

posted @ 2024-02-03 21:23 Eslzzyl 阅读(1970) 评论(0) 推荐(1)

深度学习图像复原之去雨：常用数据集介绍

摘要：可能有帮助的链接：https://paperswithcode.com/task/single-image-deraining 合成数据集真实数据集是直接在雨天拍摄照片，而合成数据集是在清晰图像上通过各种方式添加雨迹来获得带雨的图像。这些数据集大多采用单词+数字的模式命名，不同论文引用的名字各不阅读全文

posted @ 2024-01-08 18:14 Eslzzyl 阅读(11120) 评论(2) 推荐(1)

图像质量评价指标 PSNR 和 SSIM

摘要：PSNR 和 SSIM 是两种常见的图像质量评价指标，通常用于衡量两张图像的相似度。参考材料： https://zh.wikipedia.org/wiki/峰值信噪比 https://zhuanlan.zhihu.com/p/50757421 PSNR PSNR：峰值信噪比（Peak signal 阅读全文

posted @ 2023-12-17 11:36 Eslzzyl 阅读(3072) 评论(0) 推荐(0)

Doc3D数据集：介绍与使用

摘要：注意！ 2022年12月8日更新：目前Doc3D的FTP服务器已经停机，无法下载数据集，笔者目前也已经不再使用该数据集，手上的数据并不完整，因此请不要联系笔者索要数据集了。另：笔者在撰写本文时只是一名普通本科生，Doc3D是在做大创项目时了解到的，这篇文章写得并不专业，也缺失了很多关键内容，请见谅阅读全文

posted @ 2022-05-04 21:30 Eslzzyl 阅读(2155) 评论(9) 推荐(0)

Eslzzyl

随笔分类 - 深度学习