• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
MKT-porter
博客园    首页    新随笔    联系   管理    订阅  订阅
上一页 1 2 3 4 5 6 ··· 81 下一页
2025年11月12日
基于参考图像的移动相机地理空间轨迹估计方法
摘要: 实际应用中的优化 在实际实现中,还会采用以下策略提高精度: 多组三元组并行计算,结果融合 RANSAC剔除异常匹配 序列帧间的运动平滑约束 基于参考图像的移动相机地理空间轨迹估计方法 摘要 本文提出了一种新颖的方法,用于估计移动相机的地理空间轨迹。该方法利用一组已知GPS位置的参考图像,通过几何约束 阅读全文
posted @ 2025-11-12 11:59 MKT-porter 阅读(9) 评论(0) 推荐(0)
图像地理定位研究进展
摘要: https://www.dqxxkx.cn/CN/10.12082/dqxxkx.2023.230073 Zhang和kosecka[15]首先提取图像的SIFT特征建立图像特征数据库,暴力全局检索数据库图像,利用随机采样一致性(RANdom SAmple Consensus, RANSAC)算法对 阅读全文
posted @ 2025-11-12 11:17 MKT-porter 阅读(21) 评论(0) 推荐(0)
2025年11月7日
pyslam(2) 全流程开发
摘要: main_slam.py它增加了沿多帧的特征跟踪、点三角测量、关键帧管理、光束法平差、回环检测、密集地图构建和深度推断等功能,以估计相机轨迹并构建稀疏地图和密集地图。这是一个完整的SLAM流程,包含了开发实际视觉SLAM流程所需的所有基础和高级模块。 1 配置参数 config.yaml 文件是配置 阅读全文
posted @ 2025-11-07 10:36 MKT-porter 阅读(14) 评论(0) 推荐(0)
pyslam(1) 环境配置
摘要: 官方论文 《pySLAM:一个开源、模块化且可扩展的SLAM框架》,作者: Luigi Freda “pySLAM 和 slamplay:用于快速原型设计和集成的模块化、可扩展的 SLAM 工具”, Luigi Freda , RSS 2025 工作坊:统一视觉 SLAM “语义 pySLAM:在同 阅读全文
posted @ 2025-11-07 04:56 MKT-porter 阅读(22) 评论(0) 推荐(0)
2025年11月6日
pyslam
摘要: 1 创建环境 pyslam REM 保存当前目录 set STARTING_DIR=%cd% set ROOT_DIR=.. cd %ROOT_DIR% REM 检查 conda conda --version if errorlevel 1 ( echo 错误:请先安装 conda pause e 阅读全文
posted @ 2025-11-06 04:35 MKT-porter 阅读(15) 评论(0) 推荐(0)
2025年11月3日
单目三角化原理
摘要: 为什么cv用归一化坐标 为什么V T 的最后一列就是解? 第一和第二帧产生地图点后,如果进来第三帧,如何定位第三帧,并将其建立的新地图点和现有地图点合并一个坐标系。考虑到第三帧和第二帧的相对位姿尺度未必与第一帧和第二帧一致。参考orb slam2解决 这是一个非常核心的细节!这个过程被称为 “地图点 阅读全文
posted @ 2025-11-03 18:48 MKT-porter 阅读(10) 评论(0) 推荐(0)
点特征
摘要: 核心差异与总结 维度与信息层次的不同: ORB和BSC是局部描述符: 它们只描述一个点周围的非常局部的信息(纹理或几何)。它们不知道这个点属于“椅子”还是“桌子”。 KPConv特征是点特征: 它是在整个点云的上下文中学习得到的。一个点的特征向量,其感受野可能覆盖了整个物体甚至场景的一部分,因此它既 阅读全文
posted @ 2025-11-03 02:47 MKT-porter 阅读(10) 评论(0) 推荐(0)
正弦化作用
摘要: 是谁最新想到这个正弦化处理,怎么想到的? 这是一个非常深刻的问题,触及了深度学习领域一个精彩的创新故事。这个想法的出现不是一蹴而就的,而是一个演进的过程。简单来说,最先将正弦函数用于编码连续信息(位置)并引爆整个领域的,是2017年Google的论文《Attention is All You Nee 阅读全文
posted @ 2025-11-03 02:14 MKT-porter 阅读(11) 评论(0) 推荐(0)
2025年10月29日
三元组
摘要: [62] B. Jiang, Y. Zhu, and M. Liu, “A triangle feature based map-tomap matching and loop closure for 2d graph slam,” in Proc. of the International Con 阅读全文
posted @ 2025-10-29 23:15 MKT-porter 阅读(17) 评论(0) 推荐(0)
3D场景图-3D场景图 匹配 SG-PGM: Partial Graph Matching Network with Semantic Geometric Fusion for 3D Scene Graph Alignment and Its Downstream Tasks
摘要: 非常好的追问!这两个问题直击SG-PGM方法的核心细节。我们来深入探讨一下。 一、 SG-PGM 与 SGAligner 的关系 这是一个关键问题,因为它们都是处理3D场景图对齐的重要工作。它们的关系是​​继承、发展、与侧重不同​​。 ​​SGAligner 是开创者:​​ SGAligner 是较 阅读全文
posted @ 2025-10-29 06:30 MKT-porter 阅读(35) 评论(0) 推荐(0)
使用空间关系匹配时候,由于视角遮挡和分割缺失导致检测不完整,从而影响了关系描述,如何解决?
摘要: 这是一个非常深刻且实际的问题!​​视角遮挡和分割缺失​​确实是基于空间关系匹配(无论是2D图像还是3D场景图)的最大挑战之一。不完整的关系描述会导致匹配歧义甚至匹配失败。解决这个问题的思路是多层次的,从​​关系表示的设计​​到​​匹配算法的鲁棒性​​,再到​​利用更高层次的上下文​​。 核心思路:从 阅读全文
posted @ 2025-10-29 06:09 MKT-porter 阅读(17) 评论(0) 推荐(0)
语义slam Kimera
摘要: 好的,我们来详细解析 ​​Kimera​​。这是一个在机器人领域非常有影响力的开源项目,它提供了一个完整、鲁棒且实时的​​空间感知​​系统。Kimera 的核心思想非常优雅:​​将 SLAM 的几何重建与语义理解紧密融合在一个统一的、轻量度的度量-语义(Metric-Semantic) 3D 地图中 阅读全文
posted @ 2025-10-29 06:06 MKT-porter 阅读(27) 评论(0) 推荐(0)
语言-地图slam ConceptGraphs: Open-vocabulary 3D scene graphs for perception and planning,
摘要: ConceptGraphs: Open-vocabulary 3D scene graphs for perception and planning, 好的,​​ConceptGraphs​​ 这篇论文与之前讨论的 HOV-SG 思想一脉相承,但它在具体实现方法和侧重点上有所不同,可以看作是在同一前 阅读全文
posted @ 2025-10-29 05:46 MKT-porter 阅读(19) 评论(0) 推荐(0)
语言-地图搜索slam HOV-SG archical open-vocabulary 3D scene graphs for language-grounded robot navigation
摘要: 好的,这篇论文(我们简称其为 ​​HOV-SG​​)提出的是一个非常前沿和雄心勃勃的概念,它旨在解决机器人导航中的一个核心挑战:​​如何让机器人根据泛化的、开放词汇的人类语言指令(如“去拿放在客厅圆桌上的马克杯”)在未知环境中进行导航,而不是仅仅依赖于预先标注好的有限物体类别。​​其核心思想是构建一 阅读全文
posted @ 2025-10-29 05:40 MKT-porter 阅读(19) 评论(0) 推荐(0)
语义slam Fusion++
摘要: 2. Fusion++的核心思想:范式转变 Fusion++彻底改变了游戏规则。它不再将世界看作一个统一的几何空间,而是将其看作由​​背景​​和​​多个独立的物体实例​​组成的集合。 思想一:实例级表示 —— 为每个物体建立独立的“数字孪生” 这是最核心的创新。Fusion++为场景中检测到的​​每 阅读全文
posted @ 2025-10-29 05:32 MKT-porter 阅读(10) 评论(0) 推荐(0)
特征提取器 PointNet++
摘要: 好的,我们来详细解析 ​​PointNet​​ 的输入和输出。PointNet 是一个开创性的深度学习模型,其核心思想是​​直接处理无序的3D点云集合​​。 一、 PointNet 的输入 PointNet 的输入非常直接和纯粹:​​一个 n×3的矩阵,代表一个点云。​​ n: 点云中点的​​数量​ 阅读全文
posted @ 2025-10-29 05:24 MKT-porter 阅读(44) 评论(0) 推荐(0)
点云配准 GeoTransformer
摘要: 阅读全文
posted @ 2025-10-29 05:20 MKT-porter 阅读(9) 评论(0) 推荐(0)
点云配准 Deep closest point: Learning representations for point cloud registration,
摘要: 阅读全文
posted @ 2025-10-29 05:14 MKT-porter 阅读(7) 评论(0) 推荐(0)
Fusion++ 语义实例分割​​与​​稠密SLAM重建​​在TSDF子图层面进行了深度融合
摘要: 3. Fusion++ 的完整工作流程 ​​步骤一:基于RGB-D帧的实例分割(每帧)​​ 输入每一帧RGB-D图像。 使用2D实例分割网络(如Mask R-CNN)处理RGB图像。 输出:一系列​​实例掩码(Instance Mask)​​,每个掩码对应一个检测到的物体,并带有语义标签(如“cha 阅读全文
posted @ 2025-10-29 02:54 MKT-porter 阅读(19) 评论(0) 推荐(0)
2025年10月28日
FM-Fusion于视觉语言基础模型的实例感知语义映射
摘要: https://arxiv.org/html/2402.04555v2 关注点 1 在单个图像帧中,由于遮挡,RAM 生成的标签可能会遗漏一些物体。这些缺失的标签进一步导致 GroundingDINO 无法正确检测物体。这是在单个图像上运行基础模型的固有局限性。为了解决这个问题,我们将相邻帧中检测到 阅读全文
posted @ 2025-10-28 20:29 MKT-porter 阅读(33) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 81 下一页
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3