• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
MKT-porter
博客园    首页    新随笔    联系   管理    订阅  订阅
上一页 1 2 3 4 5 6 7 8 9 ··· 84 下一页
2025年10月29日
使用空间关系匹配时候,由于视角遮挡和分割缺失导致检测不完整,从而影响了关系描述,如何解决?
摘要: 这是一个非常深刻且实际的问题!​​视角遮挡和分割缺失​​确实是基于空间关系匹配(无论是2D图像还是3D场景图)的最大挑战之一。不完整的关系描述会导致匹配歧义甚至匹配失败。解决这个问题的思路是多层次的,从​​关系表示的设计​​到​​匹配算法的鲁棒性​​,再到​​利用更高层次的上下文​​。 核心思路:从 阅读全文
posted @ 2025-10-29 06:09 MKT-porter 阅读(26) 评论(0) 推荐(0)
语义slam Kimera
摘要: 好的,我们来详细解析 ​​Kimera​​。这是一个在机器人领域非常有影响力的开源项目,它提供了一个完整、鲁棒且实时的​​空间感知​​系统。Kimera 的核心思想非常优雅:​​将 SLAM 的几何重建与语义理解紧密融合在一个统一的、轻量度的度量-语义(Metric-Semantic) 3D 地图中 阅读全文
posted @ 2025-10-29 06:06 MKT-porter 阅读(51) 评论(0) 推荐(0)
语言-地图slam ConceptGraphs: Open-vocabulary 3D scene graphs for perception and planning,
摘要: ConceptGraphs: Open-vocabulary 3D scene graphs for perception and planning, 好的,​​ConceptGraphs​​ 这篇论文与之前讨论的 HOV-SG 思想一脉相承,但它在具体实现方法和侧重点上有所不同,可以看作是在同一前 阅读全文
posted @ 2025-10-29 05:46 MKT-porter 阅读(39) 评论(0) 推荐(0)
语言-地图搜索slam HOV-SG archical open-vocabulary 3D scene graphs for language-grounded robot navigation
摘要: 好的,这篇论文(我们简称其为 ​​HOV-SG​​)提出的是一个非常前沿和雄心勃勃的概念,它旨在解决机器人导航中的一个核心挑战:​​如何让机器人根据泛化的、开放词汇的人类语言指令(如“去拿放在客厅圆桌上的马克杯”)在未知环境中进行导航,而不是仅仅依赖于预先标注好的有限物体类别。​​其核心思想是构建一 阅读全文
posted @ 2025-10-29 05:40 MKT-porter 阅读(28) 评论(0) 推荐(0)
语义slam Fusion++
摘要: 2. Fusion++的核心思想:范式转变 Fusion++彻底改变了游戏规则。它不再将世界看作一个统一的几何空间,而是将其看作由​​背景​​和​​多个独立的物体实例​​组成的集合。 思想一:实例级表示 —— 为每个物体建立独立的“数字孪生” 这是最核心的创新。Fusion++为场景中检测到的​​每 阅读全文
posted @ 2025-10-29 05:32 MKT-porter 阅读(12) 评论(0) 推荐(0)
特征提取器 PointNet++
摘要: 好的,我们来详细解析 ​​PointNet​​ 的输入和输出。PointNet 是一个开创性的深度学习模型,其核心思想是​​直接处理无序的3D点云集合​​。 一、 PointNet 的输入 PointNet 的输入非常直接和纯粹:​​一个 n×3的矩阵,代表一个点云。​​ n: 点云中点的​​数量​ 阅读全文
posted @ 2025-10-29 05:24 MKT-porter 阅读(60) 评论(0) 推荐(0)
点云配准 GeoTransformer
摘要: 阅读全文
posted @ 2025-10-29 05:20 MKT-porter 阅读(11) 评论(0) 推荐(0)
点云配准 Deep closest point: Learning representations for point cloud registration,
摘要: 阅读全文
posted @ 2025-10-29 05:14 MKT-porter 阅读(8) 评论(0) 推荐(0)
Fusion++ 语义实例分割​​与​​稠密SLAM重建​​在TSDF子图层面进行了深度融合
摘要: 3. Fusion++ 的完整工作流程 ​​步骤一:基于RGB-D帧的实例分割(每帧)​​ 输入每一帧RGB-D图像。 使用2D实例分割网络(如Mask R-CNN)处理RGB图像。 输出:一系列​​实例掩码(Instance Mask)​​,每个掩码对应一个检测到的物体,并带有语义标签(如“cha 阅读全文
posted @ 2025-10-29 02:54 MKT-porter 阅读(27) 评论(0) 推荐(0)
2025年10月28日
FM-Fusion于视觉语言基础模型的实例感知语义映射
摘要: https://arxiv.org/html/2402.04555v2 关注点 1 在单个图像帧中,由于遮挡,RAM 生成的标签可能会遗漏一些物体。这些缺失的标签进一步导致 GroundingDINO 无法正确检测物体。这是在单个图像上运行基础模型的固有局限性。为了解决这个问题,我们将相邻帧中检测到 阅读全文
posted @ 2025-10-28 20:29 MKT-porter 阅读(48) 评论(0) 推荐(0)
RT-DETR 百度目标检测 cvpr2023
摘要: https://github.com/lyuwenyu/RT-DETR https://docs.ultralytics.com/zh/models/rtdetr/#pre-trained-models 阅读全文
posted @ 2025-10-28 17:34 MKT-porter 阅读(9) 评论(0) 推荐(0)
寻路算法 A*
摘要: https://www.bilibili.com/video/BV1bv411y79P/?vd_source=f88ed35500cb30c7be9bbe418a5998ca https://www.redblobgames.com/ 四叉树 四叉树 阅读全文
posted @ 2025-10-28 06:28 MKT-porter 阅读(6) 评论(0) 推荐(0)
NWPU数据对比
摘要: 阅读全文
posted @ 2025-10-28 05:08 MKT-porter 阅读(8) 评论(0) 推荐(0)
语言-目标检测 MM Grounding Dino Large (1) 实验对比 -GroundingDino针对航空图像检测的改进
摘要: 测试代码 import os import cv2 import torch import numpy as np import time from transformers import AutoModelForZeroShotObjectDetection, AutoProcessor from 阅读全文
posted @ 2025-10-28 05:01 MKT-porter 阅读(21) 评论(0) 推荐(0)
语言-目标检测 MM Grounding Dino Large (1) 环境配置 -GroundingDino针对航空图像检测的改进
摘要: https://blog.csdn.net/gitblog_00330/article/details/152013136 MM Grounding Dino Large在无人机航拍图像中的检测性能 https://link.gitcode.com/i/9da6757aed6c4f33f18c964 阅读全文
posted @ 2025-10-28 01:13 MKT-porter 阅读(92) 评论(0) 推荐(0)
GroundingDino目标跟踪+sam2分割
摘要: 说明 1 sam2的代码文件依赖是相对于sam2工程的,所以在sam2下面构建 2 需要训练空中数据集 3 不能直接全直接sam2分割,分割的会很混乱 安装 环境 rtx 3070 ubuntu20 cuda11.8 python3.10 1安装 GroundingDino 2安装sam2 3 以s 阅读全文
posted @ 2025-10-28 00:59 MKT-porter 阅读(106) 评论(0) 推荐(0)
2025年10月27日
SAM2 图像分割(3)鼠标选择多框 摄像头实时分割显示
摘要: import cv2 import torch import time import numpy as np import os import sys import sys sys.path.append('/home/r9000k/v2_project/v5_samyolo/2分割/sam2-ma 阅读全文
posted @ 2025-10-27 04:50 MKT-porter 阅读(48) 评论(0) 推荐(0)
Semantic-SSAM 是“一切多细都行,还能给标签”​​
摘要: Semantic-SSAM 是“一切多细都行,还能给标签”​​ https://github.com/UX-Decoder/Semantic-SAM 阅读全文
posted @ 2025-10-27 02:53 MKT-porter 阅读(6) 评论(0) 推荐(0)
​​O'Rourke 算法​​ 多边形的最小面积外接矩形
摘要: 阅读全文
posted @ 2025-10-27 01:04 MKT-porter 阅读(6) 评论(0) 推荐(0)
FM-Fusion 利用rgbd相机 ram-GroundingDINO-sam 重建语义地图
摘要: https://arxiv.org/pdf/2402.04555 阅读全文
posted @ 2025-10-27 00:22 MKT-porter 阅读(10) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 ··· 84 下一页
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3