NUC系列





====================================




======================================
jetson 系列








==============================


SEELE: A Unified Acceleration Framework for Real-Time Gaussian Splatting

https://arxiv.org/pdf/2503.05168



https://openaccess.thecvf.com/content/CVPR2025/papers/Feng_FlashGS_Efficient_3D_Gaussian_Splatting_for_Large-scale_and_High-resolution_Rendering_CVPR_2025_paper.pdf?utm_source=chatgpt.com

三维高斯点渲染(3DGS)技术的最新进展展现出超越传统渲染方法的巨大潜力,已引起工业界与学术界的广泛关注。然而,由于场景中存在大量各向异性的高斯表征,3DGS在大型高分辨率场景中的实时渲染仍存在挑战,这一领域尚未得到充分探索。为应对此挑战,我们推出开源CUDA库FlashGS(提供Python接口),其具备完整的算法设计与优化方案,包括冗余计算消除、自适应调度和高效流水线处理。
首先,我们通过精确的高斯求交测试,利用3DGS光栅化器的内在机制大幅消除了冗余计算。在任务划分阶段,我们提出了一种考虑高斯分布尺寸与形态差异的自适应调度策略。此外,我们为渲染过程中的色彩计算设计了多级流水线方案,进一步加速渲染进程。我们在多样化合成场景与真实世界三维场景(包含最大达2.7平方公里的城市场景和超过4K分辨率)中对FlashGS进行了全面评估。该方法将3DGS渲染性能提升了一个数量级,实现平均7.2倍的加速比,并以最低125.9帧/秒的速率进行渲染,创造了实时3DGS渲染的新标杆。
项目链接:GitHub - InternLandMark/FlashGS
我们对不同规模和分辨率的数据集进行了全面测试,结果汇总于表1。其中,Rubble [43] 和 MatrixCity [32] 作为大规模高分辨率数据集,已超出基于3DGS的现有系统的实时渲染能力范围。此外,我们还评估了常用的3DGS数据集:Truck和Train来自Tanks & Temple [24] 的室外场景;Playroom和DrJohnson则选自DeepBlending [17] 的两个室内场景。除表1中AdRGS-Full需要额外训练以平衡高斯分布 [45] 外,所有评估均使用相同预训练模型。受内存限制,我们未对MatrixCity和Rubble重新训练AdRGS-Full,而是直接使用预训练模型。
我们采用FPS衡量渲染速度,并通过PSNR、SSIM和LPIPS指标评估图像质量。为评估性能稳定性,我们同时记录了所有帧的平均FPS以及每个场景中最慢单帧的FPS。
所有实验均在NVIDIA RTX 3090 GPU(24GB显存)上进行。
FlashGS以实现为具备Python绑定的高性能CUDA库,包含底层优化(包括汇编级优化),更多技术细节详见补充材料。

https://www.themoonlight.io/zh/review/voyager-real-time-splatting-city-scale-3d-gaussians-on-your-phone

浙公网安备 33010602011771号