https://github.com/facebookresearch/vggt
Visual Geometry Grounded Transformer (VGGT, CVPR 2025) 是一种前馈神经网络,它能够在几秒钟内从场景的一个、几个或数百个视图中直接推断出场景的所有关键 3D 属性,包括相机的外部和内部参数、点图、深度图和 3D 点轨迹。


权重默认下载路径

具体的默认路径取决于你的操作系统,通常遵循以下规则:
-
Linux:
~/.cache/huggingface/hub/ -
Windows: `C:\Users<用户名>.cache\huggingface\hub`
-
macOS:
~/Library/Caches/huggingface/hub/

浙公网安备 33010602011771号