
AdaptiveOcc作为一种新颖的基于八叉树的多层输出网络,用于多摄像头 3D 语义占据预测任务。该方法能够根据空间中不同区域的特点,自适应地采用不同粒度的体素表示。AdaptiveOcc 的核心优势在于其智能结构输出能力:在浅层生成大块同质体素块,在深层传播更精细的体素结构,从而实现对关键区域的高精度感知。
此外,本文提出了距离自适应的真值构建规则,用于生成监督标签,使模型具备更强的适应性。考虑到环境感知中不同距离范围对体素粒度的需求不同,该构建规则能够在远距离区域采用更粗粒度,而在近距离区域采用更细粒度的体素表示。这一设计有效优化了计算资源的分配,进一步降低了推理延迟,提高了模型的整体效率。
代码:https://github.com/yty-sky/AdaptiveOcc