Tachibana Kanade

XJTLU undergraduate student!

图片

BFANet: Revisiting 3D Semantic Segmentation with Boundary Feature Analysis

论文背景


论文核心思想


方法结构

(1) 边界-语义模块 (Boundary-Semantic Block)

(2) 实时边界伪标签计算 (PBPLC)

(3) 四种精精指标评价


结果


四种分割错误类型

这些错误都有对应的对系评价方法,以分别展示系统的薄弱点。

BFANet网络结构



BFANet (OctFormer版) 模型结构总览

模块 层次 参数 说明
输入层 Octree结构数据 - 输入的是Octree格式点云
Stem模块 卷积 x2 stride=2 初步特征提取与降采样
Patch Embedding Patch大小=32 - 将Octree分成小块,做特征提取
Stage 1 2层 Transformer Block channel=96, head=6 局部特征编码
Stage 2 2层 Transformer Block channel=192, head=12 中尺度特征提取
Stage 3 18层 Transformer Block channel=384, head=24 全局特征建模(主干部分)
Stage 4 2层 Transformer Block channel=384, head=24 辅助增强特征
FPN模块 上采样融合 输出fpn_channel=168 融合多尺度特征
BFANet SegHeader 两分支MLP - 语义预测 + 边界预测
输出层 4个输出 sem_score_pred, mar_score_pred, sem_score_v2, mar_score_v2 最终预测结果



BFANet_mink (Minkowski UNet版) 模型结构总览

模块 层次 参数 说明
输入层 稀疏体素Tensor - 输入的是稀疏体素化后的点云
编码器 (Encoder) 稀疏卷积块 每次stride=2 特征提取+降采样
编码器Stage1-4 Conv → BN → PReLU 特征数逐层增加 多层稀疏卷积提取局部到全局特征
解码器 (Decoder) 反卷积块 - 恢复分辨率,并融合skip连接
语义分支 (Semantic Head) Linear → BN → PReLU → Linear 输出类别数 点级别语义分类预测
边界分支 (Margin Head) Linear → BN → PReLU → Linear → Sigmoid 输出1维(边界分数) 点是否位于边界
输出层 4个输出 sem_score_pred, mar_score_pred, sem_score_v2, mar_score_v2 最终预测结果