HRNet网络结构详解：从Bottleneck到HighResolutionModule，手把手教你读懂源码

张

张建站

2026/5/2 5:17:24

10分钟阅读

HRNet网络结构详解从Bottleneck到HighResolutionModule手把手教你读懂源码HRNet作为近年来计算机视觉领域的重要突破以其独特的多分辨率并行架构在姿态估计、语义分割等任务中展现出卓越性能。不同于传统网络逐步下采样的金字塔结构HRNet通过维持高分辨率表征的同时融合多尺度特征实现了更精细的空间信息保留。本文将带您深入HRNet的三大核心模块——Bottleneck、BasicBlock和HighResolutionModule通过源码级解析揭示其设计哲学。1. 基础构建单元Bottleneck与BasicBlock1.1 Bottleneck模块解析Bottleneck作为深度残差网络的核心组件通过1×1卷积实现通道维度的先降维再升维显著减少了3×3卷积的计算量。其典型结构包含三个卷积层class Bottleneck(nn.Module): expansion 4 def __init__(self, inplanes, planes, stride1, downsampleNone): super(Bottleneck, self).__init__() self.conv1 nn.Conv2d(inplanes, planes, kernel_size1, biasFalse) self.bn1 nn.BatchNorm2d(planes) self.conv2 nn.Conv2d(planes, planes, kernel_size3, stridestride, padding1, biasFalse) self.bn2 nn.BatchNorm2d(planes) self.conv3 nn.Conv2d(planes, planes * self.expansion, kernel_size1, biasFalse) self.bn3 nn.BatchNorm2d(planes * self.expansion) self.relu nn.ReLU(inplaceTrue) self.downsample downsample self.stride stride关键设计特点通道扩展机制通过expansion4参数最终输出通道数是中间层的4倍残差连接当输入输出维度不匹配时通过downsample进行维度调整计算效率中间3×3卷积在降维后的空间进行FLOPs降低约50%提示在调试时可重点关注conv2的stride参数变化这会影响特征图的空间分辨率1.2 BasicBlock的轻量级设计BasicBlock是Bottleneck的轻量版适用于计算资源受限的场景class BasicBlock(nn.Module): expansion 1 def __init__(self, inplanes, planes, stride1, downsampleNone): super(BasicBlock, self).__init__() self.conv1 conv3x3(inplanes, planes, stride) self.bn1 nn.BatchNorm2d(planes) self.relu nn.ReLU(inplaceTrue) self.conv2 conv3x3(planes, planes) self.bn2 nn.BatchNorm2d(planes) self.downsample downsample self.stride stride与Bottleneck的主要差异仅使用两个3×3卷积无通道维度变化计算量更小但特征提取能力相对较弱常用于网络浅层或移动端部署场景2. 多分辨率融合引擎HighResolutionModule2.1 模块架构设计原理HighResolutionModule是HRNet的核心创新其通过并行多分支结构维持不同分辨率特征class HighResolutionModule(nn.Module): def __init__(self, num_branches, blocks, num_blocks, num_inchannels, num_channels, fuse_method, multi_scale_outputTrue): super(HighResolutionModule, self).__init__() self._check_branches(num_branches, blocks, num_blocks, num_inchannels, num_channels) self.num_inchannels num_inchannels self.fuse_method fuse_method self.num_branches num_branches self.multi_scale_output multi_scale_output self.branches self._make_branches(num_branches, blocks, num_blocks, num_channels) self.fuse_layers self._make_fuse_layers() self.relu nn.ReLU(True)关键参数说明num_branches并行分支数量通常2-4个blocks每个分支使用的块类型BasicBlock/Bottleneckfuse_method多分辨率特征融合方式SUM/AVG/CONCAT2.2 分支构建与特征融合分支构建通过_make_branches方法实现def _make_branches(self, num_branches, block, num_blocks, num_channels): branches [] for i in range(num_branches): branches.append( self._make_one_branch(i, block, num_blocks, num_channels)) return nn.ModuleList(branches)特征融合层实现多分辨率交互def _make_fuse_layers(self): if self.num_branches 1: return None fuse_layers [] for i in range(num_branches if self.multi_scale_output else 1): fuse_layer [] for j in range(num_branches): if j i: # 上采样路径 fuse_layer.append(nn.Sequential( nn.Conv2d(num_inchannels[j], num_inchannels[i], 1, 1, 0, biasFalse), nn.BatchNorm2d(num_inchannels[i]), nn.Upsample(scale_factor2**(j-i), modenearest))) elif j i: # 同一分辨率 fuse_layer.append(None) else: # 下采样路径 conv3x3s [] for k in range(i-j): conv3x3s.append(nn.Sequential( nn.Conv2d(num_inchannels[j], num_outchannels_conv3x3, 3, 2, 1, biasFalse), nn.BatchNorm2d(num_outchannels_conv3x3), nn.ReLU(True))) fuse_layer.append(nn.Sequential(*conv3x3s)) fuse_layers.append(nn.ModuleList(fuse_layer)) return nn.ModuleList(fuse_layers)融合策略对比操作类型实现方式适用场景上采样1×1卷积最近邻插值低分辨率→高分辨率恒等连接None同分辨率分支下采样3×3卷积步长2高分辨率→低分辨率3. 网络构建关键nn.ModuleList的灵活运用3.1 动态分支管理HRNet使用nn.ModuleList实现动态分支构建self.branches nn.ModuleList([ self._make_one_branch(i, block, num_blocks, num_channels) for i in range(num_branches) ])优势体现支持可变数量的并行分支允许各分支独立配置网络结构便于扩展新的分辨率分支3.2 多阶段特征过渡Transition模块实现阶段间分辨率变化def _make_transition_layer(self, num_channels_pre_layer, num_channels_cur_layer): transition_layers [] for i in range(len(num_channels_cur_layer)): if i len(num_channels_pre_layer): transition_layers.append(nn.Sequential( nn.Conv2d(num_channels_pre_layer[i], num_channels_cur_layer[i], 3, 1, 1, biasFalse), nn.BatchNorm2d(num_channels_cur_layer[i]), nn.ReLU(inplaceTrue))) else: conv3x3s [] for j in range(i1-len(num_channels_pre_layer)): inchannels num_channels_pre_layer[-1] outchannels num_channels_cur_layer[i] if j i-len(num_channels_pre_layer) else inchannels conv3x3s.append(nn.Sequential( nn.Conv2d(inchannels, outchannels, 3, 2, 1, biasFalse), nn.BatchNorm2d(outchannels), nn.ReLU(inplaceTrue))) transition_layers.append(nn.Sequential(*conv3x3s)) return nn.ModuleList(transition_layers)4. 实战调试技巧与可视化分析4.1 特征流可视化方法使用PyTorch钩子捕获中间特征def register_hooks(model): features {} def get_feature(name): def hook(model, input, output): features[name] output.detach() return hook model.conv1.register_forward_hook(get_feature(conv1)) model.layer1.register_forward_hook(get_feature(layer1)) return features4.2 典型调试场景常见问题排查指南维度不匹配错误检查各分支的num_inchannels配置验证transition层的stride设置梯度消失/爆炸监控各BN层的running_mean/var检查残差连接的加法操作性能瓶颈分析使用torch.profiler定位计算热点评估各分支的FLOPs占比with torch.profiler.profile( activities[torch.profiler.ProfilerActivity.CPU], scheduletorch.profiler.schedule(wait1, warmup1, active3), ) as prof: for _ in range(5): model(inputs) prof.step() print(prof.key_averages().table(sort_bycpu_time_total))

如何快速完成GTNH整合包中文汉化：新手友好的终极安装指南

如何快速完成GTNH整合包中文汉化：新手友好的终极安装指南【免费下载链接】Translation-of-GTNH GTNH整合包的汉化项目地址: https://gitcode.com/gh_mirrors/tr/Translation-of-GTNH GTNH汉化项目是专为GregTech: New Horizons（格雷科技新视野&…...

2026/5/2 5:12:26 阅读更多 →

CarSim仿真效率翻倍秘籍：巧用Library和Category管理你的海量测试用例

CarSim仿真效率翻倍秘籍：巧用Library和Category管理你的海量测试用例当你的CarSim项目从简单的单工况验证升级到多参数敏感性分析或全工况覆盖测试时，仿真用例数量往往会呈指数级增长。我曾见过一个整车动力学团队在三个月内积累了超过2000个测试用例&a…...

2026/5/2 5:10:28 阅读更多 →

从人脸识别到推荐系统：PCA和LDA在真实业务场景中的落地差异

从人脸识别到推荐系统：PCA和LDA在真实业务场景中的落地差异在数据科学领域，降维技术犹如一把瑞士军刀，而PCA（主成分分析）和LDA（线性判别分析）则是其中最常用的两把刀刃。但工具的价值不在于理论…...

2026/5/2 5:07:16 阅读更多 →

如何3步完成百度文库文档纯净提取：突破付费限制的实用解决方案

如何3步完成百度文库文档纯净提取：突破付费限制的实用解决方案【免费下载链接】baidu-wenku fetch the document for free 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wenku 在信息获取过程中，百度文库的付费门槛、广告干扰和内容加载限…...

2026/5/2 4:53:43 阅读更多 →

zmq源码分析之DEALER/ROUTER 路由机制的应用场景

文章目录 1. 服务集群与负载均衡 2. 消息代理与路由器 3. 异步 RPC 系统 4. 聊天服务器 5. 游戏服务器 6. 金融交易系统 7. 物联网系统 8. 微服务架构代码示例：服务集群负载均衡器 (ROUTER) 服务实例 (DEALER) 客户端总结 DEALER/ROUTER 模式凭借其强大的路由能力和异步特性…...

2026/5/2 2:12:03 阅读更多 →

3分钟恢复Windows 11任务栏拖放功能：简单高效的终极解决方案

3分钟恢复Windows 11任务栏拖放功能：简单高效的终极解决方案【免费下载链接】Windows11DragAndDropToTaskbarFix "Windows 11 Drag & Drop to the Taskbar (Fix)" fixes the missing "Drag & Drop to the Taskbar" support in Windows…...

2026/5/2 0:30:00 阅读更多 →