用PyTorch手把手搭建ResNet34：从看懂每一行代码到跑通第一个模型

张

张建站

2026/6/9 14:20:23

10分钟阅读

用PyTorch从零实现ResNet34逐行解析与实战指南深度残差网络ResNet自2015年问世以来已成为计算机视觉领域的里程碑式架构。本文将带您从PyTorch基础张量操作开始逐步构建完整的ResNet34模型特别关注初学者容易困惑的通道数变化、残差连接实现和维度调试技巧。不同于简单粘贴代码我们会解剖每个模块的设计意图配合可运行的代码片段和实时维度打印确保您真正理解每行代码的作用。1. 环境准备与核心概念在开始编码前我们需要明确几个关键概念。残差网络的核心创新在于跳跃连接shortcut connection它允许梯度直接流过多个层缓解了深度网络中的梯度消失问题。对于输入x传统网络学习H(x)而残差块学习的是F(x) H(x) - x这使得网络更容易学习恒等映射。基础环境配置import torch import torch.nn as nn import torch.nn.functional as F print(torch.__version__) # 推荐1.8版本ResNet34的典型结构可分为五个阶段初始卷积层7x7卷积最大池化四个残差阶段分别包含3,4,6,3个残差块全局平均池化全连接分类层提示调试网络时建议使用torchsummary库可视化各层维度安装命令pip install torchsummary2. 残差块实现详解残差块有两种基本类型Identity Block输入输出维度相同stride1Convolution Block需要调整维度stride2我们先实现基础版本再逐步优化class BasicBlock(nn.Module): expansion 1 # 输出通道的倍增系数 def __init__(self, in_channels, out_channels, stride1): super().__init__() self.conv1 nn.Conv2d( in_channels, out_channels, kernel_size3, stridestride, padding1, biasFalse ) self.bn1 nn.BatchNorm2d(out_channels) self.conv2 nn.Conv2d( out_channels, out_channels, kernel_size3, stride1, padding1, biasFalse ) self.bn2 nn.BatchNorm2d(out_channels) # 捷径连接 self.shortcut nn.Sequential() if stride ! 1 or in_channels ! self.expansion*out_channels: self.shortcut nn.Sequential( nn.Conv2d( in_channels, self.expansion*out_channels, kernel_size1, stridestride, biasFalse ), nn.BatchNorm2d(self.expansion*out_channels) ) def forward(self, x): out F.relu(self.bn1(self.conv1(x))) out self.bn2(self.conv2(out)) out self.shortcut(x) # 残差连接 out F.relu(out) print(fBlock output shape: {out.shape}) # 调试输出 return out关键点解析expansion控制输出通道的扩展系数ResNet34中为1更深网络可能为4shortcut当输入输出维度不匹配时通过1x1卷积调整每个卷积后都跟随批归一化BN这是现代CNN的标准实践3. 构建完整网络架构现在我们将残差块组装成完整网络。注意各阶段的通道数变化规律class ResNet(nn.Module): def __init__(self, block, num_blocks, num_classes1000): super().__init__() self.in_channels 64 self.conv1 nn.Conv2d(3, 64, kernel_size7, stride2, padding3, biasFalse) self.bn1 nn.BatchNorm2d(64) self.maxpool nn.MaxPool2d(kernel_size3, stride2, padding1) # 四个残差阶段 self.layer1 self._make_layer(block, 64, num_blocks[0], stride1) self.layer2 self._make_layer(block, 128, num_blocks[1], stride2) self.layer3 self._make_layer(block, 256, num_blocks[2], stride2) self.layer4 self._make_layer(block, 512, num_blocks[3], stride2) self.avgpool nn.AdaptiveAvgPool2d((1, 1)) self.fc nn.Linear(512 * block.expansion, num_classes) def _make_layer(self, block, out_channels, num_blocks, stride): strides [stride] [1]*(num_blocks-1) layers [] for stride in strides: layers.append(block(self.in_channels, out_channels, stride)) self.in_channels out_channels * block.expansion return nn.Sequential(*layers) def forward(self, x): x F.relu(self.bn1(self.conv1(x))) x self.maxpool(x) x self.layer1(x) x self.layer2(x) x self.layer3(x) x self.layer4(x) x self.avgpool(x) x torch.flatten(x, 1) x self.fc(x) return x网络配置参数def ResNet34(): return ResNet(BasicBlock, [3,4,6,3])维度变化跟踪表层输入形状输出形状strideconv1(3,224,224)(64,112,112)2maxpool(64,112,112)(64,56,56)2layer1 (x3)(64,56,56)(64,56,56)1layer2 (x4)(64,56,56)(128,28,28)2layer3 (x6)(128,28,28)(256,14,14)2layer4 (x3)(256,14,14)(512,7,7)2avgpool(512,7,7)(512,1,1)-4. 模型训练与调试技巧实现网络后正确的初始化和训练策略至关重要权重初始化最佳实践def initialize_weights(model): for m in model.modules(): if isinstance(m, nn.Conv2d): nn.init.kaiming_normal_(m.weight, modefan_out, nonlinearityrelu) if m.bias is not None: nn.init.constant_(m.bias, 0) elif isinstance(m, nn.BatchNorm2d): nn.init.constant_(m.weight, 1) nn.init.constant_(m.bias, 0) elif isinstance(m, nn.Linear): nn.init.normal_(m.weight, 0, 0.01) nn.init.constant_(m.bias, 0)训练循环示例model ResNet34() initialize_weights(model) criterion nn.CrossEntropyLoss() optimizer torch.optim.SGD(model.parameters(), lr0.1, momentum0.9, weight_decay1e-4) # 学习率调度 scheduler torch.optim.lr_scheduler.StepLR(optimizer, step_size30, gamma0.1) for epoch in range(100): model.train() for inputs, labels in train_loader: outputs model(inputs) loss criterion(outputs, labels) optimizer.zero_grad() loss.backward() optimizer.step() scheduler.step()常见调试问题解决方案维度不匹配错误在残差连接处打印张量形状print(fMain path: {out.shape}, Shortcut: {self.shortcut(x).shape})梯度消失检查初始化方式适当调小学习率过拟合增加数据增强随机裁剪、水平翻转等训练不稳定添加梯度裁剪torch.nn.utils.clip_grad_norm_5. 模型验证与性能优化完成训练后我们需要评估模型表现并考虑优化方向验证集评估代码model.eval() correct 0 total 0 with torch.no_grad(): for inputs, labels in val_loader: outputs model(inputs) _, predicted torch.max(outputs.data, 1) total labels.size(0) correct (predicted labels).sum().item() print(fAccuracy: {100 * correct / total}%)性能优化技巧混合精度训练使用torch.cuda.amp减少显存占用from torch.cuda.amp import autocast, GradScaler scaler GradScaler() with autocast(): outputs model(inputs) loss criterion(outputs, labels) scaler.scale(loss).backward() scaler.step(optimizer) scaler.update()模型量化减小模型体积quantized_model torch.quantization.quantize_dynamic( model, {nn.Linear}, dtypetorch.qint8 )ONNX导出实现跨平台部署torch.onnx.export(model, dummy_input, resnet34.onnx)实际项目中ResNet34在ImageNet上的典型表现Top-1准确率约73%参数量约21.8M推理速度V100约1200 images/sec通过本文的逐行实现您应该已经掌握了ResNet的核心思想。建议尝试以下扩展练习实现更深的ResNet50/101注意瓶颈结构变化添加注意力机制如SE模块在自定义数据集上微调模型比较不同初始化方法的影响

基于K4T51163QG-HCE7的无线路由器与嵌入式系统内存设计

K4T51163QG-HCE7：三星512Mb DDR2 SDRAM内存颗粒深度解析在固态硬盘（SSD）缓存、网络通信设备、工业嵌入式系统以及各类需要高速数据缓冲的应用中，DDR2 SDRAM以其成熟的接口和稳定的性能，成为系统设计中重要的存储组件。…...

2026/6/9 14:18:22 阅读更多 →

STM32上直接可用的LIS2DH12加速度计I²C驱动，带跌落报警和六轴方向识别功能

本文还有配套的精品资源，点击获取简介：专为STM32设计的LIS2DH12三轴加速度传感器IC驱动包，开箱即用，无需额外适配。包含完整驱动文件（LIS2DH12.c/.h、LIS2DH12_IIC.c/.h）、中断配置（exti.c/…...

2026/6/9 14:17:21 阅读更多 →

MATLAB版储能容量优化工具：用粒子群算法自动算出最佳功率与能量配置

本文还有配套的精品资源，点击获取简介：一套开箱即用的MATLAB储能容量优化实现，核心是粒子群算法（PSO），能根据实际负荷数据、电源出力曲线、分时电价和储能硬件参数（比如充放电效率、寿命限制…...

2026/6/9 14:17:09 阅读更多 →

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…...

2026/6/9 1:16:23 阅读更多 →

2026实测盘点｜适合国内高校生的AI写作平台，降重润色哪家强？

2026年毕业季，学术审查全面加码。教育部明确要求毕业论文AIGC率不得超过30%，985/211院校更是将红线压到了20%以内，硕士论文甚至卡到15%。与此同时，知网上线AIGC 3.0系统，可实现段落级内容溯源；维普引入语义…...

2026/6/8 4:35:49 阅读更多 →

JewelCraft：Blender珠宝设计的终极免费解决方案

JewelCraft：Blender珠宝设计的终极免费解决方案【免费下载链接】jewelcraft Blender add-on for jewelry design 项目地址: https://gitcode.com/gh_mirrors/je/jewelcraft JewelCraft是一款专为珠宝设计师和3D艺术家打造的Blender插件，提供完整…...

2026/6/9 1:16:30 阅读更多 →