ResNet实战：用PyTorch从零搭建残差网络（附完整代码）

张

张建站

2026/6/30 5:25:36

10分钟阅读

ResNet实战指南PyTorch残差网络从零实现与调优技巧残差网络ResNet作为计算机视觉领域的里程碑式架构彻底改变了我们训练深度神经网络的方式。想象一下当你尝试堆叠更多层数以提升模型性能时却发现准确率不升反降——这正是2015年之前研究者们面临的困境。ResNet通过其革命性的跳跃连接设计不仅解决了深度网络训练难题更为后续各类架构创新铺平了道路。本教程将带您从零开始构建ResNet-18模型不同于简单的代码复现我们将深入探究残差连接的工作机制分享实际训练中的调优技巧并提供完整的可运行代码示例。无论您是刚接触计算机视觉的新手还是希望巩固基础的中级开发者都能通过这次实践获得对深度网络架构设计的深刻理解。1. 残差网络核心原理剖析1.1 深度网络的训练困境在传统神经网络中随着层数增加模型通常会遭遇三大挑战梯度消失/爆炸反向传播时梯度呈指数级衰减或增长网络退化更深网络的训练误差反而高于浅层网络信息丢失特征在多层传递过程中逐渐失真# 传统卷积块示例存在梯度问题 class VanillaBlock(nn.Module): def __init__(self, in_channels, out_channels): super().__init__() self.conv1 nn.Conv2d(in_channels, out_channels, kernel_size3, padding1) self.bn1 nn.BatchNorm2d(out_channels) self.conv2 nn.Conv2d(out_channels, out_channels, kernel_size3, padding1) self.bn2 nn.BatchNorm2d(out_channels) def forward(self, x): x F.relu(self.bn1(self.conv1(x))) x self.bn2(self.conv2(x)) return F.relu(x)1.2 残差学习的突破性设计ResNet的核心创新在于将网络设计目标从学习完整映射改为学习残差映射原始映射H(x) 残差映射F(x) H(x) - x 最终输出H(x) F(x) x这种设计带来了三个关键优势梯度高速公路跳跃连接为梯度提供了直达路径恒等映射保底网络至少能保持浅层网络性能特征复用机制原始特征可直接传递到深层提示当残差F(x)0时网络自动退化为恒等映射这保证了深层网络不会比浅层更差1.3 残差块变体比较ResNet家族包含多种残差块设计主要分为两种类型类型结构计算量适用场景基础块两个3×3卷积较高ResNet-18/34瓶颈块1×1→3×3→1×1较低ResNet-50及以上![残差块对比](data:image/svgxml;base64,PHN2ZyB3aWR0aD0iNDAwIiBoZWlnaHQ9IjIwMCIPC9zdmc)图基础残差块(左)与瓶颈结构(右)对比2. PyTorch实现ResNet-18完整代码2.1 基础残差块实现import torch import torch.nn as nn import torch.nn.functional as F class BasicBlock(nn.Module): expansion 1 def __init__(self, in_planes, planes, stride1): super(BasicBlock, self).__init__() self.conv1 nn.Conv2d( in_planes, planes, kernel_size3, stridestride, padding1, biasFalse) self.bn1 nn.BatchNorm2d(planes) self.conv2 nn.Conv2d( planes, planes, kernel_size3, stride1, padding1, biasFalse) self.bn2 nn.BatchNorm2d(planes) self.shortcut nn.Sequential() if stride ! 1 or in_planes ! self.expansion*planes: self.shortcut nn.Sequential( nn.Conv2d(in_planes, self.expansion*planes, kernel_size1, stridestride, biasFalse), nn.BatchNorm2d(self.expansion*planes) ) def forward(self, x): out F.relu(self.bn1(self.conv1(x))) out self.bn2(self.conv2(out)) out self.shortcut(x) out F.relu(out) return out2.2 完整网络架构搭建class ResNet(nn.Module): def __init__(self, block, num_blocks, num_classes10): super(ResNet, self).__init__() self.in_planes 64 self.conv1 nn.Conv2d(3, 64, kernel_size3, stride1, padding1, biasFalse) self.bn1 nn.BatchNorm2d(64) self.layer1 self._make_layer(block, 64, num_blocks[0], stride1) self.layer2 self._make_layer(block, 128, num_blocks[1], stride2) self.layer3 self._make_layer(block, 256, num_blocks[2], stride2) self.layer4 self._make_layer(block, 512, num_blocks[3], stride2) self.linear nn.Linear(512*block.expansion, num_classes) def _make_layer(self, block, planes, num_blocks, stride): strides [stride] [1]*(num_blocks-1) layers [] for stride in strides: layers.append(block(self.in_planes, planes, stride)) self.in_planes planes * block.expansion return nn.Sequential(*layers) def forward(self, x): out F.relu(self.bn1(self.conv1(x))) out self.layer1(out) out self.layer2(out) out self.layer3(out) out self.layer4(out) out F.avg_pool2d(out, 4) out out.view(out.size(0), -1) out self.linear(out) return out2.3 模型实例化与验证def ResNet18(): return ResNet(BasicBlock, [2,2,2,2]) # 测试网络结构 net ResNet18() x torch.randn(1,3,32,32) # 模拟CIFAR-10输入 y net(x) print(y.shape) # 应输出 torch.Size([1, 10])3. 训练优化与实战技巧3.1 数据准备与增强对于CIFAR-10数据集推荐使用以下增强策略from torchvision import transforms train_transform transforms.Compose([ transforms.RandomCrop(32, padding4), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)), ]) test_transform transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010)), ])3.2 超参数配置建议根据实验经验ResNet-18在CIFAR-10上的推荐配置超参数推荐值说明学习率0.1初始学习率批次大小128根据GPU内存调整优化器SGDmomentummomentum0.9学习率调度阶梯下降每30轮×0.1权重衰减5e-4L2正则化系数训练轮数100-200观察收敛情况3.3 训练循环实现def train(model, device, train_loader, optimizer, epoch): model.train() for batch_idx, (data, target) in enumerate(train_loader): data, target data.to(device), target.to(device) optimizer.zero_grad() output model(data) loss F.cross_entropy(output, target) loss.backward() optimizer.step() if batch_idx % 100 0: print(fTrain Epoch: {epoch} [{batch_idx*len(data)}/{len(train_loader.dataset)} f ({100.*batch_idx/len(train_loader):.0f}%)]\tLoss: {loss.item():.6f}) def test(model, device, test_loader): model.eval() test_loss 0 correct 0 with torch.no_grad(): for data, target in test_loader: data, target data.to(device), target.to(device) output model(data) test_loss F.cross_entropy(output, target, reductionsum).item() pred output.argmax(dim1, keepdimTrue) correct pred.eq(target.view_as(pred)).sum().item() test_loss / len(test_loader.dataset) print(f\nTest set: Average loss: {test_loss:.4f}, fAccuracy: {correct}/{len(test_loader.dataset)} f({100.*correct/len(test_loader.dataset):.0f}%)\n)4. 高级应用与性能提升4.1 残差连接变体实验除了标准实现还可以尝试以下改进方案预激活结构在残差块中使用BN-ReLU-Conv顺序宽残差网络增加每层通道数同时减少深度注意力机制引入SE模块增强特征选择# 预激活残差块示例 class PreActBlock(nn.Module): def __init__(self, in_planes, planes, stride1): super().__init__() self.bn1 nn.BatchNorm2d(in_planes) self.conv1 nn.Conv2d(in_planes, planes, kernel_size3, stridestride, padding1, biasFalse) self.bn2 nn.BatchNorm2d(planes) self.conv2 nn.Conv2d(planes, planes, kernel_size3, stride1, padding1, biasFalse) if stride ! 1 or in_planes ! planes: self.shortcut nn.Sequential( nn.Conv2d(in_planes, planes, kernel_size1, stridestride, biasFalse) ) def forward(self, x): out F.relu(self.bn1(x)) shortcut self.shortcut(out) if hasattr(self, shortcut) else x out self.conv1(out) out F.relu(self.bn2(out)) out self.conv2(out) out shortcut return out4.2 可视化与调试技巧使用Torchviz可视化计算图pip install torchvizfrom torchviz import make_dot x torch.randn(1,3,32,32).requires_grad_(True) y net(x) dot make_dot(y, paramsdict(net.named_parameters())) dot.render(resnet_graph, formatpng)常见问题排查指南梯度异常检测for name, param in net.named_parameters(): if param.grad is not None: print(f{name}: grad norm {param.grad.norm().item():.4f})特征图可视化import matplotlib.pyplot as plt def visualize_feature_maps(layer): with torch.no_grad(): features layer(x.unsqueeze(0)) plt.figure(figsize(10,5)) for i in range(min(16, features.shape[1])): plt.subplot(4,4,i1) plt.imshow(features[0,i].cpu().numpy()) plt.axis(off) plt.show() visualize_feature_maps(net.layer1[0].conv1)4.3 迁移学习实践使用预训练ResNet进行迁移学习的典型流程加载预训练模型如ImageNet上训练的ResNet替换最后的全连接层选择性冻结部分层参数微调网络from torchvision.models import resnet18 # 加载预训练模型 pretrained_model resnet18(pretrainedTrue) # 替换最后一层 num_ftrs pretrained_model.fc.in_features pretrained_model.fc nn.Linear(num_ftrs, 10) # CIFAR-10有10类 # 仅训练最后一层 for param in pretrained_model.parameters(): param.requires_grad False for param in pretrained_model.fc.parameters(): param.requires_grad True

codex（一）下载安装

一、下载安装 1、下载 https://chatgpt.com/codex/...

2026/6/26 8:01:53 阅读更多 →

无刷电机BDLC控制器方案：采用脉冲注入法、电感法实现高效力矩保持，无霍尔无感方案媲美有霍尔效...

脉冲注入法，持续注入，启动低速运行过程中注入，电感法，ipd，力矩保持，无霍尔无感方案，媲美有霍尔效果。 bldc控制器方案，无刷电机。提供源码，原理图。一、概述本文档详细…...

2026/6/26 8:01:53 阅读更多 →

开源工具本地化部署全流程指南：从环境搭建到风险管控

开源工具本地化部署全流程指南：从环境搭建到风险管控【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 在数字化转型加速的今天，开源工具已成为企业和开发者提升效率的核心…...

2026/6/27 12:28:38 阅读更多 →

2026四级英语考试备考|英语四六级考试材料|英语四六级备考资料

2026四级英语考试备考|英语四六级考试材料|英语四六级备考资料资料全科都有英语四六级备考资料 PDFhttps://tool.nineya.com/s/1jpf2t49o 【英语真题】1. "Comprehension" most probably means（ ） A. 理解 B. 表达 C. 翻译 D. 写作答案&#…...

2026/6/29 6:09:56 阅读更多 →

2026年英语四级|2026年大学四级英语备考资料|2026四级备考

2026年英语四级|2026年大学四级英语备考资料|2026四级备考资料全科都有2026四级备考 PDFhttps://tool.nineya.com/s/1jpf2t49o 【英语真题】1. "Vocabulary" most probably means（ ） A. 词汇 B. 语法 C. 阅读 D. 听力答案：A 解析&…...

2026/6/29 8:12:03 阅读更多 →