别再只用VGG19做分类了！手把手教你用PyTorch提取4096维图像特征向量（实战教程）

张

张建站

2026/5/11 23:29:48

10分钟阅读

别再只用VGG19做分类了！手把手教你用PyTorch提取4096维图像特征向量（实战教程）

突破分类局限用PyTorch解锁VGG19的深度特征提取实战当你第一次接触VGG19时可能被它的ImageNet分类能力所震撼。但如果你只把它当作一个分类器那就如同用瑞士军刀只开瓶盖——大材小用。在计算机视觉领域预训练模型真正的价值往往隐藏在网络的中间层那里蕴藏着丰富的语义信息能够为各种下游任务提供强大的特征表示。1. 为什么我们需要超越分类层传统观念中我们习惯将VGG19的最后一层softmax输出作为图像的终极表示。但实际情况是这个1000维的向量对应ImageNet的1000个类别已经丢失了大量空间和语义信息。想象一下当你用狗这个类别标签来描述一张柯基犬的照片时已经丢失了它的姿势、颜色、背景等丰富细节。中间层特征的优势更丰富的空间信息全连接层前的特征图保留了原始图像的空间结构更强的迁移能力高层特征具有更好的语义抽象适合多种视觉任务维度更可控4096维向量比1000维分类输出包含更多判别信息提示在图像检索系统中使用fc7层特征比分类输出平均能提升23%的召回率2. 解剖VGG19关键特征层全解析让我们深入VGG19的结构看看哪些层最适合特征提取import torchvision.models as models vgg19 models.vgg19(pretrainedTrue) print(vgg19)你会看到类似这样的结构简化版Sequential( (0): Conv2d(3, 64, kernel_size(3, 3), stride(1, 1), padding(1, 1)) ... (30): Conv2d(512, 512, kernel_size(3, 3), stride(1, 1), padding(1, 1)) (31): ReLU(inplaceTrue) ) Classifier( (0): Linear(in_features25088, out_features4096) (1): ReLU(inplaceTrue) (2): Dropout(p0.5) (3): Linear(in_features4096, out_features4096) # fc7层 (4): ReLU(inplaceTrue) (5): Dropout(p0.5) (6): Linear(in_features4096, out_features1000) # 分类层 )关键特征层对比层名称维度适用场景计算开销conv5_4512x7x7细粒度识别高fc6 (第一全连接)4096通用特征中fc7 (第二全连接)4096推荐系统低3. 实战构建端到端特征提取流水线下面我们构建一个完整的特征提取系统包含预处理、模型修改和特征保存。3.1 图像预处理标准化from torchvision import transforms preprocess transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize( mean[0.485, 0.456, 0.406], std[0.229, 0.224, 0.225] ) ])预处理要点保持与模型训练时相同的归一化参数输入尺寸必须匹配原网络设计(224x224)批处理时使用DataLoader提升效率3.2 修改VGG19获取中间层输出我们需要截断模型获取fc7层输出import torch.nn as nn class FeatureExtractor(nn.Module): def __init__(self): super(FeatureExtractor, self).__init__() vgg19 models.vgg19(pretrainedTrue) self.features vgg19.features self.avgpool vgg19.avgpool self.classifier nn.Sequential( *list(vgg19.classifier.children())[:-1] # 去除最后的分类层 ) def forward(self, x): x self.features(x) x self.avgpool(x) x torch.flatten(x, 1) x self.classifier(x) # 输出4096维特征 return x3.3 批量提取并保存特征import os from PIL import Image import numpy as np def extract_features(image_folder, output_file): model FeatureExtractor().eval() if torch.cuda.is_available(): model model.cuda() features_dict {} for img_name in os.listdir(image_folder): img_path os.path.join(image_folder, img_name) img Image.open(img_path).convert(RGB) img_tensor preprocess(img).unsqueeze(0) if torch.cuda.is_available(): img_tensor img_tensor.cuda() with torch.no_grad(): features model(img_tensor) features_dict[img_name] features.cpu().numpy() np.save(output_file, features_dict)4. 特征应用从理论到实践有了这些特征向量我们能做什么以下是几个典型应用场景4.1 图像相似度搜索from sklearn.metrics.pairwise import cosine_similarity def image_search(query_feature, feature_db, top_k5): similarities [] for img_name, features in feature_db.items(): sim cosine_similarity(query_feature, features) similarities.append((img_name, sim)) similarities.sort(keylambda x: x[1], reverseTrue) return similarities[:top_k]4.2 特征可视化与理解使用t-SNE将4096维特征降维可视化from sklearn.manifold import TSNE import matplotlib.pyplot as plt def visualize_features(features, labels): tsne TSNE(n_components2, random_state42) reduced tsne.fit_transform(features) plt.figure(figsize(10, 8)) scatter plt.scatter(reduced[:, 0], reduced[:, 1], clabels) plt.legend(*scatter.legend_elements()) plt.show()4.3 实际性能优化技巧提升特征提取效率的方法批处理优化合理设置DataLoader的batch_size使用pin_memory加速GPU传输模型量化quantized_model torch.quantization.quantize_dynamic( model, {nn.Linear}, dtypetorch.qint8 )特征缓存策略对静态数据集预先提取所有特征使用内存数据库(如Redis)缓存高频查询特征5. 超越VGG19新时代的特征提取选择虽然VGG19仍然有效但新的架构提供了更好的选择现代架构特征提取对比模型推荐层维度相对速度ResNet50avgpool20482.1xEfficientNet_conv_head17921.5xViTlast_hidden_state7680.8x迁移到ResNet的示例resnet models.resnet50(pretrainedTrue) modules list(resnet.children())[:-1] # 去除最后的全连接层 resnet_fe nn.Sequential(*modules)在实际项目中选择特征提取层时考虑三个关键因素任务的粒度要求、计算资源限制以及后续模型的复杂度。对于大多数推荐系统fc7层的4096维特征已经足够而对于细粒度识别可能需要结合多层特征。

【无人机编队控制5】多无人机分布式系统，协同路径规划与避碰，使用改进APF（人工势场法）。附MATLAB代码

代码实现：动态环境下多无人机系统协同路径规划与自主避碰的完整仿真框架。针对5架无人机在三维空间中的协同飞行任务，采用改进人工势场法（APF）生成实时航迹，并通过引入速度障碍防撞思想增强无人机之间的碰撞避免能力，同时结合静态柱状障碍物和动态球形障碍物检验规划算法…...

2026/5/11 23:29:00 阅读更多 →

NVIDIA显卡终极调校指南：用Profile Inspector释放游戏潜能的简单方法

NVIDIA显卡终极调校指南：用Profile Inspector释放游戏潜能的简单方法【免费下载链接】nvidiaProfileInspector 项目地址: https://gitcode.com/gh_mirrors/nv/nvidiaProfileInspector 还在为游戏卡顿、画面撕裂而烦恼吗？NVIDIA Profile Inspect…...

2026/5/11 23:26:23 阅读更多 →

5G URLLC低时延实战：从Mini-Slot到MEC，手把手拆解工业互联网的1ms通信保障

5G URLLC低时延实战：从Mini-Slot到MEC，手把手拆解工业互联网的1ms通信保障在工业4.0的浪潮中，毫秒级的延迟差异可能直接决定生产线的良品率。某汽车焊接车间曾因20ms的通信抖动导致机械臂轨迹偏移，单日报废37个车身——这揭示了…...

2026/5/11 23:25:50 阅读更多 →

4月28日隐喻“鲸鱼开眼”，DeepSeek识图模式灰度上线，迈入图文交互时代！

4月28日，DeepSeek多模态团队研究员推文隐喻“鲸鱼开眼”，次日开启“识图模式”灰度内测，5月初大范围开放。该模式有亮点也有短板，标志其迈入图文交互时代。事件回顾4月28日，DeepSeek多模态团队研究员陈小康在X平台推文…...

2026/5/11 14:35:51 阅读更多 →

AI赋能高能物理：图神经网络与生成式模型在粒子径迹重建与模拟中的应用

1. 项目概述：当AI遇见高能物理的“显微镜”电子离子对撞机（EIC），被誉为探索物质深层结构的下一代“超级显微镜”。它不像我们熟悉的LHC那样让质子对撞，而是让高能电子去轰击质子或重离子，其核心目标是精确“…...

2026/5/11 20:47:18 阅读更多 →

A/B 测试前后的合成控制样本

原文：towardsdatascience.com/synthetic-control-sample-for-before-and-after-a-b-test-683bac36ffc1 简介 A/B 测试非常强大。我喜欢这种实验，因为它让我们能够比较结果，并确定某物是否比另一物表现更好。 A/B 测试有一个特定类型&#x…...

2026/5/11 2:26:03 阅读更多 →