使用PyTorch实现猫狗分类Python源码及准确度对比（CNN、VGG16迁移学习两张方式）

张

张建站

2026/5/31 10:39:22

10分钟阅读

使用PyTorch实现猫狗分类Python源码及准确度对比（CNN、VGG16迁移学习两张方式）

数据集下载Dogs vs. Cats ~| Kaggle不同方法准确度方法轮数准确度cnn567.64%cnn1074.92%cnn1573.42%cnn2079.28%cnn2578.28%vgg16586.5%vgg161086.98%vgg161585.42%cnn.pyimporttorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataset,DataLoaderfromtorchvisionimporttransformsfromPILimportImageimportos num_epochs20batch_size50learning_rate0.001train_size25000indicestorch.randperm(train_size)train_indicesindices[:20000]test_indicesindices[20000:]classDogsVsCatsDataset(Dataset):def__init__(self,root,trainTrue,transformNone):super().__init__()self.rootroot self.transformtransform self.classes[dog,cat]self.files[]self.labels[]filesos.listdir(root)indextrain_indicesiftrainelsetest_indicesforiinindex:filefiles[i]self.files.append(file)ifdoginfile:self.labels.append(0)else:self.labels.append(1)def__len__(self):returnlen(self.files)def__getitem__(self,index):pathos.path.join(self.root,self.files[index])imageImage.open(path).convert(RGB)labelself.labels[index]ifself.transform:imageself.transform(image)returnimage,label transformtransforms.Compose([transforms.Resize((224,224)),transforms.RandomHorizontalFlip(),transforms.RandomVerticalFlip(),transforms.RandomRotation(degrees30),# transforms.RandomResizedCrop(# size224, scale(0.08, 1.0), ratio(0.75, 1.33333)# ),transforms.ColorJitter(brightness0.2,contrast0.2,saturation0.2,hue0.1),transforms.ToTensor(),transforms.Normalize(mean(0.485,0.456,0.406),std(0.229,0.224,0.225)),])train_datasetDogsVsCatsDataset(root.\\data\\Dogs Vs Cats\\train,trainTrue,transformtransform)test_datasetDogsVsCatsDataset(root.\\data\\Dogs Vs Cats\\train,trainFalse,transformtransform)train_loaderDataLoader(train_dataset,batch_sizebatch_size,shuffleTrue)test_loaderDataLoader(test_dataset,batch_sizebatch_size,shuffleFalse)devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)classCNNModel(nn.Module):def__init__(self):super().__init__()self.cnn1nn.Sequential(nn.Conv2d(3,24,kernel_size3,stride1,padding1),nn.BatchNorm2d(24),nn.MaxPool2d(kernel_size2,stride2),)self.cnn2nn.Sequential(nn.Conv2d(24,48,kernel_size3,stride1,padding1),nn.BatchNorm2d(48),nn.MaxPool2d(kernel_size2,stride2),)self.cnn3nn.Sequential(nn.Conv2d(48,96,kernel_size3,stride1,padding1),nn.BatchNorm2d(96),nn.MaxPool2d(kernel_size2,stride2),)self.cnn4nn.Sequential(nn.Conv2d(96,48,kernel_size3,stride1,padding1),nn.BatchNorm2d(48),nn.MaxPool2d(kernel_size2,stride2),)self.dropoutnn.Dropout()self.line1nn.Linear(14*14*48,512)self.line2nn.Linear(512,2)defforward(self,x):outself.cnn1(x)outself.cnn2(out)outself.cnn3(out)outself.cnn4(out)outout.reshape(out.size(0),-1)outself.dropout(out)outself.line1(out)outself.line2(out)returnout modelCNNModel().to(device)criterionnn.CrossEntropyLoss()optimizeroptim.Adam(model.parameters(),lrlearning_rate)model.train()forepochinrange(num_epochs):fori,(image,label)inenumerate(train_loader):imageimage.to(device)labellabel.to(device)outputmodel(image)losscriterion(output,label)optimizer.zero_grad()loss.backward()optimizer.step()if(i1)%batch_size0:print(Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}.format(epoch1,num_epochs,i1,len(train_loader),loss.item()))model.eval()withtorch.no_grad():total0correct0forimage,labelintest_loader:imageimage.to(device)labellabel.to(device)outputmodel(image)_,predicttorch.max(output,1)totallen(label)correct(predictlabel).sum().item()print(Accuracy of test {} images: {} %.format(len(test_dataset),correct/total*100))vgg16.pyimporttorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataset,DataLoaderfromtorchvisionimportmodels,transformsfromPILimportImageimportos num_epochs5batch_size10learning_rate0.001train_size25000indicestorch.randperm(train_size)train_indicesindices[:20000]test_indicesindices[20000:]classDogsVsCatsDataset(Dataset):def__init__(self,root,trainTrue,transformNone):super().__init__()self.rootroot self.transformtransform self.classes[dog,cat]self.files[]self.labels[]filesos.listdir(root)indextrain_indicesiftrainelsetest_indicesforiinindex:filefiles[i]self.files.append(file)ifdoginfile:self.labels.append(0)else:self.labels.append(1)def__len__(self):returnlen(self.files)def__getitem__(self,index):pathos.path.join(self.root,self.files[index])imageImage.open(path).convert(RGB)labelself.labels[index]ifself.transform:imageself.transform(image)returnimage,label transformtransforms.Compose([transforms.RandomResizedCrop(size224),transforms.RandomHorizontalFlip(),transforms.RandomVerticalFlip(),transforms.RandomRotation(degrees30),transforms.ColorJitter(brightness0.2,contrast0.2,saturation0.2,hue0.1),transforms.ToTensor(),transforms.Normalize(mean(0.485,0.456,0.406),std(0.229,0.224,0.225)),])train_datasetDogsVsCatsDataset(root.\\data\\Dogs Vs Cats\\train,trainTrue,transformtransform)test_datasetDogsVsCatsDataset(root.\\data\\Dogs Vs Cats\\train,trainFalse,transformtransform)train_loaderDataLoader(train_dataset,batch_sizebatch_size,shuffleTrue)test_loaderDataLoader(test_dataset,batch_sizebatch_size,shuffleFalse)devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)modelmodels.vgg16(weightsmodels.VGG16_Weights.IMAGENET1K_V1)forparaminmodel.features.parameters():param.requires_gradFalsemodel.classifier[6].out_features2modelmodel.to(device)criterionnn.CrossEntropyLoss()optimizeroptim.Adam(model.parameters(),lrlearning_rate)model.train()forepochinrange(num_epochs):fori,(image,label)inenumerate(train_loader):imageimage.to(device)labellabel.to(device)outputmodel(image)losscriterion(output,label)optimizer.zero_grad()loss.backward()optimizer.step()if(i1)%1000:print(Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}.format(epoch1,num_epochs,i1,len(train_loader),loss.item()))model.eval()withtorch.no_grad():total0correct0forimage,labelintest_loader:imageimage.to(device)labellabel.to(device)outputmodel(image)_,predicttorch.max(output,1)totallen(label)correct(predictlabel).sum().item()print(Accuracy of test {} images: {} %.format(len(test_dataset),correct/total*100))参考文档PyTorch猫狗大战CNN vs VGG16迁移学习谁更胜一筹- 超腾开源

论文同时被标疑似AI写作和查重超标？双效处理工具实测推荐

学术审核早已进入“双重严查”阶段，知网、维普等平台不仅卡重复率，对AI生成痕迹更是零容忍，AIGC率超标直接按学术不端处理。不少同学改完重复率又消AI痕迹，折腾好几轮还是过不了，盲目试错反而耽误时间。实测下来&#…...

2026/5/29 17:51:00 阅读更多 →

MOSS-VL-Instruct-0408实战案例：构建智能视频监控系统的完整教程

MOSS-VL-Instruct-0408实战案例：构建智能视频监控系统的完整教程【免费下载链接】MOSS-VL-Instruct-0408 项目地址: https://ai.gitcode.com/OpenMOSS/MOSS-VL-Instruct-0408 在当今数字化时代，智能视频监控系统已成为安全防护和智能分析的重要…...

2026/5/29 17:47:58 阅读更多 →

Linux网络驱动之Fixed-Link（3）

接前一篇文章：Linux网络驱动之Fixed-Link（2） 本文内容参考： linux phy fixed-link-CSDN博客 fixed-link 网口驱动设备树-CSDN博客 GMAC网卡Fixed-Link模式 - StepForwards - 博客园 RTL8367RB的国产P2P替代方案用JL6107-PC的可…...

2026/5/31 8:33:55 阅读更多 →

量子误差缓解技术：原理、应用与优化

1. 量子误差缓解技术概述量子计算在NISQ（含噪中等规模量子）时代面临的核心挑战之一是量子噪声对计算结果的干扰。误差缓解技术作为当前最实用的解决方案，能够在硬件层面纠错技术成熟前，显著提升量子算法的执行精度。与传统纠错不同…...

2026/5/31 0:03:06 阅读更多 →

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tabl…...

2026/5/31 0:07:22 阅读更多 →

如何用Poppins字体解决多语言设计难题：新手完整指南

如何用Poppins字体解决多语言设计难题：新手完整指南【免费下载链接】Poppins Poppins, a Devanagari Latin family for Google Fonts. 项目地址: https://gitcode.com/gh_mirrors/po/Poppins 你是否曾为多语言项目中的字体选择而烦恼？当你的网站…...

2026/5/31 0:13:35 阅读更多 →