在深度学习中，batch、epoch 和 iteration 的关系

张

张建站

2026/4/10 20:03:52

10分钟阅读

用一个实际例子和简单代码来清晰解释 batch、epoch 和 iteration 的关系------------------------------------------------------------------------------------假设场景你有一个数据集1000 张猫狗图片你设置 batch_size 100每次处理 100 张图片你计划训练 5 个 epoch概念关系图解1个Epoch 完整遍历整个数据集1次 │ ├──Iteration 1: 处理第1-100张图片 (batch 1) ├──Iteration 2: 处理第101-200张图片 (batch 2) ├──...└──Iteration 10: 处理第901-1000张图片 (batch 10)具体计算总样本数1000 张图片Batch size100每次处理的图片数Iterations per epoch 总样本数 / batch_size 1000 / 100 10 次Total iterations Iterations per epoch × Epochs 10 × 5 50 次代码示例说明import torchfrom torch.utils.data import DataLoader, TensorDataset# 创建模拟数据集1000张图片用1000个数字代替data torch.arange(0, 1000) # [0, 1, 2, ..., 999]dataset TensorDataset(data)# 创建数据加载器设置batch_size100dataloader DataLoader(dataset,batch_size100, shuffleTrue)# 训练5个epochforepochin range(5):print(f\n 开始第 {epoch1} 个epoch )# 每个epoch内遍历所有batchfor batch_idx, batch_data in enumerate(dataloader):# 获取当前batch的数据images batch_data[0]# 当前batch的100张图片# 这里应该是你的训练代码# 1. 正向传播# 2. 计算损失# 3. 反向传播# 4. 更新权重# 打印当前iteration信息print(fEpoch {epoch1} | Iteration {batch_idx1} | 处理图片: {images[0].item()}到{images[-1].item()})print(\n训练完成)print(f总Iteration次数: {5 * len(dataloader)} 次)import torch from torch.utils.data import DataLoader, TensorDataset # 创建模拟数据集1000张图片用1000个数字代替 data torch.arange(0, 1000) # [0, 1, 2, ..., 999] dataset TensorDataset(data) # 创建数据加载器设置batch_size100 dataloader DataLoader(dataset, batch_size100, shuffleTrue) # 训练5个epoch for epoch in range(5): print(f\n 开始第 {epoch1} 个epoch ) # 每个epoch内遍历所有batch for batch_idx, batch_data in enumerate(dataloader): # 获取当前batch的数据 images batch_data[0] # 当前batch的100张图片 # 这里应该是你的训练代码 # 1. 正向传播 # 2. 计算损失 # 3. 反向传播 # 4. 更新权重 # 打印当前iteration信息 print(fEpoch {epoch1} | Iteration {batch_idx1} | 处理图片: {images[0].item()}到{images[-1].item()}) print(\n训练完成) print(f总Iteration次数: {5 * len(dataloader)} 次)输出示例开始第 1 个epoch Epoch 1 | Iteration 1 | 处理图片: 12到980 Epoch 1 | Iteration 2 | 处理图片: 88到799 ... Epoch 1 | Iteration 10 | 处理图片: 36到995 开始第 2 个epoch Epoch 2 | Iteration 1 | 处理图片: 44到932 ... (共5个epoch每个epoch 10个iteration) 训练完成总Iteration次数: 50 次关键概念解析Batch批每次实际输入模型的数据子集代码中的images batch_data[0]获取的就是一个batch大小由batch_size100决定Iteration迭代完成一个batch训练所需的步骤每个iteration包含从dataloader取出一个batch数据执行正向传播 → 计算损失 → 反向传播 → 更新权重代码中for batch_idx, ...循环的每次执行就是一个iterationEpoch轮次完整遍历整个数据集一次每个epoch包含多个iteration1000样本 ÷ 100 batch_size 10 iterations/epoch外层循环for epoch in range(5)控制epoch数量为什么需要batch内存限制无法一次性加载所有数据如100万张图片训练效率小批量数据更适合GPU并行计算梯度稳定性批量梯度下降比单个样本更稳定正则化效果小批量带来轻微噪声有助于防止过拟合实际训练中的选择Batch Size迭代次数内存占用训练稳定性小 (8-32)多低较低中 (64-256)中等中等较好大 (512)少高高初学者建议从 batch_size64 开始尝试这是常用基准值。8也是合理的尤其当使用大模型或显存有限时。

第十七节：工具系统——从 LLM 指令到安全执行

知识图谱定位：第16节我们拆解了 API 客户端如何可靠地与 LLM 通信——多 Provider 统一抽象、流式响应解析、指数退避重试。但 LLM 返回的不只是文本，更多的是工具调用指令：tool_use block 里包含工具名和 JSON 参数。从 LLM 说"我要执行 Bash 命令 rm -rf /"到系…...

2026/4/10 20:01:41 阅读更多 →

Knowledge-Graph项目揭秘：知识图谱与深度学习的完美结合

Knowledge-Graph项目揭秘：知识图谱与深度学习的完美结合【免费下载链接】NLP-Knowledge-Graph 项目地址: https://gitcode.com/gh_mirrors/kn/Knowledge-Graph Knowledge-Graph项目是一个集知识图谱与深度学习于一体的综合性开源项目，它将知识图…...

2026/4/10 20:01:16 阅读更多 →

2025届必备的六大AI辅助写作神器推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 需从多层面采取举措来降低AI生成内容的占比，首个层面，要用心雕琢提示…...

2026/4/10 20:01:14 阅读更多 →

Flutter Riverpod：状态管理的新纪元

Flutter Riverpod：状态管理的新纪元告别 Provider 的繁琐，拥抱 Riverpod 的简洁与强大。一、为什么选择 Riverpod？ 作为一名追求代码如散文般优雅的 UI 匠人，我对状态管理工具有着近乎偏执的要求。Riverpod 不仅解决了 Provider 的…...

2026/4/9 13:12:17 阅读更多 →

【Scala深度学习】PyTorch On Scala3 系列课程第一章 01 ：入门与环境搭建【Ai Infra 3.0】[PyTorch Scala3 硕士研一课程]

章节 1: PyTorch ON Scala3入门与环境搭建本章将为PyTorch的使用做好准备。我们首先会配置必要的软件和环境。接着，主要内容将转向PyTorch的核心数据结构：张量。您将学习如何： 使用常用包管理器安装PyTorch。配置适合PyTorch项目的开发环…...

2026/4/9 14:42:05 阅读更多 →

STM32开发必备的C语言核心技巧与实战解析

1. STM32开发中的C语言核心知识点解析作为一名嵌入式开发者，我经常遇到初学者询问如何快速掌握STM32开发所需的C语言知识。今天我就结合自己多年的实战经验，整理出一份STM32开发中最关键的C语言知识点指南。这些内容不仅适合初学者系统学习，也…...

2026/4/9 9:16:06 阅读更多 →

Linux命令-nano（字符终端文本编辑器）

nano 是 Linux 系统中一个简单易用的命令行文本编辑器，以其直观的界面和易用性而闻名，特别适合初学者和快速编辑任务。它是 GNU 项目的一部分，替代了早期的 pico 编辑器。 📖 基本语法 nano [选项] [文件名]重要特性： …...

2026/4/10 2:15:03 阅读更多 →

更多精彩文章