Day 4 学习优化方法

张

张建站

2026/5/6 7:06:43

10分钟阅读

学习优化方法SGD代码演示class SGD: def __init__(self,lr0.01): self.lrlr def update(self,params,grads): for key in params.keys(): params[key]-self.lr*grads[key]SGD的缺点动量法Momentum数学原理代码演示class Momentum: #初始化 def __init__(self,lr0.01,momentum0.9): self.lrlr self.momentummomentum self.vNone #更新方法 def update(self,params,grads): #对v进行初始化 if self.v is None: self.v{} for key , val in params.items(): self.v[key]np.zeros_like(val) #按公式进行参数更新 for key in params.keys(): self.v[key]self.momentum * self.v[key] - self.lr *grads[key] params[key] self.v[key]学习率衰减等间隔衰减每隔固定训练周期学习率按一定比例下降指定间隔衰减在指定的训练周期学习率按一定系数衰减指数衰减学习率按指数函数进行衰减AdaGrad数学原理代码演示class AdaGrad: #初始化 def __init__(self,lr0.01): self.lrlr self.hNone #更新方法 def update(self,params,grads): #对h进行初始化 if self.h is None: self.h{} for key,val in params.items(): self.h[key]np.zeros_like(val) #更新参数 for key in params.keys(): self.h[key]grads[key]*grads[key] params[key]-self.lr*(grads[key]/np.sqrt(self.h[key]1e-8))RMSProp数学原理代码演示只需对之前的数学公式部分稍加更改即可Adam数学原理与是偏差修正用来增加训练初期的启动速度。代码演示class Adam: #初始化 def __init__(self,lr0.01,alpha10.9,alpha20.999): self.lrlr self.alpha1alpha1 self.alpha2alpha2 self.vNone self.hNone self.iter0 #更新方法 def update(self,params,grads): #对每个v和h进行初始化 if self.v is None: self.v,self.h{},{} for key,val in params.items(): self.v[key]np.zeros_like(val) self.h[key] np.zeros_like(val) self.iter1 #按照公式改变学习率参数 aself.lr*np.sqrt(1-self.alpha2**self.iter)/(1-self.alpha1**self.iter) #按照公式更新参数 for key in params.keys(): self.v[key]self.alpha1*self.v[key](1-self.alpha1)*grads[key] self.h[key] self.alpha2 * self.h[key] (1 - self.alpha2) * (grads[key]**2) params[key]-a*self.v[key]/(np.sqrt(self.h[key])1e-8)

Mirascope：统一LLM接口框架，简化多模型AI应用开发

1. 项目概述：Mirascope，一个面向开发者的LLM统一接口框架如果你和我一样，在过去一两年里频繁地与各种大语言模型（LLM）打交道，从OpenAI的GPT系列到Anthropic的Claude，再到开源的Llama、Mistral&a…...

2026/5/6 6:58:30 阅读更多 →

为AI智能体构建持久化语义记忆系统：BrainDB架构与实战

1. 项目概述：为AI智能体构建一个持久、语义化的记忆系统如果你和我一样，长期在AI智能体（Agent）领域折腾，肯定遇到过这个核心痛点：会话一结束，智能体就“失忆”了。无论是重启会话、上下文窗口被…...

2026/5/6 6:58:28 阅读更多 →

从F-22到你的笔记本：揭秘‘不起眼’的吸波材料如何守护现代电子设备

从战机隐身到手机静默：解密吸波材料的民用进化史当F-22"猛禽"战斗机以雷达反射截面仅相当于一只蜂鸟的隐身性能震惊世界时，很少有人注意到，同样的核心技术正悄然守护着我们口袋里的智能手机。这些看似普通的黑色泡棉和橡胶垫&…...

2026/5/6 6:57:27 阅读更多 →

10分钟掌握NSC_BUILDER：Switch游戏文件管理终极指南

10分钟掌握NSC_BUILDER：Switch游戏文件管理终极指南【免费下载链接】NSC_BUILDER Nintendo Switch Cleaner and Builder. A batchfile, python and html script based in hacbuild and Nuts python libraries. Designed initially to erase titlerights encryption…...

2026/5/5 18:36:38 阅读更多 →

适合学校行政校内会议场景的，学校会议转行动项整理技巧

2026年多数学校都在推校内工作闭环管理，行政校内会议结束后，最头疼的就是从一堆零散讨论里整理出可落地的行动项，漏项、错记责任人、错过截止时间都是常事，还给后续工作埋坑，这里给你一套可直接落地的整理技巧。某区公…...

2026/5/5 15:19:54 阅读更多 →

Degrees of Lewdity汉化版终极完整指南：从零开始的中文化体验之旅

Degrees of Lewdity汉化版终极完整指南：从零开始的中文化体验之旅【免费下载链接】Degrees-of-Lewdity-Chinese-Localization Degrees of Lewdity 游戏的授权中文社区本地化版本项目地址: https://gitcode.com/gh_mirrors/de/Degrees-of-Lewdity-Chinese-Locali…...

2026/5/5 11:20:17 阅读更多 →