
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
我会使用尽量少的数学符号描述 梯度, 着重于意义而非计算。一个直观的例子,在机器学习领域有个术语叫「梯度下降」,你可以想象在群山之中,某个山的半山腰有只小兔子打算使用梯度 …
非凸优化基石:Lipschitz Condition
在绝大多数的非凸优化的论文里,一般不出现Lipschitz continuous, 一般出现的都是 Lipschitz continuous gradient 或者 Lipschitz continuous Hessian, 那他们是什么意思呢? 其实Lipschitz …
机器学习 | 近端梯度下降法 (proximal gradient descent)
近端梯度下降法是众多梯度下降 (gradient descent) 方法中的一种,其英文名称为proximal gradident descent,其中,术语中的proximal一词比较耐人寻味,将proximal翻译成“近端”主要 …
温故知新——梯度下降(Gradient Descent) - 知乎
梯度下降(Gradient Descent)又称最速下降,是迭代法的一种,可以用于求解最小二乘法(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient …
梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …
这篇回答节选自我的专栏 《机器学习中的数学:微积分与最优化》,和大家一起谈谈方向导数和梯度。 欢迎关注我的知乎账号 @石溪 ,将持续发布机器学习数学基础及算法应用等方面的精彩 …
优化中常出现的oracle应该怎么理解? - 知乎
我还专门问了我的导师,我的导师的原话是: Oracle means the function value feedback provider, thus ZO oracle means the black-box prediction system itself. 翻译过来就是,oracle意味着不同 …
有没有人会zemax渐变折射率面型的设置方法,具体参数都是什么 …
在爱特蒙特光学的官网可以下载渐变折射率透镜的ZEMAX文件,去年下半年我也在研究GRIN透镜在ZEMAX的建模,目前还没搞懂。 Gradient Index Rod Lenses – GRIN Rod Lenses | 爱特蒙 …
Inception家族进化史「GoogleNet、Inception、Xception」
Jan 23, 2024 · 网络架构 GoogLeNet具有9个Inception模块,22层深(27层包括pooling),并在最后一个Inception模块使用全局池化。 由于网络深度,将存在梯度消失 vanishing gradient 的问 …
为什么我觉得LLMs的RL不是“真的”RL,就是监督学习? - 知乎
RL大致可分为2个流派,策略梯度(policy gradient)和动作价值 (Q-learning)。 LLM的RL一般都是policy gradient,因为LLM本身就是策略模型,输出结果经过reward打分之后,给出模型参数的 …
PyTorch中在反向传播前为什么要手动将梯度清零? - 知乎
optimizer.zero_grad ():清空过往梯度 model.forward ():前向推理,计算损失函数; loss.backward ():反向传播,计算当前梯度; optimizer.step ():多次循环步骤 2-3,梯度累加 …