About 28,800,000 results
Open links in new tab
  1. 梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …

    我会使用尽量少的数学符号描述 梯度, 着重于意义而非计算。一个直观的例子,在机器学习领域有个术语叫「梯度下降」,你可以想象在群山之中,某个山的半山腰有只小兔子打算使用梯度 …

  2. 梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …

    为了降低随机梯度的方差,从而使得迭代算法更加稳定,也为了充分利用高度优化的矩阵运算操作,在实际应用中我们会同时处理若干训练数据,该方法被称为小批量梯度下降法 (Mini- Batch …

  3. 如何理解 natural gradient descent? - 知乎

    看到一篇文章写得非常浅显易懂: What is the natural gradient, and how does it work? 总结一下: 拿神经网络中的反向传播算法举例,我们计算各个权值w关于损失函数的导数,得到一个梯度 …

  4. 如何理解策略梯度(Policy Gradient)算法? - 知乎

    Actor-Critic算法结合了策略梯度(Policy Gradient)方法和值函数估计的优点,旨在通过两个不同的神经网络来学习:一个用于学习策略(Actor),另一个用于评估状态的价值(Critic)。

  5. 梯度(gradient)到底是个什么东西?物理意义和数学意义分别是 …

    Dec 2, 2020 · 梯度是雅可比矩阵的一种特殊形式,当m=1时函数的雅可比矩阵就是梯度,这个概念原是为场论设定的,任何场都可以用来理解梯度,后来被引用到数学中用来指明函数在指定点 …

  6. 如何理解随机梯度下降(stochastic gradient descent,SGD)?

    随机梯度下降 Stochastic Gradient Descent SGD (Vinilla基础法/Momentum动量法) 一开始SGD没有动量,叫做Vanilla SGD,也就是没有之前时刻的梯度信息。

  7. 知乎盐选 | 5.1.2 深入了解 radial-gradient ()径向渐变

    5.1.2 深入了解 radial-gradient ()径向渐变 径向渐变指的是从一个中心点向四周扩散的渐变效果,光的扩散、波的扩散等都有径向渐变的特性。

  8. R语言机器学习实战系列教程 - 知乎

    R语言机器学习算法实战系列(一)XGBoost算法+SHAP值(eXtreme Gradient Boosting) R语言机器学习算法实战系列(二) SVM算法+重要性得分(Support Vector Machine) R语言机器 …

  9. 机器学习2 -- 优化器(SGD、SGDM、Adagrad、RMSProp、Adam)

    Apr 6, 2024 · 1 主要优化器 1.1 SGD SGD全称Stochastic Gradient Descent,随机梯度下降,1847年提出。每次选择一个mini-batch,而不是全部样本,使用梯度下降来更新模型参数。 …

  10. 如何理解 natural gradient descent? - 知乎

    如何理解 natural gradient descent? natural gradient descent 就是在把gradient乘上一个fisher information matrix的逆,感觉有点像牛… 显示全部 关注者 596 被浏览