笔趣阁 > 都市小说 > 职场小聪明 > 第914章 梯度下降

第914章 梯度下降(2 / 2)

[笔趣ba] biquba.vip 天才一秒记住!

好的,我就接着往下深入,把梯度下降从“形象理解 → 数学逻辑 → 哲学启发”串起来。

?

一、梯度下降的三种形态

其实“梯度下降”不止一种,而是演化出了多种版本。

1. 批量梯度下降(Batch Gradient Descent)

? 每次都用所有数据来计算梯度。

? 好处:方向最准确。

? 坏处:数据量大时计算太慢,容易卡在某个方向不动。

2. 随机梯度下降(SGD)

? 每次只用一条数据来更新参数。

? 好处:快,而且因为有“随机性”,能跳出局部低谷。

? 坏处:路径会抖动,就像你在碗底不断乱蹦,但平均方向是对的。

3. 小批量梯度下降(Mini-Batch Gradient Descent)

? 折中方案,每次取几十到几百条数据更新。

? 好处:速度和稳定性兼顾。

? 这也是现代深度学习中最常用的做法。

所以你可以把梯度下降想象成:

? 批量:像一个人走路前先把所有地图看清楚。

? 随机:像一个盲人摸索着走,虽然乱七八糟,但大方向对。

? 小批量:像一个人拿着指南针,每次用部分信息修正方向,既快又稳。

?

二、学习率的智慧

在梯度下降里有个很关键的参数:学习率(Learning Rate)。

? 如果学习率太大,就像球从碗的一边跳到另一边,永远落不到底,甚至越跳越高。

? 如果学习率太小,就像蚂蚁往碗底爬,虽然方向正确,但走到天荒地老也到不了底部。

所以,人类在调参时,其实就是在控制“学习节奏”。

这跟人学习知识很像:

? 学得太快,不扎实,容易反弹。

b𝑰  𝕢u  b𝒜.v  𝑰  P

章节报错(免登录)
最新小说: 鬼媒 天才少女,她是黑暗克星 佑君安 谁伴我封神 识迹 高维崩塌,不愿献身的我提前灭世 锦丝行 芙蓉灯下骨 重生80:靠赶海带娇妻奔小康 重生93:从高考状元开始