笔趣阁www.biquba.vip

笔趣阁 > 都市小说 > 职场小聪明 > 第914章梯度下降

第914章梯度下降（2 / 2）

上一页 ← 章节目录 → 下一章

推荐阅读: 武林神话从机关兽开始天锁斩龙捡到一个玄幻世界双穿：末世吞噬异能，都市做男神我的武学加点面板姜凡考300分五百年科技的小说重生！被疯批影后缠上遇见向阳的你冬夜的黑道生涯重生红楼之庶子贾环

[笔趣ba] biquba.vip 天才一秒记住！

好的，我就接着往下深入，把梯度下降从“形象理解 → 数学逻辑 → 哲学启发”串起来。

?

一、梯度下降的三种形态

其实“梯度下降”不止一种，而是演化出了多种版本。

1. 批量梯度下降（Batch Gradient Descent）

? 每次都用所有数据来计算梯度。

? 好处：方向最准确。

? 坏处：数据量大时计算太慢，容易卡在某个方向不动。

2. 随机梯度下降（SGD）

? 每次只用一条数据来更新参数。

? 好处：快，而且因为有“随机性”，能跳出局部低谷。

? 坏处：路径会抖动，就像你在碗底不断乱蹦，但平均方向是对的。

3. 小批量梯度下降（Mini-Batch Gradient Descent）

? 折中方案，每次取几十到几百条数据更新。

? 好处：速度和稳定性兼顾。

? 这也是现代深度学习中最常用的做法。

所以你可以把梯度下降想象成：

? 批量：像一个人走路前先把所有地图看清楚。

? 随机：像一个盲人摸索着走，虽然乱七八糟，但大方向对。

? 小批量：像一个人拿着指南针，每次用部分信息修正方向，既快又稳。

?

二、学习率的智慧

在梯度下降里有个很关键的参数：学习率（Learning Rate）。

? 如果学习率太大，就像球从碗的一边跳到另一边，永远落不到底，甚至越跳越高。

? 如果学习率太小，就像蚂蚁往碗底爬，虽然方向正确，但走到天荒地老也到不了底部。

所以，人类在调参时，其实就是在控制“学习节奏”。

这跟人学习知识很像：

? 学得太快，不扎实，容易反弹。

b𝑰 𝕢u b𝒜.v 𝑰 P

章节报错(免登录)

上一页 ← 章节目录 → 下一章

最新小说: 鬼媒天才少女，她是黑暗克星佑君安谁伴我封神识迹高维崩塌，不愿献身的我提前灭世锦丝行芙蓉灯下骨重生80：靠赶海带娇妻奔小康重生93：从高考状元开始