Gradient Descent_Math問題
2019/09/28 下午 04:05
機器學習共學討論版
陳裕興
觀看數:11
回答數:1
收藏數:0
ml100-2
ml100-2-d74
以下有幾個程式問題
1. Z[j][i] = Z[j][i]/len(x_data) 這裡的用意是?
2. b和w進行更新這個能理解,但是以下的用途是什麼,後續也沒看到有在使用
lr_b = lr_b + b_grad ** 2
lr_w = lr_w + w_grad ** 2
3. 最後畫這個圖的用意是什麼?如何去解釋這張圖呢
回答列表
-
2019/09/28 下午 07:47陳明佑 (Ming You Chen)贊同數:0不贊同數:0留言數:0
這邊的寫法,
lr_b 與 lr_w 看起來意思是 momentum 的 learning rate 寫法
這個範例當中, 這兩項確實是沒有作用
但是下方的 b 與 w 更新時, 如果分別以 lr_b, lr_w 取代 lr
就會變成學習速率可變動的學習模式了