logo
Loading...

Dueling Network (价值学习高级技巧 3/3) - Shusen Wang - 深度學習 Deep Learning 公開課 - Cupoy

这节课介绍 Dueling Network,它是 DQN 网络结构的改进。它把动作价值 Q 分解成状态价值 V 和优势函数 A。

这节课介绍 Dueling Network,它是 DQN 网络结构的改进。它把动作价值 Q 分解成状态价值 V 和优势函数 A。