正版 强化学习 前沿算法与应用 白辰甲 赵英男 郝建业 刘鹏 震 值函数 策略梯度 值分布建模 算法 多目标 层次化 技能 - Tapa blanda

 
9787111724780: 正版 强化学习 前沿算法与应用 白辰甲 赵英男 郝建业 刘鹏 震 值函数 策略梯度 值分布建模 算法 多目标 层次化 技能