作者: 文言AI
作者简介:
描述: 19.在强化学习中,当选择用策略梯度最大化期望奖励时,应该使用什么方法? 20.怎么理解策略梯度的公式呢?
上传者: 一英儿
上传者: 一物儿
上传者: 智东西
上传者: 布噜布噜你的头
上传者: 玩AI的秋名山车神
上传者: 爱吃炒煤的Zion
上传者: 文言AI
上传者: 一只wwy
上传者: 四脚包包
上传者: 老鸽子从不鸽
上传者: 高擎机电
上传者: 一木的AI工具库
上传者: 学AI的小魔女
上传者: 李小羊学AI
上传者: 人工智能-研究院
上传者: 言趣教育妍一老师
上传者: 科研火花