作者: 奇点迫近
作者简介: 以科学精神开拓文明边界 更多:http://v.dltheapk.com
描述: https://www.youtube.com/watch?v=xk8wHY1AFpI 更多:http://v.dltheapk.com/item/505 描述:在这个视频里,一个名为阿尔伯特的AI Warehouse代理学会了如何走上下楼梯,以及通过其他障碍物逃脱。该AI是通过深度强化学习进行训练的,这是一种机器学习方法,涉及奖励代理正确行为,并惩罚其任何错误行为。阿尔伯特的行动由一个神经网络控制,在每次尝试后更新,以试图随着时间的推移给予阿尔伯特更多奖励和更少的惩罚。检