智能体-芯查查

你们不是嫌弃世界冠军OG团队实力太水吗？“你行你上”的机会来了

你们不是嫌弃世界冠军 OG 团队实力太水吗？“你行你上”的机会来了。 4 月 14 日凌晨，OpenAI Five 以 2:0 击败了 DOTA 世界冠军团队 OG 引发热议。比赛当天，OpenAI 也宣布要开放 OpenAI Five 竞技场模式，让每个感兴趣的人都参与其中。 4 月 18 日（太平洋标准时间）下午 6 点，OpenAI 如约开放了这一模式，全世界各路玩家都可以免费进行体验。开放

机器人

lp . 2019-04-22 1450
谷歌提出元奖励学习，两大基准测试刷新最优结果

RL算法由于奖励不明确，智能体可能会收到“利用环境中的虚假模式”的正反馈，这就有可能导致奖励黑客攻击。谷歌提出了使用开发元奖励学习（MeRL）来解决未指定奖励的问题，通过优化辅助奖励函数向智能体提供更精确的反馈。强化学习（RL）为优化面向目标的行为,提供了统一且灵活的框架。并且在解决诸如：玩视频游戏、连续控制和机器人学习等具有挑战性的任务方面，取得了显着成功。 RL算法在这些应用领域的成功

谷歌

lq . 2019-02-24 970