复杂应用中运用人工智能核心 强化学习
近期,有不少报道强化学习算法在 GO、Dota 2 和 Starcraft 2 等一系列游戏中打败了专业玩家的新闻。强化学习是一种机器学习类型,能够在电子游戏、机器人、自动驾驶等复杂应用中运用人工智能。在状态和动作空间较大、环境信息不完善并且短期动作的长期回报不确定的游戏中,这些程序可以找出最佳动作。 不只是游戏王者,强化学习作为机器学习的一个分支,在真实系统设计中,它能帮助您针对复杂系统(如机器
强化学习
与非网 . 2020-07-27 1340
树枝也能制造机器人?日本创新机器人自主学会走路
树枝也能制造机器人?近日,日本研究人员公开了一种使用树枝制造而成的机器人,可以通过强化学习,学会自主移动。 7月8日消息,近日,东京大学和日本AI创企Preferred Networks的研发人员制作了一种使用树枝制作的机器人。 他们将野外捡回的树枝称重,并进行3D扫描后,将这些树枝用3D打印的连接器与伺服舵机相连,成为树枝机器人。 由于材料的特殊性,树枝机器人不能通过计算机编程学会前进,只能通过
机器人
YXQ . 2019-07-09 870
你们不是嫌弃世界冠军OG团队实力太水吗?“你行你上”的机会来了
你们不是嫌弃世界冠军 OG 团队实力太水吗?“你行你上”的机会来了。 4 月 14 日凌晨,OpenAI Five 以 2:0 击败了 DOTA 世界冠军团队 OG 引发热议。比赛当天,OpenAI 也宣布要开放 OpenAI Five 竞技场模式,让每个感兴趣的人都参与其中。 4 月 18 日(太平洋标准时间)下午 6 点,OpenAI 如约开放了这一模式,全世界各路玩家都可以免费进行体验。开放
机器人
lp . 2019-04-22 1290
谷歌提出元奖励学习,两大基准测试刷新最优结果
RL算法由于奖励不明确,智能体可能会收到“利用环境中的虚假模式”的正反馈,这就有可能导致奖励黑客攻击。谷歌提出了使用开发元奖励学习(MeRL)来解决未指定奖励的问题,通过优化辅助奖励函数向智能体提供更精确的反馈。 强化学习(RL)为优化面向目标的行为,提供了统一且灵活的框架。 并且在解决诸如:玩视频游戏、连续控制和机器人学习等具有挑战性的任务方面,取得了显着成功。 RL算法在这些应用领域的成功
谷歌
lq . 2019-02-24 820
深度强化学习打造的ANYmal登上Science子刊,真的超越了波士顿动力!
深度强化学习开发出的机器人模型通常很难应用到真实环境中,因此机器人开发中鲜少使用该技术。然而这已经板上钉钉了吗?在两天前引发人工智能界关注的 ANYmal 机器人中,其机动性和适应性看起来丝毫不逊色于波士顿动力。其相关论文近期登上了 Science 子刊《Science Robotics》,并且明确指出使用了深度强化学习技术。基于 AI 技术的成功应用,ANYmal 在数据驱动的开发上或许会更有优
强化学习
lq . 2019-01-28 935
逆天了!跟波士顿动力机器狗有得一拼
瑞士苏黎世机器人系统实验室为他们的ANYmal机器狗开发了新的训练方法,利用强化学习,机器人学习的速度提升了1000倍,动作灵活性和速度都大幅增强,而且任踢不倒,或者在哪里跌倒就在哪里站起。 一提到机器狗,大家可能首先想到的是波士顿动力的SpotMini。 这只黄色小狗会跑会跳,还会上下楼梯,随音乐热舞,崎岖地面行走如履平地,甚至还会帮“兄弟”开门,简直成精了!难怪每回波士顿动力放出新视频都会抢尽
强化学习
lq . 2019-01-21 1060
史上最强棋类AI降临!也是迄今最强的棋类AI——AlphaZero
DeepMind最强棋类算法AlphaZero今天以Science封面论文形式发表。David Sliver、哈萨比斯等人亲自撰文解读这一棋类终极算法,以及实现通用学习系统的重要一步。 史上最强棋类AI降临! 今天,DeepMind的通用棋类算法,也是迄今最强的棋类AI——AlphaZero,经过同行评议,被顶级期刊 Science 以封面论文的形式,正式引入学界和公众的视野。 一年前,DeepM
AI
lq . 2018-12-08 2385
AlphaGo首席研究员谈强化学习十大黄金法则!
近日,谷歌DeepMind强化学习研究团队负责人、AlphaGo项目首席研究员Dave Silver在Deep Learning Indaba活动的主题演讲中归纳出了强化学习中要注意的10大要点。一起来看看,也许能少走点弯路。 近日,在南非斯泰伦博斯举行的Deep Learning Indaba活动上,谷歌DeepMind强化学习研究团队负责人、AlphaGo项目首席研究员Dave Silver在
谷歌
未知 . 2018-09-17 900
- 1