OpenAI今天宣布推出Spinning Up,这是一个旨在教授任何深度强化学习的计划。
OpenAI以在虚拟环境中制作看似时髦的代理而闻名,这些代理学习如何自行走,例如与华盛顿大学合作的Humanoid v2或POLO。
强化学习包括在激励的环境中向代理提供奖励信号,以最大化其奖励以实现目标。
RL在主要的AI突破中发挥了作用,例如Google DeepMind的AlphaGo和在Dota 2等环境中受过培训的代理商。
Spinning Up包括一系列重要的强化学习研究论文,理解RL所必需的术语表,以及一系列运行练习的算法。
该计划的目的不仅是帮助人们了解强化学习是如何运作的,而且是为了通过让更多来自计算机科学领域的人参与安全地创建人工智能(AGI)来实现OpenAI的总体目标。
“解决人工智能安全问题需要具备广泛专业知识和观点的人才,许多相关专业与工程或计算机科学毫无关联。尽管如此,所涉及的每个人都需要充分了解技术以做出明智的决策,以及需要的几个Spinning Up地址,“根据Spinning Up文档文本。
通过与OpenAI学者和研究员合作获得Spinning Up,他们对AI有着好奇的兴趣,但在该领域缺乏经验。
除了在安全部署AGI的目标方面取得进展之外,该计划的创建是因为目前没有单一的教科书可以提供实施强化学习所需的知识; 目前的知识被锁定在一系列不同的讲座和有影响力的研究论文中。
“所以我们这里的套餐旨在成为那些深受RL激动的人们的缺失中间步骤,并希望学习如何使用它或做出贡献,但是没有明确的学习内容或如何将算法转化为代码。我们试图使这个作为一个有用的启动点,“ 项目页面读取。
Spinning Up计划是OpenAI打算提供的更多教育服务的一部分。Spinning Up研讨会将于2019年2月举行,另一个研讨会将与 加州大学伯克利分校的人类兼容AI(CHAI)中心共同举办。
继续阅读与本文标签相同的文章
-
中国工程院院士谈5G辐射:5G基站更密集 比微波炉辐射更低
2026-05-14栏目: 教程
-
当年那个说要“毁灭人类”的女机器人,如今怎么样了呢?变化真大
2026-05-14栏目: 教程
-
无法复制网页上的文本?学会这5种方法,轻松免费复制
2026-05-14栏目: 教程
-
智能资产与工业物联网!你了解多少
2026-05-14栏目: 教程
-
QQ迎来内测更新,加入了5个新功能!
2026-05-14栏目: 教程
