独家 | 使用Python的OpenAI Gym对Deep Q-Learning的实操介绍（附学习资源）

浏览：981 2026-05-19

作者：ANKIT CHOUDHARY

翻译：张睿毅

校对：吴金笛

文章来源：微信公众号数据派THU

本文4300字，建议阅读10+分钟。

本文作者通过实战介绍了Deep Q-Learning的概念。

导言

我一直对游戏着迷。在紧凑的时间线下执行一个动作似乎有无限的选择——这是一个令人兴奋的体验。没有什么比这更好的了。

所以当我读到DeepMind提出的不可思议的算法（如AlphaGo和AlphaStar）时，我被吸引了。我想学习如何在我自己的机器上制造这些系统。这让我进入了深度强化学习（Deep RL）的世界。

即使你不喜欢玩游戏，深度强化学习也很重要。只用看当前使用深度强化学习进行研究的各种功能就知道了：

那工业级应用程序呢？这里有两个最常见的深度强化学习用例：

谷歌云自动机器学习(Google’s Cloud AutoML)
脸书Horizon平台

继续阅读与本文标签相同的文章

None

上一篇 :

独家 | 一文教你如何处理不平衡数据集（附代码）

下一篇 :

JDK1.6 对 synchronized 的锁优化

热门标签

1阻止表单提交 1篇

3关闭浏览器 1篇

6css文件 1篇

7光标位置 1篇

9javascrpt 1篇

10!important 1篇

11超链接 2篇

14自定义 1篇

20自动填充 1篇

21html敏捷包 1篇

23水平垂直居中 1篇

24百分比 1篇

25placeholder 1篇

26相同高度 2篇

27并排div 2篇

29innerHTML 1篇

30pdf文件 1篇

31html文件 1篇

32选择框 1篇

33屏幕可见区 1篇

34DOM元素 2篇

您的足迹：