作者:ANKIT CHOUDHARY

翻译:张睿毅

校对:吴金笛

文章来源:微信公众号 数据派THU

本文4300字,建议阅读10+分钟。

本文作者通过实战介绍了Deep Q-Learning的概念。


导言

我一直对游戏着迷。在紧凑的时间线下执行一个动作似乎有无限的选择——这是一个令人兴奋的体验。没有什么比这更好的了。

所以当我读到DeepMind提出的不可思议的算法(如AlphaGo和AlphaStar)时,我被吸引了。我想学习如何在我自己的机器上制造这些系统。这让我进入了深度强化学习(Deep RL)的世界。

即使你不喜欢玩游戏,深度强化学习也很重要。只用看当前使用深度强化学习进行研究的各种功能就知道了:

image.png

那工业级应用程序呢?这里有两个最常见的深度强化学习用例:

  • 谷歌云自动机器学习(Google’s Cloud AutoML)
  • 脸书Horizon平台
收藏 打印