PyTorch快餐教程2019 (1) - 从Transformer说起

浏览：176 2026-05-17

PyTorch快餐教程2019 (1) - 从Transformer说起

深度学习已经从热门技能向必备技能方向发展。然而，技术发展的道路并不是直线上升的，并不是说掌握了全连接网络、卷积网络和循环神经网络就可以暂时休息了。至少如果想做自然语言处理的话并非如此。

2017年，Google Brain的Ashish Vaswani等人发表了《Attention is all you need》的论文，提出只用Attention机制，不用RNN也不用CNN，就可以做到在WMT 2014英译德上当时的BLEU最高分28.4.

RNN机器翻译简史

在Transformer模型被提出之前，机器翻译一直是以RNN为主。
使用的工具是著名的RNN的两个改进版，1997年提出的长短时记忆网络LSTM和2014年提出的门控循环单元GRU。这三种实现均在torch

继续阅读与本文标签相同的文章

None

上一篇 :

云栖大会SaaS加速器专场 | 阿里云朱以军：阿里云心选——面向渠道商的商业红利

下一篇 :

[转]2019年爆红的5大商机，都是韭菜收割机？

热门标签

1阻止表单提交 1篇

3关闭浏览器 1篇

6css文件 1篇

7光标位置 1篇

9javascrpt 1篇

10!important 1篇

11超链接 2篇

14自定义 1篇

20自动填充 1篇

21html敏捷包 1篇

23水平垂直居中 1篇

24百分比 1篇

25placeholder 1篇

26相同高度 2篇

27并排div 2篇

29innerHTML 1篇

30pdf文件 1篇

31html文件 1篇

32选择框 1篇

33屏幕可见区 1篇

34DOM元素 2篇

您的足迹：