Uber发布的CoordConv遭深度质疑，“翻译个坐标也需要训练？”

浏览：187 2026-06-02

前几天，Uber AI实验室发布了一篇非常瞩目的论文，说卷积神经网络 (CNN) 在一些很简单很直接的任务里面，会失守。

比如，一张白色图片，上面有个黑点。给CNN喂食这个点的 (i,j) 坐标，它就是画不出原来那幅图。

总结起来，监督渲染、监督坐标分类，以及监督回归，对CNN来说都是大难题。

于是，团队提出了CoordConv，来回收这些失陷的领土。

不过很快，这篇论文，和拯救CNN的主角CoordConv，就被一篇有点长的博文“鞭尸”了。

博客的主人Filip Piekniewski (暂称菲菲) 说，他给这项研究做了尸检。

加个特征，而已

首先，关于 (上文白纸黑点) 定位问题，Uber团队发现，CNN不擅长把笛卡尔坐标 (i,j) 转换成独热像素空间 (One-Hot Pixel Space) 里的位置。

菲菲提到，CNN的结构，从

继续阅读与本文标签相同的文章

None

上一篇 :

React 列表、键值与表单

下一篇 :

用proxy实现一个更优雅的vue

热门标签

1阻止表单提交 1篇

3关闭浏览器 1篇

6css文件 1篇

7光标位置 1篇

9javascrpt 1篇

10!important 1篇

11超链接 2篇

14自定义 1篇

20自动填充 1篇

21html敏捷包 1篇

23水平垂直居中 1篇

24百分比 1篇

25placeholder 1篇

26相同高度 2篇

27并排div 2篇

29innerHTML 1篇

30pdf文件 1篇

31html文件 1篇

32选择框 1篇

33屏幕可见区 1篇

34DOM元素 2篇

您的足迹：