作者:闲鱼技术-楚丰
在 UI2CODE 项目中,我们大量使用了深度学习方法来做一些物体检测。而深度学习模型的训练,避免不了需要大量的样本,因此如何制造大量样本,来满足模型训练需要是我们必须要解决的一个问题。在这篇文章中,我们将介绍我们如何利用工具,批量泛化出大量样本,为模型训练提供数据保障。
1.样本现状
我们的模型要解决的问题是在一个设计稿图片上识别出基础控件等信息,包括位置和类别。而它所需要的样本,主要存在两个问题:
- 数据量少:一个APP的页面是有限的,特别是针对单个APP做优化适配的时候,页面的数量是相对较少的,可能在几十到上百个。而模型的对样本数量的需求是巨大的,特别像较为复杂的模型,对数据量的要求至少是万级别的,单靠真实样本,是远远达不到要求的。
- 标注成本高:物体检测的样本标注,不仅需要标注物体的类别,更需要标注出物体的具体位置
继续阅读与本文标签相同的文章
上一篇 :
CentOs7.3用yum方式安装Nginx
下一篇 :
IoT物联网平台运行监控最佳实践
-
SEO怎么避免过度优化风险?如何判断网站是否优化过度
2026-05-21栏目: 教程
-
在Java大环境下.NET程序员如何夺得一线生机
2026-05-21栏目: 教程
-
MessagePack Java 0.6.X 不使用注解(annotations)来序列化
2026-05-21栏目: 教程
-
C#开发可播放摄像头及任意格式视频的播放器
2026-05-21栏目: 教程
-
Java虚拟机详解(四)------垃圾收集器
2026-05-21栏目: 教程
