数据增强
更新时间:2022-06-08
目录
增强任务管理
数据增强是对数据进行扩充、提升样本丰富度的有效手段。当在实践中无法收集到数目庞大的高质量数据时,可以通过数据增强策略,对数据本身进行一定程度的扰动和扩充,从而产生"新"数据。在训练时会通过学习大量的"新"数据,提高模型的泛化能力。
创建数据增强任务
- 进入百度EasyData首页,点击导航栏的数据处理
- 选择“数据处理>增强任务管理”,进入“数据增强任务列表”页面。
-
点击“新建增强任务”,进入创建数据增强任务页面,填写配置信息,包括:
- 数据标注类型:目前增强任务仅支持图片类数据,请选择图片类型下的具体标注类型,当前支持类型有图像分类、物体检测(仅支持矩形框标注)、图像分割。
- 选择数据集:选择数据增强的输入输出数据集和对应版本。当数据集为已标注数据时,可选择部分标签。 增强任务未结束之前,该数据集会暂时锁定,期间⽆法对其进⾏导⼊导出等操作,以及开启数据清洗、智能标注或多⼈标注任务。
- 选择增强算子:在选择好标注类型和数据集后,会对应展示该类别下可用的数据增强算子。点击算子名称或“效果展示”,可查看各个算子的图文示例。
- 选择算子处理策略:当前提供两种算子处理策略,分别为串行叠加和并行遍历。选择算子完成后,平台会给出提示:当前账号下已有xx张图⽚,预计该次任务会产⽣xx张新图⽚,个⼈账号的图⽚数上限为20w张,请保证有⾜够的空间存放增强后数据集。
串行叠加:
并行遍历:
- 完成配置后点击“提交”,完成数据增强任务的创建。
- 返回“数据增强任务列表”页面
查看数据增强任务
查看数据增强任务的基本信息,包括当前任务的序号、增强类型以及对应的算子列表和算子处理策略、任务的开始时间、增强前数据集、增强后数据集以及当前的任务状态等。
- 选择“数据处理>增强任务管理”,进入“数据增强任务列表”页面。
- 点击“查看详情“,可查看当前任务的详细信息。
3.点击增强结果中保存后的数据集链接,进入数据集:
4.进入筛选,选择数据来源“数据增强”并点击完成,即可展示出任务生成的增强后图片,此时可进行人工的查看与审核。