资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

数据增强

目录

1.创建数据增强任务
2.查看数据增强任务

增强任务管理

数据增强是对数据进行扩充、提升样本丰富度的有效手段。当在实践中无法收集到数目庞大的高质量数据时,可以通过数据增强策略,对数据本身进行一定程度的扰动和扩充,从而产生"新"数据。在训练时会通过学习大量的"新"数据,提高模型的泛化能力。

截屏2022-05-30 下午4.08.19.png

创建数据增强任务

  1. 进入百度EasyData首页,点击导航栏的数据处理
  2. 选择“数据处理>增强任务管理”,进入“数据增强任务列表”页面。
    截屏2022-05-30 下午2.01.35.png
  3. 点击“新建增强任务”,进入创建数据增强任务页面,填写配置信息,包括:
    截屏2022-05-30 下午2.00.10.png

    • 数据标注类型:目前增强任务仅支持图片类数据,请选择图片类型下的具体标注类型,当前支持类型有图像分类、物体检测(仅支持矩形框标注)、图像分割。
    • 选择数据集:选择数据增强的输入输出数据集和对应版本。当数据集为已标注数据时,可选择部分标签。 增强任务未结束之前,该数据集会暂时锁定,期间⽆法对其进⾏导⼊导出等操作,以及开启数据清洗、智能标注或多⼈标注任务。
    • 选择增强算子:在选择好标注类型和数据集后,会对应展示该类别下可用的数据增强算子。点击算子名称或“效果展示”,可查看各个算子的图文示例。
      截屏2022-05-30 下午4.12.03.png
    • 选择算子处理策略:当前提供两种算子处理策略,分别为串行叠加和并行遍历。选择算子完成后,平台会给出提示:当前账号下已有xx张图⽚,预计该次任务会产⽣xx张新图⽚,个⼈账号的图⽚数上限为20w张,请保证有⾜够的空间存放增强后数据集。

      串行叠加截屏2022-05-30 下午4.12.49.png

      并行遍历截屏2022-05-30 下午4.13.05.png
  4. 完成配置后点击“提交”,完成数据增强任务的创建。
  5. 返回“数据增强任务列表”页面
    截屏2022-05-30 下午2.01.35.png

查看数据增强任务

查看数据增强任务的基本信息,包括当前任务的序号、增强类型以及对应的算子列表和算子处理策略、任务的开始时间、增强前数据集、增强后数据集以及当前的任务状态等。

  1. 选择“数据处理>增强任务管理”,进入“数据增强任务列表”页面。
  2. 点击“查看详情“,可查看当前任务的详细信息。
    截屏2022-05-30 下午4.03.56.png
    3.点击增强结果中保存后的数据集链接,进入数据集:
    截屏2022-05-30 下午4.51.00.png
    4.进入筛选,选择数据来源“数据增强”并点击完成,即可展示出任务生成的增强后图片,此时可进行人工的查看与审核。
    截屏2022-05-30 下午4.52.21.png
上一篇
数据标注
下一篇
联系我们