资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

图像分类导入已标注数据

目录

  1. 导入已标注数据方式说明
  2. 从本地导入已标注数据
  3. 从已有数据集导入已标注数据
  4. 查看已标注数据

导入已标注数据方式说明

如果您已有标注好的数据,可以在BML平台直接导入,方便直接进入后续训练环节。
向选定的数据集导入已标注好的数据有两种方式:
1、将单张图片和对应图片的标注信息以json格式上传
2、将BML其他数据集已经标注好的数据导入

从本地导入已标注数据

图像分类数据从本地导入已标注好的数据,支持整体以一个.zip格式的压缩包上传。单次上传压缩包整体大小不超过5G
注意,为了使平台能正确解析标注图片,请按照以下方式整理标注文件再打包上传

image.png

1、图片及对应的标注文件一一对应,是文件名需要完全相同,否则会导入失败

  • 图片格式要求
  1. 图片类型为jpg/png/ bmp/jpeg 。
  2. 图片大小限制在4M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
  3. 每个账户图片数据量限制为20w张,超出后可被忽略。如需扩容,请提交工单申请
  • 特别注意:
  • 对同一数据集存在多个内容完全一致的图片,将会做去重处理。
  • 为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致

image.png

2、json文件内容格式示例如下:

单图单标签

{ 
    "labels": 
    [
        {"name": "Drama"}
    ]
}

单图多标签

{ 
    "labels": 
    [
        {"name": "Drama"},
        {"name": "Romance"}
    ]
}

从已有数据集导入已标注数据

从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。

image.png

查看已标注数据

导入数据完成后,可以在数据集查看-已标注查看到分标签的图片列表

image.png

上一篇
数据服务简介
下一篇
导入未标注数据