资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

图片数据导入

目录

  1. 导入未标注数据
  2. 导入已标注数据

导入未标注数据

为选定的图像数据集导入未标注数据(即原始图片)的方式有两种。一种为从本地选择图片文件;一种为从线上【EasyData-数据服务】中其余同为图片类型数据集中导入。

从本地上传图片导入

选择未标注数据-本地-上传图片,点击上传图片后选择本地图片文件进行导入。
数据格式要求
1、图片类型为jpg/png/bmp/jpeg ,单次上传限制100个文件。
2、图片大小限制在14M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
3、单个数据集大小限制为10万图片,超出后可被忽略。
特别注意:
—对同一数据集存在多个内容完全一致的图片,将会做去重处理
—为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致

image.png

image.png

从本地上传压缩包导入

选择未标注数据-本地-上传压缩包,点击上传压缩包后选择本地图片压缩包完成数据的批量导入。
数据格式要求
1、压缩包仅支持zip格式,大小限制5GB以内
2、压缩包内图片格式要求为:图片类型为jpg/png/bmp/jpeg,图片大小限制在14M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
3、单个数据集大小限制为10万图片,超出后可被忽略。
特别注意:
—对同一数据集存在多个内容完全一致的图片,将会做去重处理
—为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致

image.png

导入线上已有数据

选择未标注数据-已有数据集-导入已有数据集,支持将已经上传在其他EasyData同为图片类的数据集进行导入。在视觉任务中往往会有存在更换模型类型的可能性,比如某个业务场景问题既可以用图像分类解决又可以用物体检测解决,通过这个功能可以有效地快速切换数据类型,分别测试效果。

由于这里选择上传的是未标注数据,那么在导入线上已有数据的情况下,可以选择导入同为图片类型数据集的全部数据但去掉标注;或者选择未被标注的部分。

image.png

导入摄像头采集数据

选择导入摄像头采集数据,跳转至摄像头原始数据页面,选择设备及时间后,点击【保存至数据集】 了解如何从摄像头采集数据

image.png

image.png

导入云服务数据回流数据

选择云服务调用数据,可以导入云服务调用的原始数据。

说明:【云服务数据回流数据】是指通过在实际业务系统中集成云服务接口(目前支持EasyDL云服务接口、BML云服务接口),同时开通服务后,可以将接口的图片上传在EasyData平台中来。注意:当导入数据标注类型选择了无标注信息,则仅导入原始数据

image.png

导入已标注数据

导入图像分类已标注数据

从本地导入

图像分类数据从本地导入已标注好的数据,支持整体以一个.zip格式的压缩包上传。单次上传压缩包整体大小不超过5G
注意,为了使平台能正确解析标注图片,请按照以下方式整理标注文件再打包上传

image.png

1、图片及对应的标注文件一一对应,是文件名需要完全相同,否则会导入失败

  • 图片格式要求
  1. 图片类型为jpg/png/ bmp/jpeg 。
  2. 图片大小限制在14M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
  3. 单个数据集大小限制为10万图片,超出后可被忽略。
  • 特别注意:
  • 对同一数据集存在多个内容完全一致的图片,将会做去重处理。
  • 为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致

image.png

2、json文件内容格式示例如下:

单图单标签

{ 
    "labels": 
    [
        {"name": "Drama"}
    ]
}

单图多标签

{ 
    "labels": 
    [
        {"name": "Drama"},
        {"name": "Romance"}
    ]
}

从已有数据集导入已标注数据

从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。

image.png

导入物体检测已标注数据

从本地导入已标注数据

物体检测数据从本地导入已标注好的数据,支持整体以一个.zip格式的压缩包上传。单次上传压缩包整体大小不超过5G
注意,为了使平台能正确解析标注图片,请按照以下方式整理标注文件再打包上传

image.png

1、图片及对应的标注文件一一对应,是文件名需要完全相同,否则会导入失败

  • 图片格式要求
  1. 图片类型为jpg/png/ bmp/jpeg 。
  2. 图片大小限制在14M内,长宽比在3:1以内,其中最长边需要小于4096px,最短边需要大于30px。
  3. 单个数据集大小限制为10万图片,超出后可被忽略。
  • 特别注意:
  • 对同一数据集存在多个内容完全一致的图片,将会做去重处理。
  • 为保证模型训练效果,所上传的图片应与实际业务场景的图片(光线、角度、采集设备)尽可能一致。
  • 单张图片中的标注框须限制在500个之内。如有特殊需求,请通过提交工单咨询。

image.png

2、json文件内容格式示例如下:

矩形框标注

{

	"labels":[	
		{
		     "name":"car",
		     "x1":278.7673,
		     "y1":38.76027,
		     "x2":328.51887,
		     "y2":101.77642
		},
   	    {		
			"name":"car",
			"x1":333.0601,
			"y1":56.9776,
			"x2":378.78652,
			"y2":126.21715
		}
	]
}

其中x1、y1、x2、y2含义如下
x1:目标定位位置的长方形左上顶点的水平坐标
y1:目标定位位置的长方形左上顶点的垂直坐标
x2:目标定位位置的长方形右下顶点的水平坐标
y2:目标定位位置的长方形右下顶点的垂直坐标

image.png

从已有数据集导入

从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。

image.png

上一篇
数据查看
下一篇
文本数据导入