资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

音频数据导入


目录

  1. 导入未标注数据
  2. 导入已标注数据

导入未标注数据

为选定的图像分类数据集导入未标注数据(即原始音频)的方式有两种。一种为从本地选择音频文件;一种为从线上【EasyData-数据服务概览】中其余同为音频类型数据集中导入。

从本地上传音频导入

选择未标注数据-本地-上传音频,点击上传音频后选择本地音频文件进行导入。
数据格式要求
1、音频类型wav/mp3/m4a,单次上传限制100个文件
2. 单个音频文件大小限制在4M内,长度限制10s以内
3. 您的账户下数据集数量限制为10万个音频,如果需要提升数据额度,可在平台提交工单
特别注意:
—1、对同一数据集存在多个内容完全一致的音频,将会做去重处理。
—2、为保证模型训练效果,所上传的音频应与实际业务场景的音频(采集设备等)尽可能一致。

image.png

image.png

从本地上传压缩包导入

选择无标注信息-本地-上传压缩包,点击上传压缩包后选择本地音频压缩包完成数据的批量导入。
数据格式要求
1、压缩包仅支持zip格式,大小限制5GB以内
2、压缩包内音频类型wav/mp3/m4a,音频大小限制在4M内,长长度限制10s以内
3、单个数据集大小限制为10万音频,超出后可被忽略。
特别注意:
—对同一数据集存在多个内容完全一致的音频,将会做去重处理
—为保证模型训练效果,所上传的音频应与实际业务场景的音频(采集设备)尽可能一致

image.png

导入线上已有数据

选择无标注信息-已有数据集-导入已有数据集,支持将已经上传在其他Easydata同为音频的数据集进行导入。

image.png

导入已标注数据

导入音频分类有标注信息数据

从本地导入

音频分类数据从本地导入已标注好的数据,支持整体以一个.zip格式的压缩包上传。单次上传压缩包整体大小不超过5G
注意,为了使平台能正确解析标注音频,请按照以下方式整理标注文件再打包上传

  1. 上传已标注文件要求格式为zip格式压缩包,同时压缩包大小在5GB以内
  2. 压缩包内需要包括音频源文件(wav/mp3/m4a)及同名的json格式标注文件,详细请见示例压缩包
  3. 单音频文件类型wav/mp3/m4a,单文件大小限制在4M内,长度限制10s以内
  4. 您的账户下数据集数量限制为10万个音频,如果需要提升数据额度,可在平台提交工单
  • 特别注意:
  • 对同一数据集存在多个内容完全一致的音频,将会做去重处理。
  • 音频及对应的标注文件一一对应,是文件名需要完全相同,否则会导入失败
  • 为保证模型训练效果,所上传的音频应与实际业务场景的音频(采集设备)尽可能一致

2、json文件内容格式示例如下:

单图单标签

{ 
    "labels": 
    [
        {"name": "Drama"}
    ]
}

单图多标签

{ 
    "labels": 
    [
        {"name": "Drama"},
        {"name": "Romance"}
    ]
}

从已有数据集导入已标注数据

从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。

image.png

上一篇
文本数据导入
下一篇
视频数据导入