音频数据导入

更新时间：2020-04-28

导入未标注数据
导入已标注数据

导入未标注数据

为选定的图像分类数据集导入未标注数据（即原始音频）的方式有两种。一种为从本地选择音频文件；一种为从线上【EasyData-数据服务概览】中其余同为音频类型数据集中导入。

从本地上传音频导入

选择未标注数据-本地-上传音频，点击上传音频后选择本地音频文件进行导入。
数据格式要求
1、音频类型wav/mp3/m4a，单次上传限制100个文件
2. 单个音频文件大小限制在4M内，长度限制10s以内
3. 您的账户下数据集数量限制为10万个音频，如果需要提升数据额度，可在平台提交工单
特别注意：
—1、对同一数据集存在多个内容完全一致的音频，将会做去重处理。。
—2、为保证模型训练效果，所上传的音频应与实际业务场景的音频（采集设备等）尽可能一致。

从本地上传压缩包导入

选择无标注信息-本地-上传压缩包，点击上传压缩包后选择本地音频压缩包完成数据的批量导入。
数据格式要求
1、压缩包仅支持zip格式，大小限制5GB以内
2、压缩包内音频类型wav/mp3/m4a，音频大小限制在4M内，长长度限制10s以内
3、单个数据集大小限制为10万音频，超出后可被忽略。
特别注意：
—对同一数据集存在多个内容完全一致的音频，将会做去重处理。
—为保证模型训练效果，所上传的音频应与实际业务场景的音频（采集设备）尽可能一致

导入线上已有数据

选择无标注信息-已有数据集-导入已有数据集，支持将已经上传在其他Easydata同为音频的数据集进行导入。

导入已标注数据

导入音频分类有标注信息数据

从本地导入

音频分类数据从本地导入已标注好的数据，支持整体以一个.zip格式的压缩包上传。单次上传压缩包整体大小不超过5G
注意，为了使平台能正确解析标注音频，请按照以下方式整理标注文件再打包上传

上传已标注文件要求格式为zip格式压缩包，同时压缩包大小在5GB以内
压缩包内需要包括音频源文件（wav/mp3/m4a）及同名的json格式标注文件，详细请见示例压缩包
单音频文件类型wav/mp3/m4a，单文件大小限制在4M内，长度限制10s以内
您的账户下数据集数量限制为10万个音频，如果需要提升数据额度，可在平台提交工单

特别注意：
对同一数据集存在多个内容完全一致的音频，将会做去重处理。
音频及对应的标注文件一一对应，是文件名需要完全相同，否则会导入失败。
为保证模型训练效果，所上传的音频应与实际业务场景的音频（采集设备）尽可能一致

2、json文件内容格式示例如下：

单图单标签

{ 
    "labels": 
    [
        {"name": "Drama"}
    ]
}

单图多标签

{ 
    "labels": 
    [
        {"name": "Drama"},
        {"name": "Romance"}
    ]
}

从已有数据集导入已标注数据

从已有数据集导入已标注数据，支持选择数据集及导入的具体标签进行导入。

文本数据导入

视频数据导入