音频数据导入
目录
导入未标注数据
为选定的图像分类数据集导入未标注数据(即原始音频)的方式有两种。一种为从本地选择音频文件;一种为从线上【EasyData-数据服务概览】中其余同为音频类型数据集中导入。
从本地上传音频导入
选择未标注数据-本地-上传音频,点击上传音频后选择本地音频文件进行导入。
数据格式要求
1、音频类型wav/mp3/m4a,单次上传限制100个文件
2. 单个音频文件大小限制在4M内,长度限制10s以内
3. 您的账户下数据集数量限制为10万个音频,如果需要提升数据额度,可在平台提交工单
特别注意:
—1、对同一数据集存在多个内容完全一致的音频,将会做去重处理。。
—2、为保证模型训练效果,所上传的音频应与实际业务场景的音频(采集设备等)尽可能一致。
从本地上传压缩包导入
选择无标注信息-本地-上传压缩包,点击上传压缩包后选择本地音频压缩包完成数据的批量导入。
数据格式要求
1、压缩包仅支持zip格式,大小限制5GB以内
2、压缩包内音频类型wav/mp3/m4a,音频大小限制在4M内,长长度限制10s以内
3、单个数据集大小限制为10万音频,超出后可被忽略。
特别注意:
—对同一数据集存在多个内容完全一致的音频,将会做去重处理。
—为保证模型训练效果,所上传的音频应与实际业务场景的音频(采集设备)尽可能一致
导入线上已有数据
选择无标注信息-已有数据集-导入已有数据集,支持将已经上传在其他Easydata同为音频的数据集进行导入。
导入已标注数据
导入音频分类有标注信息数据
从本地导入
音频分类数据从本地导入已标注好的数据,支持整体以一个.zip格式的压缩包上传。单次上传压缩包整体大小不超过5G
注意,为了使平台能正确解析标注音频,请按照以下方式整理标注文件再打包上传
- 上传已标注文件要求格式为zip格式压缩包,同时压缩包大小在5GB以内
- 压缩包内需要包括音频源文件(wav/mp3/m4a)及同名的json格式标注文件,详细请见示例压缩包
- 单音频文件类型wav/mp3/m4a,单文件大小限制在4M内,长度限制10s以内
- 您的账户下数据集数量限制为10万个音频,如果需要提升数据额度,可在平台提交工单
- 特别注意:
- 对同一数据集存在多个内容完全一致的音频,将会做去重处理。
- 音频及对应的标注文件一一对应,是文件名需要完全相同,否则会导入失败。
- 为保证模型训练效果,所上传的音频应与实际业务场景的音频(采集设备)尽可能一致
2、json文件内容格式示例如下:
单图单标签
{
"labels":
[
{"name": "Drama"}
]
}
单图多标签
{
"labels":
[
{"name": "Drama"},
{"name": "Romance"}
]
}
从已有数据集导入已标注数据
从已有数据集导入已标注数据,支持选择数据集及导入的具体标签进行导入。