控制台

技术能力

查看全部AI能力

EasyDL零门槛AI开发平台

经典版声音分类创建数据集

更新时间：2022-04-12

在训练之前需要在数据中心【创建数据集】

设计分类

每个标签就是对这个音频希望识别出的全部结果。标签的上限为1000种。
标签名由数字、中英文、中/下划线组成，长度上限256字符。

音频的具体格式要求

训练集音频需要和实际场景要识别的音频环境一致，举例：如果实际场景要识别的音频都是手机摄录的，那训练的音频也需要同样的场景获得，而不要采用网上随便下载的音频。
每个标签的音频需要覆盖实际场景里面的可能性，如不同环境下，训练集覆盖的场景越多，模型的泛化能力越强。
如果需要寻求第三方数据采集团队协助数据采集，可以加入官方QQ群（群号:679517246）联系群管咨询了解。
音频支持mp3, m4a, wav格式，单个音频大小在4M内且时长小于15s。

上一篇

声音分类整体说明

下一篇

上传数据集

合作咨询

填写您的业务诉求，专属商务会尽快联系您

创建工单快捷反馈问题，会有专业人员为您提供帮助

更多咨询，请拨打400-920-8999 转 1

文档反馈

鼠标选取文档内容，精确反馈问题

选取您有疑问的文档内容，即可更精确地反馈问题，我们将会跟进处理。