物体检测模型如何提升效果
更新时间:2022-03-29
一个模型很难一次性就训练到最佳的效果,可能需要结合模型评估报告和校验结果不断扩充数据和调优。
为此我们设计了模型迭代功能,即当模型训练完毕后,会生成一个最新的版本号,首次V1、之后V2……以此类推。可以通过调整训练数据和算法,多次训练,获得更好的模型效果。
注意:如果模型已经是上线状态(包括已付费的模型服务),依然支持模型迭代。只需要在训练完毕后发布新的版本,就可以获得更新后的模型服务。
想要提升模型效果,可以尝试以下两种方法:
检查并优化训练数据
- 检查是否存在训练数据过少的情况,建议每个标签标注50个框以上,如果低于这个量级建议扩充。
- 检查不同标签的标注框数量是否均衡,建议不同标签的标注框数数据量级相同,并尽量接近,如果有的标签框数很多,有的标签框数很少,会影响模型整体的识别效果。
- 通过模型效果评估报告中的错误识别示例,有针对性地扩充训练数据。
- 检查测试模型的数据与训练数据的采集来源是否一致,如果设备不一致、或者采集的环境不一致,那么很可能会存在模型效果不错但实际测试效果较差的情况。针对这种情况建议重新调整训练集,将训练数据与实际业务场景数据尽可能一致。
云服务调用数据管理
开通云服务调用数据管理功能后,可查找云服务模型识别错误的数据,纠正结果并将其加入模型迭代的训练集,实现训练数据的持续丰富和模型效果的持续优化
具体使用流程如下:
- 为已上线接口开通云服务调用数据服务
- 通过选择调用时间、标签,并设置筛选条件,查看疑似错误识别的图片
注意:数据将从开通功能后开始存储,最多存储30天的数据。当天调用的数据暂不支持即时查看,可在第二天查看
- 将接口识别错误的图片添加到指定数据集(建议新建数据集)并纠正结果。后续训练模型时,只需增加包含接口数据的数据集,即可提升模型效果
尝试不同的训练配置
可前往训练配置页面尝试不同的配置组合,因不同数据集在不同的算法上可能表现不一致,所以建议您多尝试不同的算法选型后综合挑选精度最高的模型使用,你可以选择如下的配置项:
- 增量训练
- 精度提升配置包
- 自动超参搜索
- 自定义验证集
- 数据增强策略
- 在高级训练配置中增加输入图片分辨率
注:如您需检测的目标在图中占比小于5%,建议您选择「精度提升配置包」中的小目标检测算法,但出于对算法性能的考虑,目前小目标检测算法仅支持本地部署