开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
EasyDL零门槛AI开发平台

    物体检测训练操作说明

    数据提交后,可以在导航中找到【训练模型】,按以下步骤操作,启动模型训练:

    image.png

    ① 选择模型

    选择此次训练的模型

    ② 训练配置

    部署方式

    可选择「公有云API」、「EasyEdge本地部署」

    如何选择部署方式

    选择设备

    如果您选择了「EasyEdge本地部署」,请根据实际部署设备选择 -如果您选择了「公有云API」,则可按需选择训练方式

    增量训练*

    增量训练:在模型迭代训练时,用户在原训练数据上增加了训练数据,可通过加载原训练数据训练的模型参数进行模型训练。这样可让模型收敛速度变快,训练时间变短,同时在数据集质量较高的情况下,可能获得的模型效果也会更好。

    注:仅可选择同一部署方式下的训练的模型作为基准模型版本

    训练方式

    EasyDL目前提供完全免费的「常规训练」,以及限时免费的「精度提升配置包」两种选项。

    • 「常规训练」包括EasyDL历史提供的「高精度」、「高性能」等模型选择,以及常规的模型训练配置
    • 「精度提升配置包」选用百度自有超大规模预训练模型,让模型有更好的精度效果。并提供按云调用时延选择网络模型的形式,根据您实际应用场景需求,选择更合适的模型。另外,EasyDL会持续在「精度提升配置包」中新增提升模型精度效果的配置策略,敬请期待。

    选择算法

    不同的部署方式下,可以选择不同的算法。每个算法旁边有一个小问号,可以查看详细说明。

    例如:选择「公有云API」后,可以在「超高精度」、「高精度」、「高性能」3种算法中选择。鼠标移动到「高精度」右侧的问号上,可以看到对高精度算法的详细说明。

    通常,高精度模型在识别准确率上表现较好,但在识别速度上表现较弱。高性能模型反之。

    此外,如果你已从AI市场购买了模型算法,也可以基于已购模型的算法训练: 前往AI市场购买>

    image.png

    ③ 添加数据

    添加训练数据

    • 先选择数据集,再按标签选择数据集里的图片,可从多个数据集选择图片
    • 训练时间与数据量大小有关,1000张图片可能需要几个小时训练,请耐心等待

    Tips

    • 如果包含同一个标签的数据分散在不同的数据集里,可以在训练时同时从这些数据集里选择,模型训练时会按标签名称合并
    • 部分AI市场售卖的模型会要求再次训练时标签名称和售卖的模型一样,可以参考以下方式调整标签名称

    image.png

    修改标签名,只需三步:

    • 第一步:在数据集列表点击查看目标数据集

    image.png

    • 第二步:点击「有标注信息」查看

    image.png

    • 第三步:在标签名称一侧点击修改并保存

    添加自定义验证集*

    AI模型在训练时,每训练一批数据会进行模型效果检验,以某一张验证图片作为验证数据,通过验证结果反馈去调节训练。可以简单地把AI模型训练理解为学生学习,训练集则为每天的上课内容,验证集即为每周的课后作业,质量更高的每周课后作业能够更好的指导学生学习并找寻自己的不足,从而提高成绩。同理AI模型训练的验证集也是这个功效。

    注:学生的课后作业应该与上课内容对应,这样才能巩固知识。因此,验证集的标签也应与训练集完全一致。

    添加自定义测试集*

    如果学生的期末考试是平时的练习题,那么学生可能通过记忆去解题,而不是通过学习的方法去做题,所以期末考试的试题应与平时作业不能一样,才能检验学生的学习成果。那么同理,AI模型的效果测试不能使用训练数据进行测试,应使用训练数据集外的数据测试,这样才能真实的反映模型效果。

    注:期末考试的内容属于学期的内容,但不一定需要完全包括所学内容。同理,测试集的标签是训练集的全集或者子集即可。

    配置数据增强策略

    深度学习模型的成功很大程度上要归功于大量的标注数据集。通常来说,通过增加数据的数量和多样性往往能提升模型的效果。当在实践中无法收集到数目庞大的高质量数据时,可以通过配置数据增强策略,对数据本身进行一定程度的扰动从而产生"新"数据。模型会通过学习大量的"新"数据,提高泛化能力。

    你可以在「默认配置」、「手动配置」、「自动数据增强」3种方式中进行选择,完成数据增强策略的配置。

    默认配置

    如果你不需要特别配置数据增强策略,就可以选择默认配置。后台会根据你选择的算法,自动配置必要的数据增强策略。

    手动配置

    EasyDL提供了大量的数据增强算子供开发者手动配置。你可以通过每个算子右侧的功能说明和效果展示,来了解不同算子的功能:

    自动数据增强

    在训练方式选择「精度提升配置包」选项后,此处数据增强策略提供「自动数据增强」选项。自动数据增强算法会根据您数据的特性,自动选择数据增强算子。使用付费机型训练的用户请注意,自动数据增强算法可能会增加模型训练时间。

    image.png

    模型训练完成后,可在「我的模型-查看版本配置」中,查看配置记录:

    image.png

    配置建议

    算子的配置建议贴合实际场景。

    比如,数字识别的数据集中,因为对数字的旋转很有可能导致错误样本的产生,所以不建议对数字数据集进行旋转操作。再比如,检测数据集中,如果标注量比较少,就可以通过随机平移的算子增强数据集,模型也更容易学习到目标物体的平移不变性。

    ④ 训练模型

    点击「开始训练」,训练模型。

    • 训练时间与数据量大小有关,1000张图片可能需要几个小时训练,请耐心等待。
    • 模型训练过程中,可以设置训练完成的短信提醒并离开页面。
    上一篇
    物体检测创建模型
    下一篇
    物体检测模型效果评估