开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
BML 全功能AI开发平台

    配置视觉任务

    配置训练集及评测集

    配置训练集

    在添加任务备注后,在添加数据的位置选择添加训练集。

    可选的数据集要求如下:

    1. 数据集标注类型与项目类型一致,如同为图像分类-单图单标签/物体检测-矩形框标注等
    2. 数据集数据量不为0;
    3. 数据集状态非智能标注中,非导入中

    数据集状态支持导入多个数据集的多个标签,如果选择标签名称一致,则相应数据内容会被合并。 当一个项目新建了多个任务类型进行迭代训练时,训练数据会默认为最近一次训练版本所选的数据,如果标签不变仅每个标签下的标注数据发生变化,或者配置脚本内容发生变化,则数据的部分可以不做任何操作。

    image.png

    配置数据增强策略

    在配置完训练集之后,紧接着就可以配置数据增强策略。

    深度学习模型的成功很大程度上要归功于大量的标注数据集。通常来说,通过增加数据的数量和多样性往往能提升模型的效果。当在实践中无法收集到数目庞大的高质量数据时,可以通过配置数据增强策略,对数据本身进行一定程度的扰动从而产生"新"数据。模型会通过学习大量的"新"数据,提高泛化能力。

    你可以在「默认配置」、「手动配置」、「自动搜索」三个选项进行选择,完成数据增强策略的配置。

    image.png

    配置评测集

    评测集为非必选项,如果额外上传一批非在训练集的数据作为评测集,可在模型训练完毕后单独获得额外评测集的测试效果。其中评测集的标签需要与训练集所选标签完全一致,否则将无法启动训练任务。

    配置脚本注意事项

    说明:BML目前支持飞桨(Paddle Paddle)深度学习框架 了解飞桨

    目前BML为每一种预训练模型都预置了脚本代码,在不需要修改的情况下可直接启动训练。
    自定义脚本内容过程中有如下注意事项:

    1. 可以自定义的部分包括超参配置字典conf和模型头部网络定义函数create_model。主体网络(含预训练参数)在页面可选。
    2. 超参配置conf包括可调的超参,比如训练轮数epoch,其类型和范围见注释。不要随意设置否则可能会训练失败,比如batch size太大,可能导致显存不够而失败。
    3. 超参配置conf不需要设置类别数,这是通过数据集推断出来的。
    4. 函数create_model完成头部网络定义,输出要求是一个字典,其中包括'loss'和'infer_out'两个key,'loss'是网络损失,'infer_out'是预测输出。如果修改有误可能会导致训练失败。
    5. 在分类任务中,请保证infer_out的Tensor形状是BatchSize x ClassNumber
    6. 在检测任务中,请保证infer_out的LodTensor形状是 BoxNumber x 6,其中每行是(label, confidence, xmin, ymin, xmax, ymax)
    7. conf中如果有可供配置的模型结构参数,请阅读相关注释或链接后再行修改,随意设置可能会导致训练失败或训练精度异常。
    上一篇
    创建视觉任务
    下一篇
    查看训练结果