开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
BML 全功能AI开发平台

    配置NLP任务

    1. 在新建任务的面板中,可查看相关项目“基本信息”、“配置任务类型”、“添加数据”、“配置任务”等操作,如下图:

    image.png

    配置任务类型时,您可以看到增量训练有一个开关选项。增量训练也成为模型热启动,当您训练完模型但效果不理想想继续添加数据,或您的训练模型超过训练时长被中断是,您可以开启增量训练,使该新任务能在基准任务的基础上继续运行。在配置任务类型上您需要注意以下几点,如您是第一次新建任务,增量训练的开关将默认关闭,不允许打开。如您在满足已有训练完成或是训练中断的任务的情况下,您可以开启增量训练的开关,选中您想继续的基准任务版本。在设置学习率时,您可以重新设置学习率,也可以加载优化后的学习率。如您选择重新设置学习率,您可以在下方【配置网络】的脚本编辑中修改学习率的大小,如您选择加载优化后的学习率,您将直接继承您选中的基准任务的超参数,在脚本编辑中将不允许再修改。

    image.png

    训练任务,我们需要添加模型训练使用的训练集和模型评测的评测集,如果您没有特别创建评测集,可以将评测集开关设置为“OFF”,系统将从训练集中取出一定比例的数据作为评测集。如果您有准备评测集,则可以将评测集开关设置为“ON”,并上传对应的数据集即可,如下图:

    image.png

    在上传数据的时候,您需要注意,如您打开了增量训练的开关,那么将直接选中您选中的基准任务的使用的数据集。点击查看基准任务标签时,您可以看到基准任务数据集的标签信息,此时您选择增量训练的数据集,您可保留基准任务数据集,也可添加新数据集,但新数据标签须与基准任务保持一致。

    image.png

    1. 配置网络过程中,您可以选择使用预训练模型ERNIE2.0对应的三个版本:ERNIE2.0_Base、ERNIE2.0_Large和ERNIE2.0_Tiny。本章节演示创建流程,先选择“ERNIE2.0_Tiny”,并选择TextCNN网络。 EasyDL专业版目前支持飞桨(Paddle Paddle)深度学习框架,自然语言训练任务支持的框架脚本为paddle-fluid-v1.6.1。了解飞桨

    image.png

    平台提供了脚本编辑的工具,您可以直接在平台点击“立即编辑”进行脚本编辑,如下图:

    image.png

    注意,当您打开增量开关后,如您选中重新设置学习率,那么您可以脚本编辑中设置学习率,此时,如您修改其他超参数,仍将默认基准任务的超参数。如您选中加载优化后的学习率将脚本将不允许编辑。目前平台为您提供了对应代码的注释,方便您了解如何进行代码编辑和修改。

    3.在配置资源部分,目前平台已提供GPU V100、P40两种机型。选中您所需的机型,根据需要设置计算节点数,如您选择多节点进行分布式训练,可有效提升训练速度,节点数越多训练效率越高。在最长训练设置部分,目前文本任务方向没有时间上线,建议您尽量设置较长时长,注意如您使用ERNIE预训练模型,建议训练时长不低于4小时。

    image.png

    1. 点击提交训练任务,任务将在平台提供的GPU训练资源上进行训练。

    image.png

    提交成功的任务,将会在项目列表中展示状态。

    image.png

    在此,NLP任务的创建,已经完成。

    错误码

    如果您的任务出现失败情况,您可以通过查看平台反馈的错误码来查询,如下表:

    错误码 训练失败原因说明
    01-05、07、08、10、11 后端服务超时或训练失败,请提交工单或加入EasyDL官方QQ群(群号:86882600)联系群管解决
    6 数据量过少导致训练失败,请补充数据重新提交模型训练
    9 代码错误导致训练失败,请检查脚本代码内容修改后重新提交模型训练,有疑问请提交工单或加入EasyDL官方QQ群(群号:868826008)联系群管解决
    上一篇
    创建NLP任务
    下一篇
    查看训练结果