开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

发起训练

训练模型

完成数据的标注,即可在「模型中心」目录中点击「训练模型」,开始模型的训练。

按以下步骤操作,启动模型训练:

image.png

Step 1 选择模型

选择此次训练的模型

Step 2 训练配置

部署方式

可选择「公有云部署」、「EasyEdge本地部署」。

如何选择部署方式

选择设备

  • 如果您选择了「EasyEdge本地部署」,请根据实际部署设备选择
  • 如果您选择了「公有云部署」,无需选择设备

选择算法

您可以根据训练的需求,选择「高精度」或「高性能」算法。不同的算法将影响训练时间、预测速度与模型准确率。如果您手中的标注数据集样本较少(例如少于1000条),可选择「高精度」的算法;如果您手中有充足的数据集,您可选择「高性能」的算法。

  • 高精度:预测准确率效果更高,训练时长与训练文本的长度和数量成正比,1000个样本预计在20分钟完成训练
  • 高性能:在相同续联数据量的情况下,有着更快的预测速度,但准确度效果平均损失1~4%

「高精度」算法内置文心大模型,将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化

Step 3 添加数据

添加训练数据

  • 先选择数据集,再按标签(评价观点词、评价维度、情感倾向、评价片段)选择数据集里的文本,可从多个数据集选择文本
  • 训练时间与数据量大小、选择的算法、训练环境有关

添加自定义测试集

上传不包含在训练集的测试数据,可获得更客观的模型效果评估结果。

添加自定义测试集的目的:

如果学生的期末考试是平时的练习题,那么学生可能通过记忆去解题,而不是通过学习的方法去做题,所以期末考试的试题应与平时作业不能一样,才能检验学生的学习成果。那么同理,AI模型的效果测试不能使用训练数据进行测试,应使用训练数据集外的数据测试,这样才能真实的反映模型效果

期末考试的内容属于学期的内容,但不一定需要完全包括所学内容。同理,测试集的标签是训练集的全集或者子集即可

Step 4 训练模型

点击「开始训练」,即可开始训练模型。

  • 训练时间与数据量大小、选择的算法、训练环境有关
  • 训练环境可选择GPU P40或GPU V100。其中GPU P40可以免费使用;GPU V100训练速度更快,需要付费使用,可参考价格说明
  • 模型训练过程中,可以设置训练完成的短信提醒并离开页面
上一篇
创建模型
下一篇
效果评估