开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

发起训练

训练模型

完成数据的标注,或提交已标注的数据后,即可在「模型中心」目录中点击「训练模型」,开始模型的训练。

按以下步骤操作,启动模型训练:

image.png

Step 1 选择模型

选择此次训练的模型

Step 2 训练配置

部署方式

可选择「公有云部署」。

选择算法

您可以根据训练的需求,选择「高精度」或「高性能」算法。不同的算法将影响训练时间、预测速度与模型准确率。

  • 如果您选择了高精度的模型,模型预测准确率更高,少于1000条样本同样有很好的效果。使用高精度的算法训练模型将会耗时更久,实验环境下1000个样本,预计在20-60分钟左右完成训练
  • 高性能算法即将对外提供。相同训练数据量的情况下,训练耗时更短,模型预测速度更快。使用10000条训练样本,将在10min内完成训练.同样的数据量情况下,效果比高精度的模型4-5%

「高精度」算法内置文心大模型,将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化

Step 3 添加数据

添加训练数据

  • 可选择多个数据集
  • 训练时间与数据量大小和您选择的模型类型有关,如果您选择的是高性能的模型,使用10000条训练样本将在10min内完成训练;如果您选择的是高精度的模型,使用10000条训练样本,将在20-60min完成训练

添加自定义测试集

上传不包含在训练集的测试数据,可获得更客观的模型效果评估结果。

添加自定义测试集的目的:

如果学生的期末考试是平时的练习题,那么学生可能通过记忆去解题,而不是通过学习的方法去做题,所以期末考试的试题应与平时作业不能一样,才能检验学生的学习成果。那么同理,AI模型的效果测试不能使用训练数据进行测试,应使用训练数据集外的数据测试,这样才能真实的反映模型效果

期末考试的内容属于学期的内容,但不一定需要完全包括所学内容。同理,测试集的标签是训练集的全集或者子集即可

Step 4 训练模型

点击「开始训练」,即可开始训练模型。

  • 训练时间与数据量大小、选择的算法、训练环境有关
  • 训练环境可选择GPU P40或GPU V100。其中GPU P40可以免费使用;GPU V100训练速度更快,需要付费使用,可参考价格说明
  • 模型训练过程中,可以设置训练完成的短信提醒并离开页面
上一篇
创建模型
下一篇
评估效果