资讯 社区 文档 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

效果优化

通过模型迭代、检查并优化训练数据、选择高精度模型等方法,能够提升模型效果。

模型迭代

一个模型很难一次性就训练到最佳的效果,通常会需要结合模型评估报告和校验结果不断扩充数据和调优。

为此平台提供了模型迭代功能,即当模型训练完毕后,会生成一个最新的版本号,首次V1、之后V2……以此类推。可以通过调整训练数据和算法,多次训练,以获得适合业务需求的模型效果。

如果模型已经是上线状态,依然支持模型迭代,只是需要在训练完毕后更新线上服务接口,在接口地址不变的情况下可以持续优化效果。

检查并优化训练数据

  • 检查是否存在训练数据过少的情况,建议每个类别的文本数量不少于1000个,如果低于这个量级建议扩充
  • 检查不同类别的数据量是否均衡,建议不同分类的数据量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果
  • 通过模型效果评估报告中的各分类的详细评估指标,有针对性地扩充训练数据,比如下图中的评估报告显示,标签为1的分类精确值数据表现较标签为0的精确值要差,即可考虑从两个方向进行针对性优化,一是增加标签为1的数据集样本数据量,二是检查现有标签为1数据集中是否存在定义模糊的情况,提升标签为1的数据集质量,优化模型效果。
  • image.png
  • 检查测试模型的数据与训练数据的文本类型与风格是否一致,如果不一致,那么很可能会存在模型效果不错但实际测试效果较差的情况。针对这种情况建议重新调整训练集,将训练数据与实际业务场景数据尽可能一致

选择高精度模型

在训练模型时,选择高精度的模型,将提升模型的预测准确率。

「高精度」算法内置文心大模型,将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化。

上一篇
发起训练
下一篇
评估效果