效果优化

更新时间：2022-05-06

通过模型迭代、检查并优化训练数据、选择高精度模型等方法，能够提升模型效果。

模型迭代

一个模型很难一次性就训练到最佳的效果，通常会需要结合模型评估报告和校验结果不断扩充数据和调优。

为此平台提供了模型迭代功能，即当模型训练完毕后，会生成一个最新的版本号，首次V1、之后V2……以此类推。可以通过调整训练数据和算法，多次训练，以获得适合业务需求的模型效果。

如果模型已经是上线状态，依然支持模型迭代，只是需要在训练完毕后更新线上服务接口，在接口地址不变的情况下可以持续优化效果。

检查是否存在训练数据过少的情况，建议文本数量不少于1000个，如果低于这个量级建议扩充
通过模型效果评估报告中的详细评估指标，有针对性地扩充训练数据。例如下图评估报告中显示“0”（不相似）的精确值较低，可考虑从两方面进行优化，一是适当增加“0”不相似数据集样本量，而是检查当前数据集中“0”不相似数据集质量，是否有定义模糊的情况等，以此达到模型优化的效果。

检查测试模型的数据与训练数据的文本类型与风格是否一致，如果不一致，那么很可能会存在模型效果不错但实际测试效果较差的情况。针对这种情况建议重新调整训练集，将训练数据与实际业务场景数据尽可能一致

在训练模型时，选择高精度的模型，将提升模型的预测准确率。

「高精度」算法内置文心大模型，将大数据预训练与多源丰富知识相结合，通过持续学习技术，不断吸收海量文本数据中词汇、结构、语义等方面的新知识，实现模型效果不断进化。