模型效果评估 是一种用于衡量模型表现的技术。千帆大模型平台提供多种模型效果评估方法,包括自动评估、人工评估和基线评估,来判断模型在不同任务类型下的性能。在自动评估中,可使用预置或自定义评估指标,通过自动规则或自动裁判员打分;人工评估则针对预置或自定义任务类型开展评估任务。评估涵盖模型、结果集等多种评估对象,覆盖平台数据集、BOS存储对象等多种数据来源。效果评估是确保模型质量的关键步骤,它有助于发现模型的不足之处,为模型的优化和改进提供有力支持。
鼠标选取文档内容,精确反馈问题
选取您有疑问的文档内容,即可更精确地反馈问题,我们将会跟进处理。