资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

查看与管理奖励模型训练运行

在奖励模型训练任务界面,可以查看任务的详情、新建运行任务和删除整个任务(包括运行)。
在指定任务的详情页面,可以查看所有的模型训练运行任务状态及其他相关内容。

登录到本平台,在左侧功能列偏好对齐RLHF训练中选择奖励模型训练,进入奖励模型训练主任务界面。

详情

在奖励模型训练的详情页,即可查看训练任务的列表。此界面可创建训练作业

image.png

点击运行名称,在运行任务的详情页可查看创建运行时的基本信息和数据配置,详情数据的来源为创建训练任务时填入的内容。

image.png

强化学习

可以指定某个运行成功的任务,去强化学习。
在运行任务的详情页右上角选择去强化学习开启强化学习训练任务。

image.png

训练日志

可以查看运行任务的训练情况,分为概览日志、数据处理日志和训练日志三部分,日志内容均支持下载(txt格式)。

  • 概览日志:对模型训练过程中的关键步骤信息进行抽取展示。
  • 数据处理日志:对模型训练过程中数据集等数据信息处理进行展示排查。
  • 训练日志:对模型训练过程中的全量动作以日志的形式展示。

概览日志部分内容如下所示:

image.png

评估报告

可以查看奖励模型的评估指标。

image.png

准确度是指分类正确的预测数与总预测数的比值,准确度越高,分类器越好。

删除

支持删除运行任务,运行任务一旦删除便不可恢复。