资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

创建并查看数据洞察任务

平台提供交互性与可视化兼备的数据洞察工作台,对SFT数据集进行多维透视“诊断”与处理,为大语言模型打造更高质量的精调数据。

创建数据洞察

登录到本平台,在左侧功能列数据处理中选择数据洞察与处理,进入数据洞察的主任务界面,整体流程如下:

image.png

选择对应数据集的数据集,选择“开始使用”,新发起的数据洞察任务需要1~3分钟的洞察时间。

image.png

查看数据洞察

  1. 数据洞察工作完成后,自动跳转查看界面;或者您在数据洞察页重新选择此数据集版本(状态为“洞察中”),开始使用,点击下图中的“继续使用”即可。

image.png

  1. 进入数据洞察主界面,您可以通过可视化图表直观查看样本发布情况,对样本进行精细化遴选,删除或改写“问题样本”,提高数据质量。

image.png

  1. 数据洞察完成后,您可以将挑选出的高质量样本另存至准备用于训练的通用数据集。
  2. 如果您在洞察页面发现存在脏数据、或者数据量不足等问题,您可以进入数据清洗数据增强功能模块,优化训练数据,再重新发起洞察。
上一篇
什么是数据洞察
下一篇
数据增强