资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

Jsonl文件格式说明

jsonl文件格式说明

  1. 文件内单条数据格式要求为{"src": , "tgt":}, 详见数据样例

    • 字段说明
    • src (list(str)): 用户对话内容,可能会包含 markup 内容,如 [];
    • tgt (list(str)): 系统回复内容,可能会包含 markup 内容,如 [];
  2. 每一行表示一组数据,每组数据中的prompt字符数不超过2000Token(包括中英文、数字、符号等),超出的字符可正常保存,但可能无法参与训练。
  3. 支持文本文件类型为jsonl,编码仅支持UTF-8,目前每次仅支持上传1个文件,文件不超过8M。
上一篇
大模型应用模型微调使用说明
下一篇
模型部署