资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

Prompt评估

  • 平台国内首发推出Prompt评估功能,支持用户在线进行Prompt打分及问题诊断,可多条Prompt多场景并行在线评估。
  • Prompt评估可帮助用户定位Prompt语料的具体问题,并提供修改意见,配合本平台Prompt优化功能,用户可获取高质量Prompt,激发大模型推理潜能。

登录到本平台,在左侧功能列选择Prompt评估,进入Prompt评估主任务界面,按照以下步骤进行操作,即可完成Prompt的评估工作:

当前支持以下场景进行评估工作,您可根据实际需求,选择合适的评估链路。

操作范围
操作链路
适用情况
全局
全部推理 > 评估(已支持)      
  • 初始填充
  • 多个Prompt新增/内容改动      
  • 多个场景新增/变量值改动
  • 全部仅评估
  • 多个场景预期生成内容改动
  • 更换评估标准
  • 删除部分场景
  • 单场景(单行)
    重新推理 > 评估(已支持)
  • 新增场景
  • 单个场景新增/变量值改动
  • 仅评估
  • 单个场景预期生成内容改动
  •  单prompt模板(单列) 
    重新推理 > 评估(已支持)
  • 单个Prompt新增/内容改动
  • 仅评估 ——
    1. 选择评估推理服务 >> 2. 添加评估Prompt配置评估参数 >> 3. 编辑评估Prompt >> 4. 配置评估场景 >> 5. 评估全部 >> 6. 查看评估效果

    image.png

    选择评估推理服务

    需要您选择平台的模型服务作为评估Prompt优劣的依据,即在此推理服务上的表现为Prompt优劣定义的标准,可在操作台左上方指定应用和服务。

    image.png

    关于创建应用可查看使用说明,推理服务可在预置服务中开通/终止付费。

    添加评估Prompt配置评估参数

    添加待评估的Prompt模板或⼿写,配置评估⽅法。

    image.png

    • 添加Prompt:可以添加新的被评估Prompt,或者直接添加Prompt模板。最多创建同时被评估的Prompt数量不超过3个,可以进行单个Prompt的评估或删除,新输入的Prompt也可直接保存为自制模板。

    image.png

    • 添加场景:新增Prompt的评估应用场景,需要输入预期生成内容,可以单独进行该场景的Prompt评估,也可以删除此场景。如设置了Prompt变量,则需在场景模块进行填写,支持每个场景填写不同的变量内容与预期生成内容

    image.png

    • 评估设置:设置Prompt的评估标准和变量识别符,支持开启/关闭评估总结文本分析功能。

    image.png

    • 1)语义相似性:基于语义理解,评估生成内容与目标生成内容的语义相似度,适用于评估创作生成类场景。
    • 2)Regex匹配:正则表达式匹配,适用于评估对生成内容格式要求比较高的场景,例如代码生成的场景。
    • 3)精确匹配:通过比较生成内容与目标生成内容的字符相同个数来进行评估,适用于评估数理推算、内容提取等场景。

    编辑评估Prompt

    可以根据需要填写Prompt内容,支持通过设定的变量参数格式来定义添加变量。

    image.png

    配置评估场景

    添加评估对象配置评估参数中添加的场景进行编辑,可以生成预期生成的内容,同时可以对场景进行单独评估或删除。

    评估全部

    以上所有动作完成后,可以选择“开始评估”,则按照应用和服务内容生成response和评估结果。

    image.png

    查看评估效果

    获取单/多个场景下的单/多个模板评分,从评分及⽣成结果综合评估Prompt。可根据评估总结的反馈考虑进行Prompt优化或者对模型进行微调优化。

    image.png

    上一篇
    Prompt优化
    下一篇
    Prompt工程使用技巧