资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

推理服务监控告警

前置依赖

需要拥有BCMFullControlAccessPolicy权限才能完整查看BCM监控面板和配置BCM报警策略。 如何授权可参考账号创建与权限分配

支持的监控报警指标

  • 错误码(包括V1及V2错误码)
  • TPM(实际使用量)
  • TPM限额
  • TPM余量
  • RPM(实际使用量)
  • RPM限额
  • RPM余量
  • QPS
  • 首token时延均值
  • 整句时延均值

千帆侧操作指南

1.在控制台调用统计页面右上角会出现BCM云监控的超链接,点击【BCM监控告警】即可跳转BCM页面 image (2).png 2.BCM页面展示效果如下 image (3).png

BCM侧操作指南

监控报表查看

1.可以通过实例列表筛选【预置服务】列表及【定制服务】列表 image (4).png
2.在服务列表页面,点击任一服务名称,进入该服务的监控页面 986a0d85318d2555714bcd2591862d27.png

报警策略配置

支持by服务纬度配置报警策略。

1.通过服务监控页面,选择报警策略 f4297cf8b2bd3d42dc44b7bf9d0f02ae.png
2、点击【添加策略】按钮 image (5).png
3、报警策略配置
策略规则配置支持按照监控指标、appid、error_code自定义配置报警策略。并且支持选择按照报警频率,域值进行策略选择,且支持添加“且”“或”规则 image (6).png
若想对报警策略进行高效复用,也可以通过报警模版配置,可以参考BCM报警通知模板
报警通知模版处可以选择通知方式和接口回调的uri,报警回调可以参考BCM报警回调

查看报警历史及报警详情

当报警发生后,您可以在报警历史页面通过产品类型、报警等级、当前状态等条件筛选想要关注的报警信息,可以参考报警历史

短信报警示例

以错误码告警为例
03a9b5ce0123139292cae48b1.png

上一篇
推理日志投递与解绑
下一篇
模型训练