开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

模型加速整体说明

功能简介

当您发布时纯离线服务时,平台已结合最新的量化、剪枝、蒸馏技术,推出丰富的模型压缩加速方案,以提高您的SDK部署效率。

覆盖范围:服务器、通用小型设备、专项适配硬件均支持该功能。

具体原理:针对目标芯片,对模型做深度优化压缩加速,加速后模型在推理速度、内存占用、体积大小等指标上表现更优。发布加速模型可能需要一段时间,同时会有微小的精度损失。发布完成后可通过性能报告对比具体加速效果。

使用流程

选择加速方式

结合选择的系统与芯片不同,分别为您提供不同的压缩方式。
image.png

提示:基础SDK默认作为勾选项存在,可后续与您的加速SDK进行效果与性能比对,方便您进一步挑选

查看发布状态

点击完成发布后,将自动跳转至列表页,可分别查看不同加速方案下的模型发布进度及发布时间。
image.png

上一篇
智能边缘控制台-多节点版
下一篇
常见问题