随着技术发展,AI 算法已经逐渐渗透到各行各业。AI 算法固然高效,然而在实际项目中,开发者往往面临众多复杂的应用场景。而业界开源的算法成百上千,硬件也越来越多种多样。如何在特定的场景,快速选出最合适的 AI 算法和与之匹配的、性价比最高的硬件,是产业开发者的一大痛点。
为了快速解决模型及硬件选型的难题,使开发者更快速地进行 AI 项目落地,飞桨团队推出了「场景模型选型工具」。它考虑用户真实的产业落地诉求,并集成了飞桨团队长期积累的产业实践经验。可以针对用户的真实场景需求推荐合适的模型、优化策略与硬件组合。针对典型场景,还推荐相关的产业实践范例。
大家也可以通过直接访问飞桨官网——模型库——产业模型选型工具进行访问使用。
细心的小伙伴不难发现,模型选型工具里还有一项非常直观的数据分析功能,用户只需要上传自己的标注文件(不需要原图),工具即可分析数据特点,提供模型选型及优化策略。当前模型选型工具支持 Labelme、精灵标注、labelImg 等主流标注软件导出的标注文件,同时支持 voc 数据格式、coco 数据格式和 seg(语义分割)数据格式。
这么好用的工具,如何能更高效地使用呢?我们通过一个实际的工业质检的案例,详细为大家说明。
在某钢材厂缺陷检测项目中,用户使用线阵相机对钢板上缺陷进行检测,通过编码器控制,每4000行产生一张4096*4000大小的图像。根据项目运行要求,需要精确地计算出缺陷的面积,同时需要在 2080Ti 显卡上 200ms 完成缺陷检测。
通常线阵相机得到的图片尺寸较大,但在实际应用当中,往往会裁剪成小尺寸进行训练和预测,而裁剪成多少张,每张图片的入网尺寸设置成多少,决定着最终模型是否能够在规定时间完成识别任务。
步骤二:通过模型选型工具进行查询
由于项目需要对缺陷的面积实现精准的识别,因此项目选择了图像分割系列模型。在规定的时间条件下,根据切分的图像数量换算出每张图片至多的预测时间,根据模型选型查询相应的模型在 Input-size(图片裁剪后大小)相同条件下满足预测时间要求的组合,选择 Target-size(实际入网尺寸)最大的一组值,最终筛选出合适的模型组合。
备注:该方案目前主要考虑图片切分后进行串联顺序预测。
根据最终确定的模型的裁剪大小进行图片标注,根据模型选型工具中的数据分析功能,进一步分析数据的特点,针对其样本分布不均衡的特点,通过更新损失函数进行深层优化。
该项目是基于已知的推荐硬件前提下选择对应的模型,如果用户需要进行硬件选型,模型选型工具也支持根据用户输入的时间自动推荐符合的硬件设备。如下图案例所示,预留到模型推理的时间在 50-100ms,用户输入相应的条件,即可获取该时段下不同硬件的推荐以及具体的模型运行时间。
目前飞桨团队根据用户落地部署的需求,提供基于 1660Ti、1080 Ti、2080 Ti、3090等多款芯片在 TensorRT FP32 的测试数据,后续将支持更多云边端的部署硬件,以此来更好满足用户的落地需求。
这么好用的「场景模型选型工具」,大家还在等什么呢?
体验使用:https://www.paddlepaddle.org.cn/smrt