开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

硬件配置及推荐

本文主要介绍了人脸检测私有化部署包部署所需的硬件配置,您可以按照如下文档准备硬件或检验已有硬件是否符合要求。

推荐使用NVIDIA Tesla T4、2080Ti,百度针对NVIDIA Tesla T4、2080Ti进行针对性优化,提高了GPU的利用率。

显卡选型建议

  • NVDIA Tesla P4/GTX系列:P4、P40、1060、1070、1070Ti、1080、1080Ti 推荐使用P4卡(单张P4卡最多支持50QPS)

    注:P40显存大但运行模型的计算单元并不多,因此运行人脸识别模型的性能与P4基本没差别。

  • T4显卡、V100显卡:T4、V100(单张T4卡最多支持50QPS)
  • NVDIA RTX系列:2070、2080、2080Ti、3060、3070、3080、3090 推荐使用2080Ti卡(单张2080TI卡最多支持50QPS)

    显存需要6G以上

    注:1050及之前的显卡因为显存不足6GB,所以不支持人脸私有化模型部署。另外,百度的人脸识别私有化部署包对于GTX系列显卡也是兼容的,且GTX单卡支持的QPS数量比P4卡多,但因为GTX并非服务器专用显卡,所以请大家基于自身业务需求进行选择。

GPU服务器搭配推荐

≤100W以内的人脸库配置

本地服务器配置

百度推荐GPU服务器可参考这里

关键信息 要求 推荐值 推荐型号 备注
CPU ≥1核 单核 INTEL Xeon E5-2650 V4 12C 2.2GHZ*2 intel i7/i9等市场主流CPU均可,推荐使用志强系列
100W以内人脸库单核即可
内存 ≥16GB 32(G) DDR4-2666 32G*8 人脸查找阶段人脸库会进入内存,单条记录4KB所需内存:人脸库数量*4KB
硬盘 >100GB 500(G) SAS 10K*1 最小不得低于100GB,推荐使用500GB及以上
GPU P4/T4/2080Ti T4 单张T4卡1:N检索上限为50QPS

BCC云服务器配置

购买BCC云服务器请点击这里,购买云服务器和人脸部署包授权后(搭配购买BCC云服务器最低可享6折优惠)

关键信息 选择内容 备注
当前区域选择 苏州/保定 目前私有化部署服务器适配苏州/保定地区
架构 异构计算GPU/FPGA/百度昆仑 -
GPU计算型 实例规格:bcc.lgn1.c6m24.1p4(第10个) 显卡数量根据需求选择即可
操作系统 CentOS 7.6X86_64(64bit) CentOS 7以上均可
系统盘 500GB -
带宽需求 根据实际需求进行计算 -

100W以上人脸库配置

百度推荐GPU服务器可参考这里

关键信息 推荐型号 推荐值 备注
CPU INTEL Xeon E5-2650 V4 12C 2.2GHZ*2 多核 人脸库总量大小影响比对速度,主要消耗CPU。
单核1:100万在1s内完成,如果要在1s内完成1:1000万需要10个核,理论横向扩展无限制
内存 DDR4-2666 32G 64(G) 人脸查找阶段人脸库会进入内存,单条记录4KB所需内存:人脸库数量*4KB
硬盘 SAS 10K*1 512(G) 人脸原图存储在硬盘,影响能够存储的人脸数量,依据人脸图片大小确定所需存储空间
GPU Nvidia P4/T4/2080Ti 单张T4卡1:N检索上限为50QPS

CPU服务器搭配推荐

本配置适用于在纯CPU上部署人脸私有化模型的场景,推荐20QPS以下需求客户考虑,20QPS及以上需求用户推荐GPU版本。

100W内人脸库

关键信息 ≤15QPS ≤20QPS
型号 INTEL Xeon E5-2650 V4 12C 2.2GHZ*2 INTEL Xeon E5-2650 V4 12C 2.2GHZ*2
核数 ≥4核 ≥8核
内存 ≥30GB ≥64GB
硬盘 >100GB >100GB

硬件对服务的影响

名称 影响 计算方式
CPU 人脸库总量大小影响比对速度,主要消耗CPU 所需CPU数量=所需CPU内核数量➗每个CPU的核数=(人脸库大小➗100万)➗每个CPU的核数
内存 人脸库 需要消耗内存,单条记录4KB 所需内存大小=人脸服务所需内存+其他服务所需内存=人脸库大小x4(单位是:kb)+其他服务所需内存
硬盘 影响能够存储的人脸数量 所需存储空间大小=人脸服务所需存储+其他服务所需存储=人脸图片数量x单张人脸图片大小+其他服务所需存储
GPU 影响能够处理的并发请求的数量 所需T4显卡的数量=业务QPS量级➗50(显卡以Nvdia Tesla T4为例)

注:内存建议比计算值大一半以上,保证服务的稳定运行

上一篇
价格说明
下一篇
部署运维