资讯 社区 文档
9月AI产品上新升级,40余项软硬能力加速场景落地
发布日期:2020-10-29 10:58浏览量:694次

九月的手掌拂去夏日的狂躁,百度大脑也在九月收获了40余项能力的开源开放及升级,持续引领 AI 技术高速发展,助力更高效实现产业智能化应用落地,快来一同阅读您最关心的内容吧。

  • 医疗票据 OCR 方案,3项模型全面升级;

  • 视频分析边缘计算盒 EM-BOX 硬件全新升级,被动式散热,防尘抗震,更安全可靠;

  • 飞桨 PaddleSlim 重磅开源 SlimX 系列13个小模型,覆盖人脸识别、分类、检测、OCR;

  • 零门槛 AI 开发平台 EasyDL 全新推出定制文本实体抽取、表格数据预测,NLP 模型全面支持私有服务器部署,模型市场全新上线;

  • 全功能 AI 开发平台 BML 3项重大升级,提供一站式人工智能建模与推理预测服务;

  • 百度 AI 体验中心微信小程序网络图片识别、二维码识别、数字识别等8项能力全新上线。

 1. 医疗票据 OCR 方案 

•  医疗费用结算单识别、医疗发票识别、病案首页识别模型全面升级
优化模型效果,各字段平均准确率提升4%+,可用于医疗保险智能理赔、健康管理等场景。
>>查看详情
https://ai.baidu.com/tech/ocr_medical
 
 2. 安全生产监控方案 
•  视频分析边缘计算盒 EM-BOX 全新升级
EasyMonitor 软硬一体方案硬件升级为高品质版本 FZ5C,被动式散热,防尘抗震。预置安全帽、烟火检测、电子围栏、陌生人检测、攀高、睡岗、离岗、人流过密技能。充分利旧现有摄像头,即插即用,提供可视化管理平台,支持二次开发。
>>查看详情
https://aim.baidu.com/product/6c6610fb-9104-4816-9fde-56697d390e57
 
 1. 人脸与人体识别 
•  人体关键点模型升级
全面优化模型在不同场景下的识别效果,持续提升21个关键点的识别准确率。可用于监控场景检测判断人员入侵或特定异常行为,及时预警;或面向视频直播平台、线下互动屏幕,增加身体道具、体感游戏等互动形式,丰富娱乐体验。
>>立即体验
https://ai.baidu.com/tech/body/pose
  
 2. OCR 4项能力全面升级 
•  火车票识别模型升级
『姓名、席别、日期、票价、目的站、起始站 』等关键字段准确率提升至99%以上。可用于财务报销、日程记录等场景。
>>立即体验
https://ai.baidu.com/tech/ocr_receipts/train_ticket
  护照识别模型升级
新增支持4个字段:『护照类型、国籍、MRZCode1、MRZCode2』;关键字段识别准确率提升至95%以上。
>>立即体验
https://ai.baidu.com/tech/ocr_cards/passport
•  户口本识别模型升级
新增支持 15 个字段:户号、曾用名、籍贯、宗教信仰、身高、血型、文化程度、婚姻状况、登记日期等,已支持识别户口本内页(常住人口登记卡)的全部22个字段。
>>立即体验
https://ai.baidu.com/tech/ocr_cards/household_register
 
• 混贴票据识别模型升级
在增值税发票、定额发票、卷票、火车票、出租车票、行程单、机动车销售发票7类票据的基础上,新增支持汽车票、通行费发票混贴识别能力。
>>立即体验
https://ai.baidu.com/tech/ocr/mixed_receipt
 
>>了解更多 OCR 产品服务
https://ai.baidu.com/tech/ocr
 
•  OCR 机动车销售发票识别 正式商用
结构化识别机动车销售发票的26个关键字段,包括发票代码、开票日期、机器编号、购买方信息、车辆信息等。多档规格“次数包”火热开售,价格低至7元/千次。
>>查看详情
https://ai.baidu.com/tech/ocr_cars/vehicle_invoice
•  OCR 车辆合格证识别 正式商用
可识别车辆合格证的23个关键字段,包括合格证编号、品牌、名称、型号等车辆信息。价格低至7元/千次,可用于车辆信息登记,汽车后市场服务等场景。
>>查看详情
https://ai.baidu.com/tech/ocr_cars/vehicle_certificate
•  OCR 通用机打发票识别 正式商用
识别国家/地方税务局发行的横/竖版通用机打发票的19个关键字段,包括发票类型、发票号码、开票日期、商品名称等。价格低至6.4元/千次,可用于财务报销、账单记录等场景。
>>查看详情
https://ai.baidu.com/tech/ocr_receipts/invoice
  
•  音频文件转写 正式商用
支持批量音频快速识别,专有集群承载大流量并发;可识别普通话、略带口音的中文、英文,支持16000采样率(即 16K)音频转写。同时基于电话客服场景下8000采样率(即 8K)专属数据训练识别模型,识别效果更精准。支持“次数包”“按量后付费”两种购买方式,价格低至每小时0.6元。
>>查看详情
https://ai.baidu.com/tech/speech/aasr
 
飞桨 PaddlePaddle 开源深度学习平台、零门槛 AI 开发平台 EasyDL、全功能 AI 开发平台 BML、AI 学习与实训社区 AI Studio 发布多项升级。
 
 1. 飞桨 PaddlePaddle 开源深度学习平台 
•  百度飞桨 PaddleDetection 威力再显,助力获得两项 ECCV 目标检测冠军
百度视觉团队借助 PaddleDetection 在计算机视觉顶会 ECCV 2020 (European Conference on Computer Vision,欧洲计算机视觉国际会议)比赛中,斩获两个赛道冠军,分别是 Tiny Object Detection 和目标检测领域最权威的比赛 COCO。
>>查看详情
https://mp.weixin.qq.com/s/D6zIjJ9K5gnPZumKMwx8wA
 
•  PaddleSlim 重磅开源 SlimX 系列13个小模型,覆盖人脸识别、分类、检测和 OCR
PaddleSlim 发布了 SlimMobileNet、SlimFaceNet、SlimDetNet、SlimTextNet 四大系列13个业界领先的工业级小模型。除基础模型,PaddleSlim 还开源了垂类模型。
>>查看详情
https://mp.weixin.qq.com/s/N5J8iwh6vsX2ZtBKyxLT4g
 
•  体积再降60%,3.5M 超轻量中英文 OCR 模型开源,性能效果同时提升
PaddleOCR 发布三个系列模型,满足移动端、服务器端各种场景需求。支持多种语言,全部训练代码和模型毫无保留开源。其中 3.5M 超轻量文字识别模型,堪称目前业界开源的最轻量 OCR 模型。
>>查看详情
https://mp.weixin.qq.com/s/6yJUFTjuMbgforCY7s-C2w
 
 2. 飞桨企业版-零门槛 AI 开发平台 EasyDL 
EasyDL 零门槛 AI 开发平台支持 EasyData 智能数据服务、模型训练、服务部署等全流程功能,内置超大规模预训练模型,支持图像分类、物体检测、图像分割、音视频分类、文本分类、情感倾向分析等十余种模型类型,并支持公有云、私有化、设备端、软硬一体等多种部署方案。
•  EasyDL 经典版5项重磅升级
1. 支持更丰富的模型类型,支持更多技术方向 AI 服务定制:全新推出 NLP 定制文本实体抽取、定制语音识别、定制结构化数据分析;定制化目标跟踪开放邀测。
2. 全新发布模型市场:支持用户将训练好的模型接入 AI 市场售卖,同时可在模型市场购买第三方模型,并支持再训练。

3. 离线模型部署方案持续升级:

  • 图像分类模型设备端 LinuxSDK 新增针对比特大陆芯片的适配与加速,预测时间快至6毫秒;

  • NLP 定制能力,包括文本单标签、多标签、情感倾向分析模型,新增支持私有 API 本地服务器部署;

  • EasyDL 软硬一体方案专用 SDK 支持在线购买,设备端 SDK 支持按产品线鉴权,满足更灵活的场景应用。

4. 物体检测模型,新增「超高精度」、「均衡」两种算法,提供更丰富的算法选择,可满足不同业务场景对模型精度与性能的不同需求。

5. 文本分类单标签模型全新升级,后端框架接入文心,支持高精度与高性能两大算法,在保障模型效果的同时,大幅度减少了训练所需的数据。

>>EasyDL 经典版,立即体验
https://ai.baidu.com/easydl/lite
 
•  EasyDL 专业版5项功能升级
1. 数据集新增 VOC 标注数据格式。
2. CV 视觉方向新增支持实例分割任务类型,支持2种网络。
3. NLP 文本方向新增文本实体抽取任务类型,新增多机训练与训练计费,部署支持自助获取私有化部署镜像。
4. 脚本调参视觉类模型训练支持 VisualDL,提供训练过程可视化。可以更直观、清晰地查看数据的特征与变化趋势,有利于分析数据、发现错误,进而改正脚本的设计,即使发现训练中的异常,提前中止训练,节省时间和资源。
5. Notebook开发环境持续优化:接入 VisualDL、支持性能监控、支持文件打包下载、Python 文件编辑集成 LSP,支持 Paddle1.8.4,提示开发效率功能优化。
>>EasyDL 专业版,立即体验
https://ai.baidu.com/easydl/pro
 
•  EasyDL 零售版3项服务功能升级
1.【商品排面占比统计】服务功能全新上线,支持统计商品排面数/占比、未识别商品数、空位数及货架利用率。
2.【商品陈列层数识别】服务功能升级,支持识别商品陈列所在货架层数,统计货架总层数,以及判断货架是否拍摄完整。
3.【商品陈列场景识别】服务功能升级,支持货架、端架、立式冰柜、地堆、割箱五类场景。
>>EasyDL 零售版,立即体验
https://ai.baidu.com/easydl/retail
 
 3. 全功能 AI 开发平台 BML 
 
BML 面向大型企业提供功能全面、可灵活定制和被深度集成的开发平台。平台面向企业用户同时提供机器学习和深度学习服务能力,实现从数据标注,数据源管理、数据集、数据预处理、模型训练,到模型管理、预测服务管理、监控服务等全 AI 工作周期管理。支持私有化交付到本地环境。
•  智能文本生产线
集成文心 ERNIE2.0,预置文本分类、情感倾向分析、短文本匹配、文本相似度、词性标注、命名实体识别、实体关系、实体属性等多个预训练模型,通过少量数据即可获得高精度模型。
•  数据标注模块升级
全新支持多人协同标注与审核,新增 NLP、OCR 7类细分场景的标注功能,提供更灵活易用的数据服务。
•  基础管控重大升级
支持更加灵活的角色与权限配置,新增组织概念,支持多层级的资源管理和分配,提升资源综合利用率;增强审批、全过程留痕等企业级功能。
 
 4. AI 学习与实训社区 AI Studio 
•  Notebook 全新升级
集成的 VisualDL 更新为2.0.3版本,SSH 模式连接 timeout 时间延长为2小时,进一步提升编程体验。
•  课程学习地图支持定制化
系统化的 AI 学习地图全新上线, 同时支持用户定制自己的学习地图,大幅度提升 AI 学习体验。
>>立即体验
https://aistudio.baidu.com/aistudio/learnmap
•  热力图功能上线
行为热力图上线, 可记录运行项目、公开项目、数据集等信息,自动记录 AI 学习成长之路。
>>查看详情
https://aistudio.baidu.com/aistudio/usercenter
•  PPDE(飞桨开发者技术专家)徽章重磅上线

 

>>了解 PPDE
https://www.paddlepaddle.org.cn/ppde
 
丰富的 AI 上下游产品聚集地,无缝对接买卖双方,撮合交流,快速应用。
•  模型市场全面开放
EasyDL 经典版的模型训练者可将模型作为商品发布至 AI 市场中,为有模型训练需求的买方提供场景化模型,并获得相应收入或积分。模型购买后不仅可直接部署为服务使用,还可进行二次训练调优,极大节省模型训练的成本。
 
• 优质服务商及商品持续入驻
北京天创科林、深圳莱达四维、北京研华兴业、辽宁好尔斯、上海商路能等多家优质服务商于 AI 市场上线,并售卖人体测温设备、抓拍机、人脸识别门禁、镜头模组、智能机器人等硬件产品,同时上线了能源领域解决、AI 智能测肤、AI 医学影像标注等解决方案,性价比高,品质有保障。
>>了解更多参见
https://aim.baidu.com/
部分新品展示

18寸桌面人证核验机

图像摄取、人脸定位、图像预处理、以及人脸识别(身份确认或者身份查找)

>>立即购买

 https://aim.baidu.com/product/9bbfd8ff-99ec-46d3-a26e-7b5435d71f36

 

2、设备漏油检测

对变电站设备如变压器、电抗器储油柜等,对识漏油情况进行检测识别

>>立即购买

 

 https://aim.baidu.com/product/393e9f21-47ff-4327-addc-5f1fc201a10f

 

3AI智能测肤解决方案

检测数据齐全,互动定制AI测肤

>>立即购买

 https://aim.baidu.com/product/1b8262aa-efba-4ecf-a9d2-dc758be570a8

 

目前,百度大脑 AI 开放平台面向广泛的企业和开发者共开放了273项技术能力,超过230万开发者使用,已成为业内开放能力最全面和领先、服务规模最大、开发者首选的 AI 平台。
同时百度大脑核心技术引擎,作为百度智能云的底座,也将持续通过智能云为行业客户提供优质的平台方案和智能化解决方案。
 
百度 AI 体验中心小程序上新网络图片识别、二维码识别、数字识别、护照识别、VIN 码识别、车辆合格证识别、行程单识别、仪器仪表盘读数识别等8项能力。目前百度 AI 体验中心已上线图像技术、人脸与人体识别、语音技术、知识与语音等方向70余项能力。
微信扫描二维码进入百度 AI 体验中心,立即体验全球领先的 AI 科技。

 

技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术