十一月 BML 预置模型调参再添新利器,新增文字识别模型,可识别20+语种,支持图片的文字标注, 预置飞桨独家 PP-OCR 模型,支持表单式建模,为开发者提供更便捷的“炼丹”方式。EasyDL 图像分类上线「免训练极速迭代模式」,数据新增无需训练可得新模型,可广泛适用于数据集量大、模型迭代频繁的业务场景,如零售快消行业等。
本月共19项重要产品能力升级、上新,下面就给你带来 AI 产品升级最新动态。
#重点抢先看#
>> BML 预置模型调参新增文字识别模型,可识别20+语种
- 支持20+语种的文字识别,可广泛处理国际合同、外语教材等多语种场景
- 支持图片的文字标注,OCR 的图片在线标注便捷又可靠
- 预置飞桨独家 PP-OCR 模型,支持用户自行上传数据进行重训,并进行 API 服务部署和调用
- 支持表单式建模,为开发者提供更便捷的炼丹方式
快速体验 https://ai.baidu.com/bml/
>> 业界领先!EasyDL 图像分类上线「免训练极速迭代模式」,数据新增无需训练可得新模型【全新发布】
- 功能优势:开发者在图像分类任务下选择快速迭代模式,新增标签/数据时无需再次训练即可更新模型,极大提高开发效率
- 典型场景:广泛适用于数据集量大、模型迭代频繁的业务场景,如零售快消行业等
快速体验 https://ai.baidu.com/easydl/
>> 印章识别【正式商用】
支持检测并识别合同文件或常用票据中的印章,输出文字内容及印章位置信息,支持圆形章、椭圆形章、方形章等常见印章;多档次数包火热开售,单次调用低至0.008元。
查看详情 https://ai.baidu.com/tech/ocr/seal
>> 智能财务票据识别【正式商用】
支持13类常见财务票据智能分类及结构化识别,无需提前手动分类,可自动切分识别粘贴在同一张 A4 纸上的多张不同票据;同时可返回发票验真所需的6要素信息,方便快速对接验真服务;多档次数包火热开售,单次调用低至0.03元。
立即体验 https://ai.baidu.com/tech/ocr/multiple_invoice
>> 出生证明识别【正式商用】
结构化识别出生医学证明的23个关键字段,可用于新生儿身份登记、入学登记、生育险报销等场景;多档规格“次数包”火热开售,单次调用低至0.018元。
查看详情 https://ai.baidu.com/tech/ocr_cards/birth_certificate
>> 快递面单识别离线 SDK【能力升级】
结构化识别各类常见版式面单的4个关键字段信息:收/寄件人手机号、运单号、条形码;新增支持各角度旋转面单识别,贴近真实业务拍摄场景;同时专项优化京东、顺丰面单版式识别效果,大幅提升手机号、运单号字段的识别准确率。支持 Android、iOS 操作系统,可集成在手机、PDA 巴枪、驿站高拍仪等设备中,毫秒级响应,节省派送过程中的每一秒。
申请免费试用 https://ai.baidu.com/consultation/cooperation?referrerUrl=/tech/ocr_sdk
>> 通用文字识别高精度版/高精度含位置版【能力升级】
新增长图识别能力,最长可支持边长8192px,大小在 10M 以内的图片文字识别;支持英文内容按照单词维度输出结果,方便提取单词粒度文本进行业务开发。针对包含弯曲文本、艺术字体、特殊符号等文字内容,以及含多余背景、低像素、非均匀光照等复杂场景下的文本数据专项优化,基于百度自研文字识别算法方案,增强语义理解能力,提高文本特征鲁棒性,大幅提升识别准确率,助力各行各业准确快速提取业务图片中的文本内容。
查看详情 https://ai.baidu.com/tech/ocr/general
>> 文本审核 【能力升级】
新增近千条词典内容,覆盖最新公布的“清朗·‘饭圈‘乱象整治”专项行动中,所涉及的政治人物敏感词汇、劣迹艺人等,实时降低业务风险。
专项优化在史料及基层公务员职位名称场景下的识别准确率,有效降低人工复审成本。
立即体验 https://ai.baidu.com/tech/textcensoring
>> 长文本在线合成产品【全新发布】
可将超长文本快速转换成稳定流畅、饱满真实的音频。最高支持10万字文本一次性合成,提供多种优质音库选择,广泛应用于阅读听书、新闻播报等场景。
查看详情 https://ai.baidu.com/tech/speech/long_tts
>> 离线合成 Android SDK【能力升级】
新增对在离线混合模式下 5G 网络的支持,提升稳定性。
查看详情 https://ai.baidu.com/ai-doc/SPEECH/Qk4nwu25z
飞桨企业版-零门槛 AI 开发平台 EasyDL
>> EasyDL 物体检测新增支持自定义四边形识别,解决轮廓复杂物体标注难题!【能力升级】
- 功能优势:相较于此前矩形标注,能够更贴合目标物体的轮廓进行标注。从而获得识别度更准确的模型
- 典型场景:适用于目标物体形状不规则、倾斜或异形,自定义四边形可以提供更精准的标注功能
>> EasyDL 物体检测超高精度算法迭代升级,预测时延平均缩短一半以上!【能力升级】
对 EasyDL 物体检测任务的超高精度算法进行性能优化,效果显著。以工业质检流水线场景为例,此前流水线一个零件是否存在瑕疵的预测,结果返回时间平均为 3400ms,上线后该时间平均缩短为 1400ms,极大提高了场景应用的落地效率。
快速体验 https://ai.baidu.com/easydl/
飞桨企业版–全功能 AI 开发平台 BML
>> BML 预付费小时包特惠上线,最低1.2元/小时【能力升级】
BML 新增预付费小时包,包含 GPU/CPU 等多种规格训练算力,适用于预置模型调参、Notebook 训练、自定义作业等多种训练方式,速度快、资费低,训练算力最低仅1.2元/小时。
快速体验 https://ai.baidu.com/bml/
飞桨 PaddlePaddle 开源深度学习平台
>> PaddleDetection v2.3:发布业界 SOTA 模型,开源实时跟踪系统【全新升级】
- 移动端超轻量目标检测算法 PP-PicoDet
PP-PicoDet 采用百度自研的超轻量、高精度骨干网络--ESNet,其系列中的 PP-PicoDet-S_320 参数量仅0.99M,精度可达到30.6%mAP,推理速度可达150FPS。
- 超轻量多人关键点算法 PP-TinyPose
速度在 FP16 下 122FPS 的情况下,精度可达到51.8%AP。对关键点检测人数无上限,针对大尺幅图像中的小目标及多人同时检测等产业场景,精度和速度都有显著优势。
- 超强实时跟踪系统 PP-Tracking
提供跨镜头跟踪、人流/车流计数等系列能力与应用,覆盖人、自行车、小轿车等上十种目标类型,同时覆盖小目标等复杂场景;内置业界领先的跟踪算法 DeepSort、FairMOT,结合百度自研特色 ReID 和明星检测模型,灵活适配多种场景,高精且实时。
快速体验 https://github.com/PaddlePaddle/PaddleDetection
丰富的 AI 上下游产品聚集地,无缝对接买卖双方,撮合交流,快速应用。
>> 优质服务商及商品持续入驻:
小事科技成都有限公司等多家优质服务商在 AI 市场上线并售卖:垃圾分类破袋检测软硬一体方案、巡防上报巡逻巡检任务下派方案、高性价比 DTU、RV1126 雷视一体机通用 AI 视觉组件等软硬件产品。
查看详情 https://aim.baidu.com/
>> 部分新品展示:
1. 苏州光创电子科技有限公司- -RV1126雷视一体机通用 AI 视觉组件
立即购买 https://aim.baidu.com/product/f6616a22-574e-4724-895c-72851aa1d83b
2. 北京腾锐视讯数字技术有限公司-高性价比 DTU
立即购买 https://aim.baidu.com/product/bfba5765-1690-42c4-8228-45358bf67a2a
3. 小事科技成都有限公司-巡防上报巡逻巡检任务下派方案、
立即购买 https://aim.baidu.com/product/47dcfcd8-c885-4653-a475-b4807ae0ce66
4. 武汉禾远动视传媒有限公司-高性能数据可视化搭建工具数据魔方
立即购买 https://aim.baidu.com/product/fbb832a2-2eae-4651-821a-25295ca02dce
5. 北京微网通联股份有限公司-微网通联 GMP 聚合消息服务平台
立即购买 https://aim.baidu.com/product/fcb3ff3d-dd48-41c4-b6b8-3b2f5953c5bb
看起来好厉害的样子
PaddleDetection好厉害