资讯 社区 文档
图像识别技术详细操作指南:完整代码和可视化DEMO让你轻松上手
发布日期:2019-08-30 11:34浏览量:3671次

百度图像识别基于百度深度学习能力,提供车辆识别、图像识别、图像效果增强等能力。百度图像识别还在全球两大视觉竞赛WebVisionActivityNet中分别击败100多家参赛单位和队伍,获得多项世界第一。灵活应用于交通、影视、旅游、企业服务等行业场景,满足影视抠图、应用软件、安防监控等业务需求。

除此之外,还有更多图像识别的技术能力等待你去探索!

【敲门砖】

快速上手,请访问官方文档:

图像方向:https://ai.baidu.com/docs#/ImageCensoring-API/top

【点金石】

百度图像识别技术方向,已经有很多开发者在不断地探索应用。本次,将为大家提供众多热心开发者的实战经验分享,从技术应用的源代码到可视化DEMO,让你轻松上手,包教包会。

1)车辆外观损伤识别

作者:wangwei8638     

通过一篇车辆外观损伤识别API调用的使用攻略,带你还原如何帮助车主或保险定损人员对上传的车损照片自动识别受损部件及损伤类型,感受快速在线定损的新实践,快来试试吧!

链接:http://ai.baidu.com/forum/topic/show/943778

适用场景:车辆保险

2)车流统计(动态版)

作者:wangwei8638     

车流统计(动态版)技术能为我们返回图像中车辆的类型和坐标位置,以及运动轨迹,主要应用于智慧交通领域。可方便监控城市道路交通情况,实现拥堵预警。本篇案例对选取的车辆场景所返回的识别结果准确,车辆分类基本正确。需要特别注意的是,对于远处车辆的识别会在一定程度上受到图片质量等因素的影响。

链接:http://ai.baidu.com/forum/topic/show/943737

适用场景:智慧交通

3)车辆分割

车辆分割可提取图片中的车辆,可为后续交管部门或影视传媒公司提供一键抠像、替换背景等后续帮助。在用户传入单帧图像后,可支持识别车辆轮廓范围、背景分离、返回分割后的二值图、灰度图等操作。在以下几篇攻略中,对于单车、多车、异形车、车辆不同开门数量及背景色与前车相近等场景的分割实战,也均有不俗的表现。

作者:wangwei8638     

链接:https://ai.baidu.com/forum/topic/show/953169

作者:才能我浪费99

链接:https://ai.baidu.com/forum/topic/show/953191

作者:让天涯  

链接:https://ai.baidu.com/forum/topic/show/953771

适用场景:影视传媒、智慧交通

4)黑白图像上色

想必大家家里的旧相册中都有很多黑白老照片,里面都充满着亲友间满满的回忆。在以下两篇攻略中,手把手教你如何用代码将黑白图像上色技术活学活用,使黑白图像充满色彩并变得鲜活,让老照片重新焕发新活力。

作者:才能我浪费99    

链接:http://ai.baidu.com/forum/topic/show/943378

作者:让天涯 

链接:https://ai.baidu.com/forum/topic/show/953084

适用场景:影视媒体、生活服务

5)图像去雾

作者:才能我浪费99     

在浓雾天气下拍摄,往往会导致照片细节无法辨认。别担心,本篇教程将带你从Python3的调用认证授权开始,轻松帮你对图像进行去雾处理,还原更清晰真实的自然图像。

链接:http://ai.baidu.com/forum/topic/show/943289

适用场景:影视媒体、生活服务

6)货币识别

生活中,我们接触到外币的机会越来越多,而因此引发的相关诈骗案件也随之频发。我们将如何从这么多的外币中分清具体是哪国的货币以及面值大小呢?下面,就送给大家两套代码,教你通过调用货币识别接口,让大家足不出户分分钟识别货币类型,亲测民国旧币也可识别哟!

作者:让天涯 

链接:https://ai.baidu.com/forum/topic/show/953076

作者:才能我浪费99   

链接:http://ai.baidu.com/forum/topic/show/943417

适用场景:生活服务、企业服务

7)红酒识别

如何识别市面上成千上万种不同品牌、地域、特性和年份的红酒?哪又如何创建自己专属的百度智能识酒小程序?快看,为你直接奉上两篇描述清晰,代码齐全、步骤简单的详细教程。让你稍微动动手,就胜过无数老酒友~

作者:才能我浪费99     

链接:https://ai.baidu.com/forum/topic/show/953183

作者:756665228

链接:https://ai.baidu.com/forum/topic/show/954058

适用场景:生活服务

8)拉伸图像恢复

作者:让天涯

当我们看一张图片时,如果感觉画面让人看起来偏扁偏胖时,那很有可能就是这张图片的长宽比例不对。而这时就可以通过采用拉伸图恢复技术,将图像内容恢复成正常比例。本文将采用C# 语言的形式,带你成功调用在线API接口,为你还原图像本来的真实风貌。

链接:https://ai.baidu.com/forum/topic/show/953780

适用场景:影视媒体、生活服务


9
)地标识别

听说有人通过微信创建了地表识别小程序?听说还有人通过地标识别+百度百科就看遍和认识了天下名胜?对于久憋家中的我们,又怎么不想拥有这样的强大技能呢!下面,就用超详细的简单步骤,让你也成为一名优秀的小小旅行家。

作者:756665228

链接:http://ai.baidu.com/forum/topic/show/943764

作者:才能我浪费99

链接:http://ai.baidu.com/forum/topic/show/943434

适用场景:旅游行业、生活服务

10)果蔬识别

作者: wangwei8638

每当到了下樱桃和车厘子的季节时,面对这两种极为相似的水果却让大家傻傻分不清楚了。这两种水果看起来十分相近,但价格却差别巨大,那么如何才能分清这两种截然不同的品种呢?快来紧跟本文脚步,让你亲自动手,帮助更多人分清60/斤的进口车厘子和来自中国本土15/斤的大樱桃

链接:http://ai.baidu.com/forum/topic/show/943376

适用场景:生活服务

11)植物识别 

作者:才能我浪费99

近期,植物识别技术进行了模型升级,Top1准确率绝对值提升11.76%,支持识别2万种多种植物和近8千种花卉,精度保持业界领先!下面,通过带你接入植物识别接口,将为你上传的植物照片返还可能性最大的种类结果和百科信息,让你轻松分清多肉、花卉和水生植物。

链接:https://ai.baidu.com/forum/topic/show/944126

适用场景:生活服务、旅游行业

12)通用物体与场景识别 

近期,通用物体与场景识别进行了模型升级,Top1准确率绝对值提升7%,可支持超过10万类物体和场景识别!接下来,除了教你如何搭上接口的方法为你返回单张图片内的1个或多个物体名称并关联百科信息外,更有尝试将QT界面和API接口结合的详细方法,将通用物体与场景识别进行界面化,快来学习体验吧!

作者:才能我浪费99

链接:https://ai.baidu.com/forum/topic/show/944128

作者:busyboxs

链接:https://ai.baidu.com/forum/topic/show/951867

适用场景:广告传媒

————————————————【人脸人体】—————————————————


 
人脸人体技术详细操作指南:献上完整代码和可视化DEMO 

百度人脸基于百度深度学习能力,提供人脸检测与属性分析、人脸1:1对比、人脸搜索、活体检测等能力。百度人脸赢得ICME人脸106关键点检测冠军、多模态活体通过银行卡检测中心首批检测认证。灵活应用于金融、泛安防、零售等行业场景,满足身份核验、人脸考勤、闸机通行等业务需求。

百度人体分析,可以准确识别图像中的人体相关信息,提供人体检测与追踪、关键点定位、人流量统计、属性分析、行为识别、人像分割、手势识别等能力。

除此之外,还有更多人像特效、行为分析等技术能力等你探索!

【敲门砖】

快速上手,请访问官方文档:

人脸识别:https://ai.baidu.com/docs#/Face-Guide/top

人体分析:https://ai.baidu.com/docs#/Body-API/top

【点金石】

百度人脸与人体识别技术方向,已经有众多开发者进行软硬件的探索应用,并有热心开发者把积累的经验分享给大家,从技术应用的源代码到可视化DEMO,毫不吝啬,一起来围观:

1)人脸情绪实时识别

作者:荒墨丶迷失

结合众多开发者所困惑和疑问中,找出大家关注的“H5如何实现人脸识别”议题,展开详解,包括人脸检测接口V3版本接口能力,access_token 获取、前端H5的视频采集、得到图片数据,调用百度接口、拿到百度的数据后转化Java实体类,整个流程都有源代码分享,并提供了可视化Demo,这是一个非常方便的操作教程,直接Copy使用。

链接:http://ai.baidu.com/forum/topic/show/942902

适用场景:安防监控、娱乐场景

2)人脸融合

作者: wangwei8638

新手开发者,根据本篇人脸融合调用步骤,完整的操作代码,可以毫无压力使用接口,将模板照片和目标照片人物进行融合,具体应用场景等您探索。

链接:http://ai.baidu.com/forum/topic/show/943779

适用场景:娱乐场景、其他

3)人像分割

作者:才能我浪费99

人像分割识别图像中的人体轮廓,与背景进行分离,再与背景图结合就能实现身在Office,也能留下旅游胜地的形象。说干就干,代码奉上。

链接:http://ai.baidu.com/forum/topic/show/943365

适用场景:娱乐互动

4)手势识别

识别图片中的手势类型,返回手势名称、手势矩形框、概率分数,可识别24种常见手势,适用于手势特效、智能家居手势交互等场景。

支持的24类手势列表:拳头、OK、祈祷、作揖、作别、单手比心、点赞、Diss、我爱你、掌心向上、双手比心(3种)、数字(9种)、Rock、竖中指。

详细操作方法,参考如下:

作者: busyboxs    

链接:http://ai.baidu.com/forum/topic/show/943107

作者: wangwei8638

链接:http://ai.baidu.com/forum/topic/show/943776

适用场景:娱乐互动、其他

5)人体危险行为视频识别

作者: wangwei8638     

监控视频能及时发出危险预警,灾难或许能够避免。利用AI人体分析技术,也能够做到及时发现,及时干预,将隐患消除在萌芽状态。

链接:https://ai.baidu.com/forum/topic/show/954107

适用场景:安防监控

6)手部关键点识别

作者: 才能我浪费99     

对于输入的一张图片(可正常解码,且长宽比适宜),检测图片中的所有人手,输出每只手的坐标框、21个骨节点坐标信息。接入使用流程详细操作全解析。

链接:https://ai.baidu.com/forum/topic/show/954134

适用场景:娱乐互动、其他

7)人流量统计

统计图像中的人体个数和流动趋势,以头肩为主要识别目标统计人数,无需正脸、全身照,适应人群密集、各种出入口场景。

作者: wangwei8638

链接:http://ai.baidu.com/forum/topic/show/943751

适用场景:安防监控

作者:才能我浪费99

链接:https://ai.baidu.com/forum/topic/show/953160

适用场景:安防监控

作者: wangwei8638

链接:https://ai.baidu.com/forum/topic/show/953132

适用场景:安防监控


8)驾驶行为分析

针对车载场景,识别驾驶员使用手机、抽烟、不系安全带、双手离开方向盘等动作姿态,分析预警危险驾驶行为,提升行车安全性。

作者: 让天涯

链接:https://ai.baidu.com/forum/topic/show/955828

适用场景:安防监控

作者:才能我浪费99

链接:https://ai.baidu.com/forum/topic/show/954126

适用场景:安防监控

 

—————————————————【OCR】—————————————————


 探索交流OCR使用攻略,亲测实例代码解锁AI新技能 

百度文字识别已经广泛应用在安防监控、企业服务、教育行业等各个场景,如果你观望已久,不如行动起来,这里有官方文档示例、有AI开发者分享实例,让你get新技能!

【敲门砖】

百度文字识别是基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,印刷体文字识别准确率高达99%,多项ICDAR指标居世界第一。

除了百度通用文字识别、卡证识别、票据识别等,更有自定义模板文字识别自定义财会模板,帮助你实现个性化需求。

快速上手,官方文档:https://ai.baidu.com/docs#/OCR-API/top

 

【点金石】

百度文字识别技术方向,已经有很多开发者使用,并有热心开发者积累经验,同时分享给大家,从平台使用到基础应用,从示例代码到实际应用,包学包会:

1)车牌识别(作者: wangwei8638)

从平台接入到创建应用,都有分步骤拆解说明,可以按照文中截图信息,进行操作。同时作者还分享了使用方法、测试效果、全流程源代码,不容错过!

链接:https://ai.baidu.com/forum/topic/show/943028

适用场景:安防监控

 

2)手写文字识别作者:让天涯)

从信息智能化时代的办公、教育场景,分析具体业务痛点、场景需求和使用价值,作者详细撰写了使用攻略、源代码,开放共享给大家!

链接:https://ai.baidu.com/forum/topic/show/945112

适用场景:教育、企业服务

 

3)表格文字识别作者: wangwei8638)

从用户的原始需求出发,阐述了到如何调用接口,同时分享了多类表格的识别情况,共享了源代码,方便新手用户调用表格文字识别接口!

链接:https://ai.baidu.com/forum/topic/show/954201

适用场景:教育行业、企业服务

 

如果您也有相关攻略、案例、评测分享,欢迎投稿,获奖者最高得2000元礼品卡。

技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术