资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

简介

Hi,您好,欢迎使用百度图像识别API服务。

本文档主要针对API开发者,描述百度图像识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

接口能力

图像识别接口一览表

接口名称 接口能力简要描述
通用物体和场景识别 识别图片中的场景及物体标签,支持10w+标签类型。
图像单主体检测 识别图像中的主体具体坐标位置。
动物识别 检测用户上传的动物图片,返回动物名称、置信度信息。
植物识别 检测用户上传的植物图片,返回植物名称、置信度信息。
logo识别 识别图片中包含的商品LOGO信息,返回LOGO品牌名称、在图片中的位置、置信度。
果蔬识别 检测用户上传的果蔬类图片,返回果蔬名称、置信度信息。
图像多主体检测 检测出图片中多个主体,并给出位置、标签和置信得分。
图像内容理解 多维度识别与理解图片内容,包括人、物、行为、场景、文字等,输出对图片内容的描述。
货币识别 识别图像中的货币类型,返回货币名称、代码、面值、年份信息,可识别百余种国内外常见货币。
菜品识别 检测用户上传的菜品图片,返回具体的菜名、卡路里、置信度信息。
地标识别 检测用户上传的地标图片,返回地标名称。
自定义菜品识别 入库自定义的单菜品图,实现上传多菜品图的精准识别,返回具体的菜名、位置、置信度信息
车辆外观损伤识别 针对常见小汽车车型,识别车辆外观受损部件及损伤类型,可识别数十种车辆部件、五大类外观损伤(刮擦、凹陷、开裂、褶皱、穿孔)。
车辆属性识别 检测图像中的各类车辆,并针对小汽车识别11种外观属性,包括:是否有车窗雨眉、是否有车顶架、副驾驶是否有人等。
车辆检测 检测图片中出现的所有车辆,返回车辆类型与位置,可识别小汽车、卡车、巴士、摩托车、三轮车5类车辆。
车型识别 检测用户上传的车辆图片,识别所属车型,包括车辆品牌及具体型号、颜色、年份、位置信息。

请求格式

POST方式调用

注意:Content-Type为application/x-www-form-urlencoded,然后通过urlencode格式化请求体。

返回格式

JSON格式

请求限制

请求图片需经过base64编码:图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。

注意:图片的base64编码是不包含图片头的,如(data:image/jpg;base64,)

请求格式支持:PNG、JPG、JPEG、BMP

接口名称 图片编码后大小限额
通用物体和场景识别 base64编码后大小不超过4M,最短边至少30px,最长边最大4096px,长宽比3:1以内
图像单主体检测 base64编码后大小不超过4M,最短边至少20px,最长边最大4096px,长宽比3:1以内
动物识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
植物识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
logo识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
果蔬识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
图像多主体检测 base64编码后大小不超过4M,最短边至少64px,最长边最大4096px,长宽比3:1以内
图像内容理解 base64 编码大小不超过 10M,最短边至少 64px,最长边最大 8192px,长宽比3:1以内
货币识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
菜品识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
地标识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
自定义菜品识别 base64编码后大小不超过4M,最短边至少300px,最长边最大3000px,长宽比3:1以内
车辆外观损伤识别 base64编码后大小不超过4M,最短边至少50px,最长边最大4096px,长宽比3:1以内
车辆属性识别 base64编码后大小不超过4M,最短边至少50px,最长边最大4096px,长宽比3:1以内
车辆检测 base64编码后大小不超过4M,最短边至少50px,最长边最大4096px,长宽比3:1以内
车型识别 base64编码后大小不超过4M,最短边至少50px,最长边最大4096px,长宽比3:1以内
上一篇
购买指南
下一篇
调用方式