开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

简介

Hi,您好,欢迎使用百度图像识别API服务。

本文档主要针对API开发者,描述百度图像识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

接口能力

图像识别接口一览表

接口名称 接口能力简要描述
图像单主体检测 识别图像中的主体具体坐标位置。
图像多主体检测 检测出图片中多个主体,并给出位置、标签和置信得分。
通用物体和场景识别高级版 识别图片中的场景及物体标签,支持10w+标签类型。
菜品识别 检测用户上传的菜品图片,返回具体的菜名、卡路里、置信度信息。
自定义菜品识别 入库自定义的单菜品图,实现上传多菜品图的精准识别,返回具体的菜名、位置、置信度信息
logo商标识别 识别图片中包含的商品LOGO信息,返回LOGO品牌名称、在图片中的位置、置信度。
动物识别 检测用户上传的动物图片,返回动物名称、置信度信息。
植物识别 检测用户上传的植物图片,返回植物名称、置信度信息。
果蔬食材识别 检测用户上传的果蔬类图片,返回果蔬名称、置信度信息。
地标识别 检测用户上传的地标图片,返回地标名称。
红酒识别 识别图像中的红酒标签,返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息。
货币识别 识别图像中的货币类型,返回货币名称、代码、面值、年份信息,可识别百余种国内外常见货币。

请求格式

POST方式调用

注意:Content-Type为application/x-www-form-urlencoded,然后通过urlencode格式化请求体。

返回格式

JSON格式

请求限制

请求图片需经过base64编码:图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。

注意:图片的base64编码是不包含图片头的,如(data:image/jpg;base64,)

请求格式支持:PNG、JPG、JPEG、BMP**

接口名称 图片编码后大小限额
通用物体和场景识别 base64编码后大小不超过4M,最短边至少30px,最长边最大4096px,长宽比3:1以内
菜品识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
自定义菜品识别 base64编码后大小不超过4M,最短边至少300px,最长边最大3000px,长宽比3:1以内
logo商标识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
图像单主体检测 base64编码后大小不超过4M,最短边至少20px,最长边最大4096px,长宽比3:1以内
图像多主体检测(邀测) base64编码后大小不超过4M,最短边至少64px,最长边最大4096px,长宽比3:1以内
动物识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
植物识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
果蔬食材识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
地标识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
红酒识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
货币识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
上一篇
视频专区
下一篇
调用方式