开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
图像识别

    接口说明

    通用物体识别

    该请求用于通用物体及场景识别,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的多个物体及场景标签。

    public void AdvancedGeneralDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用通用物体识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.AdvancedGeneral(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"baike_num", 5}
    	};
    	// 带参数调用通用物体识别
    	result = client.AdvancedGeneral(image, options);
    	Console.WriteLine(result);
    }

    通用物体识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    baike_num string 0 返回百科信息的结果数,默认不返回

    通用物体识别 返回数据参数详情

    字段 是否必选 类型 说明
    log_id uint64 唯一的log id,用于问题定位
    result_num unit32 返回结果数目,及result数组中的元素个数
    result arrry(object) 标签结果数组
    +keyword string 图片中的物体或场景名称
    +score float 置信度,0-1
    +root string 识别结果的上层标签,有部分钱币、动漫、烟酒等tag无上层标签
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    通用物体识别 返回示例

    {
      "log_id": 327863200205075661,
      "result_num": 5,
      "result": [{
        "score": 0.967622,
        "root": "公众人物",
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E6%96%B0%E5%9E%A3%E7%BB%93%E8%A1%A3/8035884",
          "image_url": "http://imgsrc.baidu.com/baike/pic/item/91ef76c6a7efce1b27893518a451f3deb58f6546.jpg",
          "description": "新垣结衣(Aragaki Yui),1988年6月11日出生于冲绳县那霸市。日本女演员、歌手、模特。毕业于日出高中。2001年,参加《nicola》模特比赛并获得最优秀奖。2005年,因出演现代剧《涩谷15》而作为演员出道。2006年,参演校园剧《我的老大,我的英雄》;同年,她还出版了个人首本写真集《水漾青春》。2007年,她从日出高校毕业后开始专注于演艺发展,并发表个人首张音乐专辑《天空》;同年,新垣结衣还主演了爱情片《恋空》,而她也凭借该片获得了多个电影新人奖项。2010年,主演爱情片《花水木》。2011年,主演都市剧《全开女孩》。2012年,相继参演现代剧《Legal High》、剧情片《剧场版新参者:麒麟之翼》。2013年,主演都市剧《飞翔情报室》。2014年,她主演了剧情片《黎明的沙耶》。2016年,主演爱情喜剧《逃避虽可耻但有用》,并凭借该剧获得了多个电视剧女主角奖项。2017年,主演爱情片《恋爱回旋》,凭借该片获得第60届蓝丝带奖最佳女主角;同年11月,她还凭借医疗剧《Code Blue 3》获得第94届日剧学院赏最佳女配角。"
        },
        "keyword": "新垣结衣"
      },
      {
        "score": 0.716067,
        "root": "人物-人物特写",
        "keyword": "头发"
      },
      {
        "score": 0.421281,
        "root": "商品-穿戴",
        "keyword": "围巾"
      },
      {
        "score": 0.22347,
        "root": "商品-五金",
        "keyword": "拉链"
      },
      {
        "score": 0.028031,
        "root": "商品-穿戴",
        "keyword": "脖套"
      }]
    }

    菜品识别

    该请求用于菜品识别。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的菜品名称、卡路里信息、置信度。

    public void DishDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用菜品识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.DishDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"top_num", 3},
    	    {"filter_threshold", "0.7"},
    	    {"baike_num", 5}
    	};
    	// 带参数调用菜品识别
    	result = client.DishDetect(image, options);
    	Console.WriteLine(result);
    }

    菜品识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    top_num string 返回预测得分top结果数,默认为5
    filter_threshold string 默认0.95,可以通过该参数调节识别效果,降低非菜识别率.
    baike_num string 0 返回百科信息的结果数,默认不返回

    菜品识别 返回数据参数详情

    字段 是否必选 类型 说明
    log_id uint64 唯一的log id,用于问题定位
    result_num unit32 返回结果数目,及result数组中的元素个数
    result array() 菜品识别结果数组
    +name string 菜名,示例:鱼香肉丝
    +calorie float 卡路里,每100g的卡路里含量
    +probability float 识别结果中每一行的置信度值,0-1
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    菜品识别 返回示例

    {
      "log_id": 7357081719365269362,
      "result_num": 5,
      "result": [
      {
        "calorie": "119",
        "has_calorie": true,
        "name": "酸汤鱼",
        "probability": "0.396031"
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E9%85%B8%E6%B1%A4%E9%B1%BC/1754055",
          "description": "酸汤鱼,是黔桂湘交界地区的一道侗族名菜,与侗族相邻的苗、水、瑶等少数民族也有相似菜肴,但其中以贵州侗族酸汤鱼最为有名,据考证此菜肴最早源于黎平县雷洞镇牙双一带。制作原料主要有鱼肉、酸汤、山仓子等香料。成菜后,略带酸味、幽香沁人、鲜嫩爽口开胃,是贵州“黔系”菜肴的代表作之一。这道菜通常先自制酸汤,之后将活鱼去掉内脏,入酸汤煮制。"
        }
      },
      {
        "calorie": "38",
        "has_calorie": true,
        "name": "原味黑鱼煲",
        "probability": "0.265432",
    
      },
      {
        "calorie": "144",
        "has_calorie": true,
        "name": "椒鱼片",
        "probability": "0.0998993"
      },
      {
        "calorie": "98",
        "has_calorie": true,
        "name": "酸菜鱼",
        "probability": "0.0701917"
      },
      {
        "calorie": "257.65",
        "has_calorie": true,
        "name": "柠檬鱼",
        "probability": "0.0471465"
      }]
    }

    车辆识别

    该请求用于检测一张车辆图片的具体车型。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的车辆品牌及型号。

    public void CarDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用车辆识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.CarDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"top_num", 3},
    	    {"baike_num", 5}
    	};
    	// 带参数调用车辆识别
    	result = client.CarDetect(image, options);
    	Console.WriteLine(result);
    }

    车辆识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    top_num string 返回预测得分top结果数,默认为5
    baike_num string 0 返回百科信息的结果数,默认不返回

    车辆识别 返回数据参数详情

    字段 是否必选 类型 说明
    log_id uint64 唯一的log id,用于问题定位
    color_result string 颜色
    result car-result() 车型识别结果数组
    +name string 车型名称,示例:宝马x6
    +score double 置信度,示例:0.5321
    +year string 年份
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述
    location_result string 车在图片中的位置信息

    车辆识别 返回示例

    {
      "log_id": 4086212218842203806,
      "location_result": {
        "width": 447,
        "top": 226,
        "height": 209,
        "left": 188
      },
      "result": [{
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E5%B8%83%E5%8A%A0%E8%BF%AAChiron/20419512",
          "description": "布加迪Chiron是法国跑车品牌布加迪出品的豪华超跑车。配置四涡轮增压发动机,420 公里每小时,有23种颜色的选择,售价高达260万美元。"
        },
        "score": 0.98793351650238,
        "name": "布加迪Chiron",
        "year": "无年份信息"
      },
      {
        "score": 0.0021970034576952,
        "name": "奥迪RS5",
        "year": "2011-2017"
      },
      {
        "score": 0.0021096928976476,
        "name": "奥迪RS4",
        "year": "无年份信息"
      },
      {
        "score": 0.0015581247862428,
        "name": "奥迪RS7",
        "year": "2014-2016"
      },
      {
        "score": 0.00082337751518935,
        "name": "布加迪威航",
        "year": "2004-2015"
      }],
      "color_result": "颜色无法识别"
    }

    logo商标识别

    该请求用于检测和识别图片中的品牌LOGO信息。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中LOGO的名称、位置和置信度。当效果欠佳时,可以建立子库(在控制台创建应用并申请建库)并通过调用logo入口接口完成自定义logo入库,提高识别效果。

    public void LogoSearchDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用logo商标识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoSearch(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"custom_lib", "true"}
    	};
    	// 带参数调用logo商标识别
    	result = client.LogoSearch(image, options);
    	Console.WriteLine(result);
    }

    logo商标识别 请求参数详情

    参数名称 是否必选 类型 可选值范围 默认值 说明
    image byte[] 二进制图像数据
    custom_lib string true - 返回自定义库
    false - 返回自定义库+默认库的识别结果
    false 是否只使用自定义logo库的结果,默认false:返回自定义库+默认库的识别结果

    logo商标识别 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 请求标识码,随机数,唯一 507499361
    result_num number 返回结果数目,即:result数组中元素个数 2
    result array 返回结果数组,每一项为一个识别出的logo -
    +location object 位置信息(左起像素位置、上起像素位置、像素宽、像素高) {"left": 100,"top":100,"width":10,"height":10}
    ++left number 左起像素位置 100
    ++top number 上起像素位置 100
    ++width number 像素宽 100
    ++height number 像素高 100
    +name string 识别的品牌名称 京东
    +probability number 分类结果置信度(0--1.0) 0.8
    +type number type=0为1千种高优商标识别结果;type=1为2万类logo库的结果;其它type为自定义logo库结果 1 (2万类的结果)

    logo商标识别 返回示例

    {
      "log_id": 843411868,
      "result_num": 1,
      "result": [
        {
          "type": 0,
          "name": "科颜氏",
          "probability": 0.99998807907104,
          "location": {
            "width": 296,
            "top": 20,
            "height": 128,
            "left": 23
          }
        }
      ]
    }

    logo商标识别—添加

    使用入库接口请先在控制台创建应用并申请建库,建库成功后方可正常使用。

    public void LogoAddDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	var brief = "{\"name\": \"宝马\",\"code\":\"666\"}";
    	
    	// 调用logo商标识别—添加,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoAdd(image, brief);
    	Console.WriteLine(result);
    }

    logo商标识别—添加 请求参数详情

    参数名称 是否必选 类型 说明
    image byte[] 二进制图像数据
    brief string brief,检索时带回。此处要传对应的name与code字段,name长度小于100B,code长度小于150B

    logo商标识别—添加 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 请求标识码,随机数,唯一 507499361
    cont_sign string 输入图片签名,可用于删除 -

    logo商标识别—添加 返回示例

    {
      "log_id": 972934653,
      "cont_sign": "217113248,419422301"
    }

    logo商标识别—删除

    使用删除接口请先在控制台创建应用并申请建库,建库成功后先调用入库接口完成logo图片入库,删除接口用户在已入库的logo图片中删除图片。

    public void LogoDeleteByImageDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用删除logo商标,传入参数为图片,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoDeleteByImage(image);
    	Console.WriteLine(result);
    }
    public void LogoDeleteBySignDemo() {
    	var contSign = "8cnn32frvrr2cd901";
    	
    	// 调用删除logo商标,传入参数为图片签名,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoDeleteBySign(contSign);
    	Console.WriteLine(result);
    }

    logo商标识别—删除 请求参数详情

    参数名称 是否必选 类型 说明
    image byte[] 二进制图像数据
    cont_sign string 图片签名(和image二选一,image优先级更高)

    logo商标识别—删除 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 请求标识码,随机数,唯一 507499361

    logo商标识别—删除 返回示例

    {
      "log_id": 50488417
    }

    动物识别

    该请求用于识别一张图片。即对于输入的一张图片(可正常解码,且长宽比适宜),输出动物识别结果

    public void AnimalDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用动物识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.AnimalDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"top_num", 3},
    	    {"baike_num", 5}
    	};
    	// 带参数调用动物识别
    	result = client.AnimalDetect(image, options);
    	Console.WriteLine(result);
    }

    动物识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    top_num string 6 返回预测得分top结果数,默认为6
    baike_num string 0 返回百科信息的结果数,默认不返回

    动物识别 返回数据参数详情

    参数 类型 是否必须 说明
    log_id uint64 唯一的log id,用于问题定位
    result arrry(object) 识别结果数组
    +name string 动物名称,示例:蒙古马
    +score uint32 置信度,示例:0.5321
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    动物识别 返回示例

    {
      "log_id": 7392482912853822863,
      "result": [{
        "score": "0.993811",
        "name": "叉角羚",
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E5%8F%89%E8%A7%92%E7%BE%9A/801703",
          "description": "叉角羚(学名:Antilocapra americana):在角的中部角鞘有向前伸的分枝,故名。体型中等,体长1-1.5米,尾长7.5-10厘米,肩高81-104厘米,成体重36-60千克,雌体比雄体小;背面为红褐色,颈部有黑色鬃毛,腹部和臀部为白色,颊面部和颈部两侧有黑色块斑;毛被下面为绒毛,上覆以粗糙、质脆的长毛,由于某些皮肤肌的作用,能使其毛被呈不同角度,以利于保暖或散热。植食。叉角羚奔跑速度非常快,最高时速达100千米。一次跳跃可达3.5-6米。善游泳。夏季组成小群活动,冬季则集结成上百只的大群。为寻找食物和水源,一年中常进行几次迁移。性机警,视觉敏锐,能看到数千米外的物体。遇险时,臀部的白色毛能立起,向同伴告警。分布于北美洲。"
        }
      },
      {
        "score": "0.000289439",
        "name": "印度羚"
      },
      {
        "score": "0.000186248",
        "name": "藏羚羊"
      },
      {
        "score": "0.000147176",
        "name": "跳羚"
      },
      {
        "score": "0.000134434",
        "name": "驯鹿"
      },
      {
        "score": "9.86555e-05",
        "name": "高鼻羚羊"
      }]
    }

    植物识别

    该请求用于识别一张图片。即对于输入的一张图片(可正常解码,且长宽比适宜),输出植物识别结果。

    public void PlantDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用植物识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.PlantDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"baike_num", 5}
    	};
    	// 带参数调用植物识别
    	result = client.PlantDetect(image, options);
    	Console.WriteLine(result);
    }

    植物识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    baike_num string 0 返回百科信息的结果数,默认不返回

    植物识别 返回数据参数详情

    参数 类型 是否必须 说明
    log_id uint64 唯一的log id,用于问题定位
    result arrry(object) 植物识别结果数组
    +name string 植物名称,示例:吉娃莲
    +score uint32 置信度,示例:0.5321
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    植物识别 返回示例

    {
      "log_id": 1705495792822072357,
      "result": [{
        "score": 0.99979120492935,
        "name": "莲",
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E8%8E%B2/2717141",
          "description": "莲(Nelumbo nucifera),又称荷、荷花、莲花、芙蕖、鞭蓉、水芙蓉、水芝、水芸、水旦、水华等,溪客、玉环是其雅称,未开的花蕾称菡萏,已开的花朵称鞭蕖,莲科,属多年生水生宿根草本植物,其地下茎称藕,能食用,叶入药,莲子为上乘补品,花可供观赏。是我国十大名花之一。是印度的国花。莲,双子叶植物,睡莲科。多年生挺水草本植物。根状茎横走,粗而肥厚,节间膨大,内有纵横通气孔道,节部缢缩。叶基生,挺出水面,盾形,直径30-90cm,波状边缘,上面深绿色,下面浅绿色。叶柄有小刺,长1-2m,挺出水面。花单生,直径10-25cm,椭圆花瓣多数,白色或粉红色;花柄长1-2m。花托在果期膨大,直径5-10cm,海绵质。坚果椭圆形和卵圆形,长1.5-2.0cm,灰褐色。种子卵圆形,长1.2-1.7cm,种皮红棕色。生于池塘、浅湖泊及稻田中。中国南北各省有自生或栽培,经济价值高。人们习惯上称种子为“莲子”、地下茎为“藕”、花托为“莲蓬”、叶为“荷叶”。"
        }
      },
      {
        "score": 0.00015144718054216,
        "name": "红睡莲"
      },
      {
        "score": 1.2172759852547e-05,
        "name": "白睡莲"
      },
      {
        "score": 6.305016540864e-06,
        "name": "延药睡莲"
      },
      {
        "score": 3.6133328649157e-06,
        "name": "华夏慈姑"
      }]
    }

    图像主体检测

    用户向服务请求检测图像中的主体位置。

    public void ObjectDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用图像主体检测,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.ObjectDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"with_face", 0}
    	};
    	// 带参数调用图像主体检测
    	result = client.ObjectDetect(image, options);
    	Console.WriteLine(result);
    }

    图像主体检测 请求参数详情

    参数名称 是否必选 类型 可选值范围 默认值 说明
    image byte[] 二进制图像数据
    with_face string 0 - 不带人脸区域
    1 - 带人脸区域
    1 如果检测主体是人,主体区域是否带上人脸部分,0-不带人脸区域,其他-带人脸区域,裁剪类需求推荐带人脸,检索/识别类需求推荐不带人脸。默认取1,带人脸。

    图像主体检测 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 唯一的log id,用于问题定位 507499361
    result object 裁剪结果 -
    +left number 表示定位位置的长方形左上顶点的水平坐标 50
    +top number 表示定位位置的长方形左上顶点的垂直坐标 60
    +width number 表示定位位置的长方形的宽度 200
    +height number 表示定位位置的长方形的高度 200

    图像主体检测 返回示例

    {
      "log_id": 895582300,
      "result": {
        "width": 486,
        "top": 76,
        "left": 134,
        "height": 394
      }
    }

    地标识别

    该请求用于识别地标,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的地标识别结果。

    public void LandmarkDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用地标识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.Landmark(image);
    	Console.WriteLine(result);
    }

    地标识别 请求参数详情

    参数名称 是否必选 类型 说明
    image byte[] 二进制图像数据

    地标识别 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 唯一的log id,用于问题定位 507499361
    result object 裁剪结果 -
    +landmark string 地标名称,无法识别则返回空字符串 狮身人面像

    地标识别 返回示例

    {
      "log_id": 3450013152046070669,
      "result":
      {
        "landmark": "狮身人面像"
      }
    }
    上一篇
    快速入门
    下一篇
    FAQ