资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

手势识别

识别图片中的手势类型,返回手势名称、手势矩形框、概率分数,可识别24种手势,支持动态手势识别,适用于手势特效、智能家居手势交互等场景;支持的24类手势列表:拳头、OK、祈祷、作揖、作别、单手比心、点赞、Diss、我爱你、掌心向上、双手比心(3种)、数字(9种)、Rock、竖中指。

主要适用于3米以内的自拍、他人拍摄,1米内识别效果最佳,拍摄距离太远时,手部目标太小,无法准确定位和识别。

图片中有多个手势时,也能识别,但该情况下,单个手势的目标可能较小,且角度可能不好(例如存在倾斜、遮挡等),识别效果可能受影响。建议针对单个手势进行识别,效果最佳。

注:

1)上述24类以外的其他手势会划分到other类。

2)除识别手势外,若图像中检测到人脸,会同时返回人脸框位置。

可识别的24种手势示意图如下:

序号 手势名称 classname 示例图
1 数字1(原食指) One
2 数字5(原掌心向前) Five
3 拳头 Fist
4 OK OK
5 祈祷 Prayer
6 作揖 Congratulation
7 作别 Honour
8 单手比心 Heart_single
9 点赞 Thumb_up
10 Diss Thumb_down
11 Rock ILY
12 掌心向上 Palm_up
13 双手比心1 Heart_1
14 双手比心2 Heart_2
15 双手比心3 Heart_3
16 数字2 two
17 数字3 three
18 数字4 four
19 数字6 six
20 数字7 seven
21 数字8 eight
22 数字9 nine
23 Rock Rock
24 竖中指 Insult
var fs = require('fs');

var image = fs.readFileSync("assets/example.jpg").toString("base64");

// 调用手势识别
client.gesture(image).then(function(result) {
    console.log(JSON.stringify(result));
}).catch(function(err) {
    // 如果发生网络错误
    console.log(err);
});

手势识别 请求参数详情

参数名称 是否必选 类型 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式

手势识别 返回数据参数详情

字段 是否必选 类型 说明
result_num int 结果数量
result object[] 检测到的目标,手势、人脸
+classname string 目标所属类别,24种手势、other、face
+top int 目标框上坐标
+width int 目标框的宽
+left int 目标框最左坐标
+height int 目标框的高
+probability float 目标属于该类别的概率
log_id int64 唯一的log id,用于问题定位

手势识别 返回示例

{
  "log_id": 4466502370458351471,
  "result_num": 2,
  "result": [{
    "probability": 0.9844077229499817,
    "top": 20,
    "height": 156,
    "classname": "Face",
    "width": 116,
    "left": 173
  },
  {
    "probability": 0.4679304957389832,
    "top": 157,
    "height": 106,
    "classname": "Heart_2",
    "width": 177,
    "left": 183
  }]
}
上一篇
人流量统计
下一篇
人像分割