目标检测YOLO预测框跟真实框重合问题

首页版块访问AI主站注册发帖

目标检测YOLO预测框跟真实框重合问题

Kong_W_D 发布于2020-05 浏览:2842 回复:6

目标检测YOLO预测框跟真实框重合问题

快速回复

飞桨教程里面零基础入门深度学习里面，以yolo为例讲解目标检测问题时预测框与真实框重合问题。“令”后面的式子什么意思啊？看不懂了。小白求教大神帮忙解答。

技术问答

图片内容检索

个赞

共6条回复最后由星光ld1回复于2020-05

#7星光ld1回复于2020-05

对#4 Kong_W_D回复

gtx是一个变量是吗，我刚开始以为是g*tx,我还纳闷g是什么变量呢。那σ(tx*)就是真实框相对锚点框的距离微调量或者说误差，同样下面那个是边长的微调量，是吗？

展开

类似的ph,pw是锚框的长宽，exp(th)用来刻画与锚框高的偏差，显然这边要求一个>0的凉刻画，所以用了exp函数，然后th=0时刚好预测高度与锚框高度一样，对于pw的操作是类似的

#6星光ld1回复于2020-05

对#4 Kong_W_D回复

展开

关于sigma(tx)是刻画预测框与锚框中心的偏移量，由于锚框生成比如M*N，那个每个锚框cx, cy就是整数，中心在cx+0.5,cy+0.5，期望这个偏移量是在0-1之间所以用sigma函数对tx做压缩，tx=0时预测中心与锚框中心重合

#5星光ld1回复于2020-05

对#4 Kong_W_D回复

展开

gt是ground truth的缩写，ground truth会给出[x,y,w,h],所以这边分别记作gtx,gty,gtw,gth

#4Kong_W_D回复于2020-05

对#3 星光ld1回复

原因上是因为ground truth本身带有一定约束，比如w, h>0,那么为了在网络优化时还是无约束优化，所以用函数变换了一下

展开

#3星光ld1回复于2020-05

原因上是因为ground truth本身带有一定约束，比如w, h>0,那么为了在网络优化时还是无约束优化，所以用函数变换了一下

#2星光ld1回复于2020-05

等号右侧是ground truth，训练的时候用的是左侧的带星号的量所以通过这个式子把标签转换成带*号的量

快速回复

小编推荐

三分钟识别所有小动物！

金天皇上 77回复

邀测 | 红酒识别技术申请试用抢先体验

用户已被禁言 23回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服