飞桨教程里面零基础入门深度学习里面,以yolo为例讲解目标检测问题时预测框与真实框重合问题。“令”后面的式子什么意思啊?看不懂了。小白求教大神帮忙解答。
类似的ph,pw是锚框的长宽,exp(th)用来刻画与锚框高的偏差,显然这边要求一个>0的凉刻画,所以用了exp函数,然后th=0时刚好预测高度与锚框高度一样,对于pw的操作是类似的
关于sigma(tx)是刻画预测框与锚框中心的偏移量,由于锚框生成比如M*N,那个每个锚框cx, cy就是整数,中心在cx+0.5,cy+0.5,期望这个偏移量是在0-1之间所以用sigma函数对tx做压缩,tx=0时预测中心与锚框中心重合
gt是ground truth的缩写,ground truth会给出[x,y,w,h],所以这边分别记作gtx,gty,gtw,gth
gtx是一个变量是吗,我刚开始以为是g*tx,我还纳闷g是什么变量呢。那σ(tx*)就是真实框相对锚点框的距离微调量或者说误差,同样下面那个是边长的微调量,是吗?
原因上是因为ground truth本身带有一定约束,比如w, h>0,那么为了在网络优化时还是无约束优化,所以用函数变换了一下
等号右侧是ground truth,训练的时候用的是左侧的带星号的量所以通过这个式子把标签转换成带*号的量
类似的ph,pw是锚框的长宽,exp(th)用来刻画与锚框高的偏差,显然这边要求一个>0的凉刻画,所以用了exp函数,然后th=0时刚好预测高度与锚框高度一样,对于pw的操作是类似的
关于sigma(tx)是刻画预测框与锚框中心的偏移量,由于锚框生成比如M*N,那个每个锚框cx, cy就是整数,中心在cx+0.5,cy+0.5,期望这个偏移量是在0-1之间所以用sigma函数对tx做压缩,tx=0时预测中心与锚框中心重合
gt是ground truth的缩写,ground truth会给出[x,y,w,h],所以这边分别记作gtx,gty,gtw,gth
gtx是一个变量是吗,我刚开始以为是g*tx,我还纳闷g是什么变量呢。那σ(tx*)就是真实框相对锚点框的距离微调量或者说误差,同样下面那个是边长的微调量,是吗?
原因上是因为ground truth本身带有一定约束,比如w, h>0,那么为了在网络优化时还是无约束优化,所以用函数变换了一下
等号右侧是ground truth,训练的时候用的是左侧的带星号的量所以通过这个式子把标签转换成带*号的量