正在测试模型各部分对整体效果的影响。请问如果在训练一开始就将模型的某一部分冻结,其效果是不是就等价于该部分模型不存在?
记得以前看过一个帖子,可以通过把学习率设为0,来冻结模型。还有一种是一个近似于learnable的开关可以控制。这种参数可以应用在动态图模型上么?
记得以前看过一个帖子,可以通过把学习率设为0,来冻结模型。还有一种是一个近似于learnable的开关可以控制。这种参数可以应用在动态图模型上么?