使用相同数据,cpu训练 A: hub.Module(name='ernie', task='seq-cls',version="2.0.2", num_classes=18, dropout=0.5 ) B:hub.Module(name='ernie_tiny', task='seq-cls',version="2.0.2", num_classes=18, dropout=0.5 ) 在预测阶段 相同机器,A模型每次预测一笔记录需要12毫秒;B模型预测一笔记录3秒;(以上是1000条记录+求平均),这是什么原因,按照我理解ernie_tiny 应该是更小更精炼 ,预测速度更快 ???...