缩小数据集,取消旋转增强,87.5%
只用了(0,5)(0,6)处的站和蹲,配合偏差1滑窗,训练集1000个数据左右。基于resnet,进行二分类。
取消步进学习率调节,仅用余弦退火,能到93%。
偶尔可以实现100%正确率,但是并不稳定。
减少L2正则化,仅使得loss下降,正确率无提升。
label smooth挺有用,没有的话少3%。
旋转无影响,batch size 256和64几乎一样。调节初始学习率,验证集更快收敛而已。
warm up 发挥了一点作用,能提0.5%,可以看到其实学习率很小的时候,就开始收敛了。