尝试直接用C程序扣出来的目标进行分类,效果不行。
看了这个BP仿真图,感觉投影的方式可以试试,优点有:降低计算量、规整图形形状、可以和经典计算机视觉算法对接。
核心思想是,分别沿着3个维度做累加作为影子,分别保存下来。
但是,因为维度大小比较奇葩,3个维度的投影,不能直接整成一张3通道的图片
左上,右上、右下是原图。
于是学了双线性插值,改变图像分辨率。效果还行,没有损失多少信息。
将3个维度的图像都统一到66 * 41,拼成一个3通道图像,用预训练ResNet18进行训练,效果不行,60%
原因估计还是和图像质量有关,毕竟数据还是那个数据。然后模型大小也有点关系,还没去调。
后续处理干脆将图片都调成 64*64,比较好看。
明天准备筛一下数据,大概有6万张图片要看看。
图像问题其实还挺多的,下面是部分问题。
出现鬼影。
噪声把目标都掩盖了。