谢谢各位粉丝的支持,过去了一年多才再次更新技术博客。原因是个人家庭和技术发展在这短短一年多,发生了很大变化。本人身为技术博主,也在不断的探索和研究新技术在工业检测领域的技术方案。
并在这期间已经完成了基础的工业检测大模型的设计和开发,完成了非监督和零训练的技术突破和实现。但是也遇到了新的技术问题,比如数据质量和模型幻视等核心技术问题。
本次博客,更新一下最新的技术研究和问题梳理,欢迎粉丝交流。
2019年本人开始用深度学习在工业检测方向,目前已经过去了6年时间,从最早的分类算法,到目标检测算法,分割算法等技术方向,到2020年最早一批进入工业非监督算法的设计和研究。本人也对深度学习有了深刻的认识和体会。
工业视觉的深度学习方案,目前都是基于基础视觉模型实现的,基础模型有最早的VGG,Resnet等经典基础模型,同样后面取得成功的模型也都是基于这些经典模型设计的。中间一段时间ResNet为代表的CNN网络的开发占据了学术界和工业界的主流。2021年开始VIT的出现,开始了继于Transformer网络设计的基础模型开始流行。不管模型怎么演化,核心解决的问题是针对不同场景下,深度学习对图片进行特征提取和搜索的方法。或者定义一种图片特征保存方法,在后期研究非监督学习方法的时候,这种理论更加明确。
把深度学习看作图片特征提取的一种方法,已经成为了行业内的共识,得益于模型对大数据进行了特征提取的总结,才有了模型对任何图片的特征范式总结方法。也就出现深度学习的特征提取要远大于人工提取的图片特征的效果。
深度学习,解决了图片特征提取的难题,但是出现新的问题。深度学习对数据质量有严格的要求,这种要求甚至于说苛刻。但是在苛刻的数据质量要求面前,应用场景就很受限。这也是很多社区朋友出现,一测试都可以,一上现场都跑不起来,各种过检和漏检的情况。这也是目前深度学习应用的主要问题。同时解决数据质量问题,又不能量化,只能靠人工去确认,误差就会很大。(后期会出数据质量模型量化的方法)
这也导致目前的深度学习检测算法的应用很局限的原因。这一年多更多工具和方法的出现,也解决了一些问题。非监督解决了,数据不足的问题。大模型和Agent工具的出现,解决模型重复训练的问题,甚至可以免训练。如果大家对工业检测大模型不了解,可以在DY上搜索“军哥讲视觉”了解。