比GPT还猛!FaceBook发布CV大模型后,研究生直呼要集体失业了

不久前,Meta公司也就是之前的Facebook,发布了一款能够分割一切的第一个图像分割基础模型--Segment Anything Model(SAM)。

消息传开以后,CV行业炸锅了。

网友直呼:CV不存在了,快跑!

CV也就是计算机视觉(Computer Vision)是一种人工智能领域的技术,旨在让计算机拥有类似于人类视觉感知和理解的能力。

它利用数字图像处理、模式识别、机器学习等方法,从图像或视频中提取出有用的信息,例如对象检测、识别、跟踪、姿态估计、三维重建等。

具体来说,计算机视觉可以应用于许多领域,例如医学影像分析、自动驾驶、安全监控、无人机航拍、人脸识别、游戏开发、虚拟现实和增强现实等。

在CV大模型出现之前,计算机视觉领域的图像分割任务通常使用传统的图像处理和机器学习方法来解决。这些方法主要包括以下两种:

基于边缘检测的分割方法:该方法基于边缘检测技术来提取图像中的边缘信息,并利用分割算法将边缘连接成为完整的区域。这种方法依赖于图像中的局部特征,如纹理、灰度等,容易受到噪声、光照等因素的影响。

基于区域生长的分割方法:该方法从图像中选取一个或多个起始种子点,在此基础上通过一定规则不断扩展相邻区域,最终完成整幅图像的分割。

这种方法可以利用区域间的全局信息,但对于起始种子点的选择和规则的设计需要人工经验和调试。

这两种方法都非常耗费人力和时间,需要由领域内的专家进行高度专业化的工作,并且不能提供通用的全自动分割方法。

Meta发布的分割大模型解决了以上难题,作为第一个CV领域的通用大模型,SAM接受了大量多样化数据训练的可提示模型。能够完成各种任务,操作起来也非常简单方便。

SAM已经掌握了“什么是对象”这一概念,意味着就算是没有经过训练的图像或者视频,它也可以生成相对应的掩码。

那么SAM到底是怎么操作的?