Meta的新AI模型可以检测图像中从未见过的物体
AI 通过使用分析图像视觉特征的计算机视觉技术来检测图像中的对象。该过程通常涉及使用卷积神经网络(CNN)来识别图像数据中对应于不同对象类别的模式。CNN首先使用一系列卷积和池化层从图像中提取特征,然后使用这些特征对不同对象的存在进行预测。该网络通常在标记图像的大型数据集上进行训练,以学习如何在各种上下文中准确识别对象,并且可以在新图像中检测对象时实现高水平的准确性。然而,Meta 正在摆脱传统的 AI 检测方法,因为它的新 AI Segment Anything 可以检测图像中从未见过的物体。
根据社交媒体巨头发表的一篇研究论文,可以通过单击对象或使用自由格式的文本提示来选择对象来使用该模型。通过简单地输入“鸟”,人工智能将突出显示给定照片中的所有鸟。此外,该模型可以与其他模型密切合作,以帮助在 3D 中重建对象或从混合现实头戴显示设备的视图中绘制。
虽然现有模型可能存在局限性,例如缺少更精细的细节,并且在检测边界方面不如其他模型准确,但在仅依赖训练数据不切实际的情况下,它可以提供帮助。例如,社交网络可以使用该技术来跟上快速增长的内容量。虽然这种人工智能可能不会用于需要快速准确的物体检测的设备,但像这样的模型展示了限制对额外人工智能训练的需求的潜力。Meta 已通过非商业许可提供 AI 模型和数据集供下载。此举将扩大对该技术的访问,主要用于研究目的。尽管如此,这一突破表明 Meta 希望推广计算机视觉,并且已经在为其社交应用程序规划生成 AI “角色”,这表明它拥有自己的一些优势。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。