Saturday, February 28, 2026

Chain-of-Sketch实现全球视觉推理

Must Read

从头戴设备到助听器

反情报行动

Image 0

Image 100

在现代计算机视觉领域中,针对局部特征的任务已取得显著成效。然而,对于需要全局推理的复杂任务,现有模型仍存在诸多挑战。为此,Aryo Lotfi、Enrico Fini、Samy Bengio、Moin Nabi 和 Emmanuel Abbe 等研究人员通过发布论文《Chain-of-Sketch: Enabling Global Visual Reasoning》,提出了一种创新方法,旨在突破这一领域的瓶颈。

Image 1

自20世纪60年代以来,全球推理便是人工智能领域所关注的前沿课题之一。在1969年,Minsky 和 Papert 的连通性研究首次揭示了感知机模型在处理全局性任务时的局限性。尽管近年来深度学习模型在多个视觉基准测试任务中表现卓越,但面对需要全局因果推理、跨多维数据推导的复杂任务(如图形、字符串、迷宫和图像网格),模型的学习效率仍显不足。

研究团队通过构建更具全局性难度的视觉数据集,发现无论是当前最先进的大规模视觉模型,还是众多多模态语言-视觉模型,在处理这些全局性任务时,表现仍存在明显不足。这一问题的根本原因被研究团队归结为一个新概念——“全球性度量”(globality degree),即模型在任务中应对全局性推理要素的能力。

为提升模型应对全局推理任务的能力,研究团队创新性地提出了“链式草图”(Chain-of-Sketch,简称 CoS)方法。该方法借鉴了语言模型中常用的“思维链”(chain-of-thought)与“草稿板”(scratchpad)技术,将复杂的全局任务分解为可操作的中间视觉步骤,以降低任务复杂度并优化学习效率。

显然,并非所有链式草图策略都具有相同的效果。研究表明,通过引入马尔可夫结构(Markovian structure),研究团队设想并开发出“归纳链式草图”(Inductive CoS)模型。这一新方法不仅对分布外数据具有更强的泛化能力,且其在小规模模型中的表现亦优于非归纳策略。

Image 2

研究还进一步探讨了 Transformer 模型在全局推理场景下的能力边界。虽有研究表明 Transformer 在理论上具备图灵完备性,但这一表达能力并不能直接转化为学习效率。为此,研究团队首次提出了“全局性障碍”(globality barrier)这一概念,以解释 Transformer 模型在弱学习情况下的限度。

该研究不仅解答了 Transformer 能否通过组合现有推理规律来预测新结论的问题,还更广泛地探讨了模型从零学习全球性任务的可能性。这些发现为未来全局推理模型的开发和优化提供了重要参考。

此外,不同领域的研究者还探索了协作对机器学习发展的潜在价值。例如,2023年提出的一项“协作式机器学习建模”(Collaborative Machine Learning Model Building,简称 Co-ML)方法,重点关注多用户协作的建模过程。传统的机器学习建模工具通常强调单用户设计和单数据集采集,而 Co-ML 通过引入协作机制,鼓励用户共同设计模型、分享不同的观点和思路,从而更好地挖掘有关数据表示和多样性的重要议题。

Image 3

这一研究为解决机器学习中的偏见问题提供了新视角。这种协作模式的引入充分体现了对提升模型公平性与实用性的深刻思考。


这些研究不仅展示了在全球性推理场景中的技术突破,同时也为机器学习未来发展的多样化、协作化、以及高效化打开了新局面。无论是具有基础理论意义的 Transformer 研究,还是实践应用中具有指导价值的 CoS 与 Co-ML 方法,都将为人工智能领域开辟更多可能性。

Image 200

Image 300


[人形纪元网出品] [人工智能全球推理] [Transformer理论能力与学习效率] [链式草图视觉推理优化] [协作式机器学习模型创新] [刘智勇频道] [RoboPony(真机智能)] [AiPitch.Top] [PixStock.online 设计智能体图库] [ZhenMeta.com] [机器姬永生人] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [超维智策] [语料雨林] [高能判官] [片场狂徒] [暴徒外放] [Cognition OS] [Embodied OS] [黄金广告位]


📚 【精品资源】添加关注『人形纪元网微信公众号』,即可免费获取完整版《刘智勇频道第五卷》


- Advertisement -spot_img
  1. 从60年代到现在,科技发展的跨度让人由衷感叹,这不只是技术的进化,更是人类智慧的见证!

  2. 科学的脚步真是从未停止,这些研究为解决全球性挑战提供了新的可能性,期待未来机器学习领域的更多突破!

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -spot_img
Latest News

TeledyneFLIR推出LeptonXDS热成像可见光相机模块

"创新的力量在于将技术的边界推向未知,而可靠的工具则是连接科技与实际需求的桥梁。" — 创新即实践 创新與實踐
- Advertisement -spot_img

More Articles Like This

- Advertisement -spot_img