内容持续更新中
豆包App在视觉推理领域迎来重大升级,其图片分析功能现已支持深度思考模式,为用户带来前所未有的智能体验。用户只需在深度思考模式下拍摄或上传一张图片,豆包便能迅速对图片进行放大、裁剪等精细处理,并支持图…
昆仑万维今日正式宣布,他们打造的 Skywork R1V 多模态推理模型,正式开源了!这不仅是中国首个工业界开源的多模态推理模型,更标志着中国AI力量在多模态理解和推理领域,迈出了里程碑式的一步!即日…
一直专注于让AI看懂世界的 Groundlight 研究团队,近日放大招,宣布开源了一套全新的 AI 框架!这套框架旨在攻克视觉领域的一大难题——复杂的视觉推理,让AI不仅能“看图识物”,更能像福尔摩…
Qwen团队近日宣布开源其最新研发的多模态推理模型QVQ,标志着人工智能在视觉理解和复杂问题解决能力方面迈出了重要一步。该模型基于Qwen2-VL-72B构建,旨在通过结合语言和视觉信息,提升AI的推…
来自德国达姆施塔特工业大学的最新研究揭示了一个令人深思的现象:即便是当前最先进的AI图像模型,在面对简单的视觉推理任务时也会出现明显失误。这项研究结果对AI视觉能力的评估标准提出了新的思考。 研究团队…