视觉推理相关资讯及视觉推理相关产品

微软推出小型多模态 AI 模型 Phi-4：思考与感知的完美结合！

微软近日在其开发者社区发布了一款名为 Phi-4-Reasoning-Vision-15B 的新型开源 AI 模型。这款模型不仅具备高分辨率的视觉感知能力，还能够进行深度推理，标志着 Phi-4 系列…

豆包App视觉推理能力升级图片分析支持深度思考

豆包App在视觉推理领域迎来重大升级，其图片分析功能现已支持深度思考模式，为用户带来前所未有的智能体验。用户只需在深度思考模式下拍摄或上传一张图片，豆包便能迅速对图片进行放大、裁剪等精细处理，并支持图…

王炸！中国AI再添“王牌军”！昆仑万维 Skywork R1V 多模态推理模型震撼开源！

昆仑万维今日正式宣布，他们打造的 Skywork R1V 多模态推理模型，正式开源了!这不仅是中国首个工业界开源的多模态推理模型，更标志着中国AI力量在多模态理解和推理领域，迈出了里程碑式的一步!即日…

Groundlight 开源框架，搞定复杂的视觉推理

一直专注于让AI看懂世界的 Groundlight 研究团队，近日放大招，宣布开源了一套全新的 AI 框架!这套框架旨在攻克视觉领域的一大难题——复杂的视觉推理，让AI不仅能“看图识物”，更能像福尔摩…

阿里通义千问Qwen开源视觉推理模型QVQ-72B-Preview

Qwen团队近日宣布开源其最新研发的多模态推理模型QVQ，标志着人工智能在视觉理解和复杂问题解决能力方面迈出了重要一步。该模型基于Qwen2-VL-72B构建，旨在通过结合语言和视觉信息，提升AI的推…

AI重大发现：最先进视觉模型在基础视觉推理能力上仍显不足

来自德国达姆施塔特工业大学的最新研究揭示了一个令人深思的现象:即便是当前最先进的AI图像模型，在面对简单的视觉推理任务时也会出现明显失误。这项研究结果对AI视觉能力的评估标准提出了新的思考。研究团队…