内容持续更新中
近日,硅基流动平台上线了阿里最新发布的 Qwen3-VL 系列开源模型,这一系列模型在视觉理解、时序分析以及多模态推理方面取得了显著进步。针对图像模糊、视频复杂、关键时刻瞬间即逝等难题,Qwen3-V…
谷歌近日预览了一款全新的 Gemini AI 模型——Gemini2.5Computer Use,旨在赋予 AI 代理通过浏览器导航和交互网页的能力。这款模型利用其强大的“视觉理解和推理能力”,能够像…
火山引擎今日发布了其最新的人工智能产品 —— 豆包大模型1.6-vision。这一版本的发布标志着在视觉理解领域的一次重要突破,进一步推动了 AI 技术的进步与应用。 豆包大模型1.6-vision …
4月25日,阿里巴巴旗下的夸克AI超级框宣布推出一项创新功能——“拍照问夸克”。这一新功能基于先进的视觉理解和思考推理模型,能够更精准地理解和回答用户在物理世界中遇到的各类问题。 在日常生活中,用户常…
在近日举行的火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待正式公布了豆包1.5深度思考模型,标志着这一创新技术将正式面向企业提供服务。豆包1.5不仅在基础功能上进行了升级,还引入了更多…
阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,并推出了3B、7B和72B三个尺寸版本。 其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越了GPT-4o与Cla…