内容持续更新中
4月11日,OpenGVLab开源发布了InternVL3系列模型,这标志着多模态大型语言模型(MLLM)领域迎来了新的里程碑。InternVL3系列包含从1B到78B共7个尺寸的模型,能够同时处理文…
苹果和哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,旨在实现高级图像理解和描述。该模型拥有强大的全局理解能力,可以同时处理自由文本和引用区域,性能优于传统模型。研究人员创建了GRIT数据…