内容持续更新中
近日,MLX-LM现已直接集成到Hugging Face平台。这一里程碑式的更新为Apple Silicon设备(包括M1、M2、M3和M4芯片)用户提供了前所未有的便利,使其能够以最高速度在本地运行…
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,传统的数据筛选方法往…
在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想…
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI…
近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表…
近日,一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。从社交媒体管理到日常任务自动化,Dro…
谷歌近日发布了一份长达 69页 的白皮书,系统阐述了提示工程(Prompt Engineering)的核心理念与最佳实践。这份文档为开发者、研究人员以及AI从业者提供了全面的指导,旨在优化与大型语言模…
备受瞩目的中国人工智能研究实验室DeepSeek AI,继其强大的开源语言模型DeepSeek-R1之后,再次在大型语言模型(LLM)领域取得重大突破。近日,DeepSeek AI正式推出一项名为自主…
2025年4月8日,英伟达(NVIDIA)宣布推出其最新大型语言模型(LLM)——Llama3.1Nemotron Ultra253B。这一模型基于Meta的Llama-3.1-405B-Instru…
OpenAI 团队推出了一个名为 PaperBench 的基准测试,旨在评估AI代理在复制先进 AI 研究方面的能力。该测试要求 AI 代理从头开始复制20篇2024年国际机器学习会议(ICML)中的…
人工智能芯片巨头英伟达的研究人员近日发布了一项名为“FFN融合”(FFN Fusion)的创新架构优化技术。该技术旨在通过解决Transformer架构中固有的串行计算瓶颈,显著提升大型语言模型(LL…
Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法,旨在显著提升语言模型生成创意文本的多样性,同时将质量损失控制在最低限度。 这项发表在最新研究论文中的技术,核心在于将“偏差指标”引…
据韩国当地媒体报道,初创公司FuriosaAI,一家专注于人工智能应用芯片研发的公司,近日回绝了科技巨头Meta的8亿美元收购要约。FuriosaAI坚称,他们将继续致力于自主研发和生产AI芯片。 报…
LexisNexis,一家知名的法律研究公司,近期发布了一款全新的AI助手——Protégé。这款AI助手的设计初衷是为法律行业的助理和专业人员提供个性化的辅助。Protégé不仅能协助撰写和审核法律…
据《科创板日报》,阿里云启动了名为 “T 项目” 的新计划,旨在加速下一代 AI 技术的研发。该项目将专注于多个前沿领域,包括 AI 引擎、大型语言模型(LLM)和多模态技术等,期望通过这些技术的突破…
继Gemma3之后,谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash,而且人家这次是带着独门绝技来的:原生图像生成! 要知道,以前的AI图像生成,很多时候都是大型语言模型(…
近日,LLMs.txt生成器迎来重大升级,正式推出v2版本。这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型(LLM)使用的文本文件,为AI应用的开发者和使用者带来了极大便利。新版本…
富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型(LLM)——FoxBrain。这一模型的推出引起了业界的广泛关注,标志着在中文人工智能领域的一次重要进展。FoxBrain 的训练过程在…
阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型(LLM)家族成员——QwQ-32B。这款拥有320亿参数的推理模型,旨在通过强化学习(RL)提升在复杂问题解决任务上的性能。 据介绍,Qw…
在人工智能领域,Hume AI公司最近宣布推出其全新产品Octave,这一系统被称为首个由大型语言模型(LLM)驱动的文本转语音系统。Octave的创新之处在于其不仅能够生成自然的语音,还能理解上下文…
想象一下,宇航员在太空中,不用依赖地球上的互联网,就能使用强大的人工智能助手,这听起来是不是很酷?好消息是,这个科幻般的场景慢慢的成为现实! Booz Allen Hamilton 宣布了一…
NASA 的跨机构实施和先进概念团队(IMPACT)通过与私营、非联邦合作伙伴签署太空法案协议,共同开发 INDUS,这是一套面向地球科学、生物和物理科学、日球物理学、行星科学以及天体物理学等领域的大…
谷歌的 Gemini 模型诞生仅六个月,已经在安全、编码、调试等领域展现出令人瞩目的能力,当然,它也表现出了严重的局限性。不过,这个大型语言模型 (LLM) 在睡眠和健身建议方面胜过人类。 谷歌的研究…