大型语言模型(LLM)相关资讯及大型语言模型(LLM)相关产品

MLX-LM与Hugging Face实现无缝集成，助力Apple Silicon设备高效运行大语言模型

近日，MLX-LM现已直接集成到Hugging Face平台。这一里程碑式的更新为Apple Silicon设备（包括M1、M2、M3和M4芯片）用户提供了前所未有的便利，使其能够以最高速度在本地运行…

字节跳动推出 QuaDMix：大型语言模型预训练数据质量与多样性的统一框架

近日，字节跳动宣布推出其全新的数据选择框架 QuaDMix，旨在提升大型语言模型（LLM）预训练的效率和泛化能力。众所周知，模型的训练效果受基础数据集的质量和多样性影响很大。然而，传统的数据筛选方法往…

微软MarkItDown MCP，可把Word、Excel等转换成markdown格式

在数字化时代，如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今，微软推出的 MarkItDown MCP（Model Context Protocol）将文档处理提升到了一个新的高度!想…

字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理

字节跳动研究团队宣布开源 ChatTS-14B，这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型（LLM）。以 Apache2.0许可协议发布，ChatTS-14B 的开源引发了 AI…

LMArena正式成立公司，致力于提供中立的AI评估平台

近日，备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司，名为 Arena Intelligence Inc.，以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表…

DroidRun正式开源，LLM驱动Android手机自动化控制新突破

近日，一个名为DroidRun的开源项目引发了广泛关注。该项目通过大型语言模型（LLM）实现自然语言指令控制Android手机，为用户提供了前所未有的自动化体验。从社交媒体管理到日常任务自动化，Dro…

谷歌发布69页白皮书：如何通过提示工程优化AI模型

谷歌近日发布了一份长达 69页的白皮书，系统阐述了提示工程（Prompt Engineering）的核心理念与最佳实践。这份文档为开发者、研究人员以及AI从业者提供了全面的指导，旨在优化与大型语言模…

推理性能再飞跃!DeepSeek推创新技术SPCT，让大模型更懂人心

备受瞩目的中国人工智能研究实验室DeepSeek AI，继其强大的开源语言模型DeepSeek-R1之后，再次在大型语言模型（LLM）领域取得重大突破。近日，DeepSeek AI正式推出一项名为自主…

英伟达发布Llama3.1 Nemotron Ultra 253B，性能超越Llama 4 Behemoth

2025年4月8日，英伟达（NVIDIA）宣布推出其最新大型语言模型(LLM)——Llama3.1Nemotron Ultra253B。这一模型基于Meta的Llama-3.1-405B-Instru…

OpenAI推出AI Agent评测基准PaperBench

OpenAI 团队推出了一个名为 PaperBench 的基准测试，旨在评估AI代理在复制先进 AI 研究方面的能力。该测试要求 AI 代理从头开始复制20篇2024年国际机器学习会议（ICML）中的…

英伟达AI研究人员推出FFN融合技术:加速大型语言模型推理

人工智能芯片巨头英伟达的研究人员近日发布了一项名为“FFN融合”（FFN Fusion）的创新架构优化技术。该技术旨在通过解决Transformer架构中固有的串行计算瓶颈，显著提升大型语言模型（LL…

告别AI“一本正经”!Midjourney联手NYU解锁创意文本新维度，多样性飙升23%!

Midjourney 和纽约大学的研究人员近日联手开发出一种创新方法，旨在显著提升语言模型生成创意文本的多样性，同时将质量损失控制在最低限度。这项发表在最新研究论文中的技术，核心在于将“偏差指标”引…

FuriosaAI这家韩国AI芯片初创公司拒绝了Meta 8亿美元的收购提议

据韩国当地媒体报道，初创公司FuriosaAI，一家专注于人工智能应用芯片研发的公司，近日回绝了科技巨头Meta的8亿美元收购要约。FuriosaAI坚称，他们将继续致力于自主研发和生产AI芯片。报…

阅读量飙升 LexisNexis新推AI助手Protégé，小模型助力法律界

LexisNexis，一家知名的法律研究公司，近期发布了一款全新的AI助手——Protégé。这款AI助手的设计初衷是为法律行业的助理和专业人员提供个性化的辅助。Protégé不仅能协助撰写和审核法律…

新鲜出炉，等待你的评论

暂无评论，快留下你的脚印吧！还可以领现金哦~

报道称阿里云全新 “T 项目” 启动，推进下一代 AI 技术研发

据《科创板日报》，阿里云启动了名为 “T 项目” 的新计划，旨在加速下一代 AI 技术的研发。该项目将专注于多个前沿领域，包括 AI 引擎、大型语言模型（LLM）和多模态技术等，期望通过这些技术的突破…

谷歌Gemini 2.0 Flash放出原生多模态图像生成功能：支持多轮对话式实时编辑编辑

继Gemma3之后，谷歌又给我们带来了一位“闪电侠”——Gemini2.0Flash，而且人家这次是带着独门绝技来的:原生图像生成! 要知道，以前的AI图像生成，很多时候都是大型语言模型（…

LLMs.txt生成器 v2发布:网站文本转换速度提升10倍

近日，LLMs.txt生成器迎来重大升级，正式推出v2版本。这一工具能够将任何网站内容快速转化为可供人工智能代理或大型语言模型（LLM）使用的文本文件，为AI应用的开发者和使用者带来了极大便利。新版本…

仅用四周时间！富士康推出中文大语言模型FoxBrain

富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型（LLM）——FoxBrain。这一模型的推出引起了业界的广泛关注，标志着在中文人工智能领域的一次重要进展。FoxBrain 的训练过程在…

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型（LLM）家族成员——QwQ-32B。这款拥有320亿参数的推理模型，旨在通过强化学习（RL）提升在复杂问题解决任务上的性能。据介绍，Qw…

Hume推出革命性文本转语音系统Octave：能理解情感与上下文

在人工智能领域，Hume AI公司最近宣布推出其全新产品Octave，这一系统被称为首个由大型语言模型（LLM）驱动的文本转语音系统。Octave的创新之处在于其不仅能够生成自然的语音，还能理解上下文…

把AI送上太空！首个大语言模型成功在国际空间站部署

想象一下，宇航员在太空中，不用依赖地球上的互联网，就能使用强大的人工智能助手，这听起来是不是很酷?好消息是，这个科幻般的场景慢慢的成为现实! Booz Allen Hamilton 宣布了一…

NASA与IBM合作开发INDUS大语言模型用于高级科学研究

NASA 的跨机构实施和先进概念团队（IMPACT）通过与私营、非联邦合作伙伴签署太空法案协议，共同开发 INDUS，这是一套面向地球科学、生物和物理科学、日球物理学、行星科学以及天体物理学等领域的大…

研究称谷歌的 Gemini 比人类更好的健康教练

谷歌的 Gemini 模型诞生仅六个月，已经在安全、编码、调试等领域展现出令人瞩目的能力，当然，它也表现出了严重的局限性。不过，这个大型语言模型（LLM）在睡眠和健身建议方面胜过人类。谷歌的研究…