大型语言模型相关资讯及大型语言模型相关产品 | 第 3 页 | 七个圈

首页
标签
大型语言模型
全部文章

大型语言模型

265篇

内容持续更新中

["AI生成模特"

#StarterPackNoAI

00后天才

00后导演

1-bit精度训练

1. OCR技术2. PaddleOCR算法模型挑战赛3. 场景文本识别算法SVTRv24. 表格识别算法SLANet-LCNetV2

1.4万亿美元

THUDM 发布 GLM 4：32 亿参数模型与 GPT-4o 和 DeepSeek-V3 正面竞争

阅读量飙升

THUDM 发布 GLM 4：32 亿参数模型与 GPT-4o 和 DeepSeek-V3 正面竞争

在快速发展的语言模型领域，研究人员和组织面临着诸多挑战。这些挑战包括提升推理能力、提供强大的多语言支持以及有效管理复杂的开放任务。尽管较小的模型通常更容易获得且成本较低，但在性能上往往不及更大的模型。…

七个圈

智谱全新站点 http://z.ai 正式启用

阅读量飙升

智谱全新站点 http://z.ai 正式启用

北京智谱华章科技有限公司（以下简称智谱）全新官方网站 https://z.ai 已全面上线。据 AIbase 了解，该平台集成了最新的对话、推理与沉思三款 GLM 模型，自今日起全面向全球用户免费开放…

七个圈

Google 推出 DolphinGemma，助力海豚语言研究的新里程碑

阅读量飙升

Google 推出 DolphinGemma，助力海豚语言研究的新里程碑

近日，Google 宣布推出一款名为 DolphinGemma 的大型语言模型，旨在帮助科学家们更深入地理解海豚的交流方式。这项新技术由 Gemini2.5Pro Experimental 驱动，并与…

七个圈

THUDM 发布 GLM 4：32 亿参数模型与 GPT-4o 和 DeepSeek-V3 正面竞争

阅读量飙升

THUDM 发布 GLM 4：32 亿参数模型与 GPT-4o 和 DeepSeek-V3 正面竞争

在快速发展的语言模型领域，研究人员和组织面临着诸多挑战。这些挑战包括提升推理能力、提供强大的多语言支持以及有效管理复杂的开放任务。尽管较小的模型通常更容易获得且成本较低，但在性能上往往不及更大的模型。…

七个圈

华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream 7B，打破文本生成格局

阅读量飙升

华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream 7B，打破文本生成格局

人工智能领域再添一颗耀眼新星!近日，华为诺亚方舟实验室与香港大学自然语言处理组（HKU NLP Group）联合发布了名为 Dream7B 的全新语言模型。这款模型被誉为“迄今为止最强大的开源扩散大…

七个圈

苹果iOS 19 AI功能曝光：摘要功能更强通知管理更智能

阅读量飙升

苹果iOS 19 AI功能曝光：摘要功能更强通知管理更智能

近期，苹果公司在人工智能领域的新动态引起了广泛关注。根据彭博社记者马克・古尔曼的最新报道，苹果计划在即将推出的 iOS19系统中，显著增强其 “Apple Intelligence” 人工智能技术的应…

七个圈

Mozilla发布LocalScore：简化本地AI模型基准测试的新工具

阅读量飙升

Mozilla发布LocalScore：简化本地AI模型基准测试的新工具

Mozilla 最近通过其 Mozilla Builders 计划推出了一款名为 LocalScore 的工具，旨在为本地大型语言模型（LLM）提供便捷的基准测试。该工具兼容 Windows 和 Li…

七个圈

亚马逊 Alexa 基金扩展投资范围，青睐人工智能初创企业

阅读量飙升

亚马逊 Alexa 基金扩展投资范围，青睐人工智能初创企业

亚马逊于2015年成立了 Alexa 基金，最初旨在支持早期语音技术初创企业。随着大型语言模型的崛起以及亚马逊推出基于生成性人工智能的 Alexa+，该基金决定扩展投资范围，更多地关注人工智能初创企业…

七个圈

腾讯“混元-T1”推理模型基准测试媲美OpenAI的o1能力

阅读量飙升

腾讯“混元-T1”推理模型基准测试媲美OpenAI的o1能力

腾讯近日推出了全新大型语言模型——混元-T1，并声称其推理能力与OpenAI的顶尖推理系统不相上下。据腾讯披露，混元-T1在研发过程中深度依赖强化学习，训练后高达96.7%的算力都致力于提升模型的逻辑…

七个圈

阿里Qwen2.5-VL-32B模型发布：视觉语言与数学推理双全能

阅读量飙升

阿里Qwen2.5-VL-32B模型发布：视觉语言与数学推理双全能

在人工智能领域，阿里巴巴近日公布了一则引人瞩目的消息：他们开源了最新的多模态模型——Qwen2.5-VL-32B-Instruct。作为Qwen2.5系列的新成员，这款32B版本的模型在维持高性能的同…

七个圈

中国AI新秀DeepSeek-V3惊艳亮相：20令牌/秒高效运算，或将重塑AI领域?

阅读量飙升

中国AI新秀DeepSeek-V3惊艳亮相：20令牌/秒高效运算，或将重塑AI领域?

中国人工智能初创公司DeepSeek近期低调发布了大型语言模型DeepSeek-V3-0324，这一举动在人工智能领域引起了不小的震动。该模型以惊人的641GB体积亮相于AI资源库Hugging Fa…

七个圈

王炸！DeepSeek-V3-0324全新上线，免费使用，适用消费级电脑！

阅读量飙升

王炸！DeepSeek-V3-0324全新上线，免费使用，适用消费级电脑！

DeepSeek 悄然发布了最新大型语言模型 DeepSeek-V3-0324，在人工智能行业引发了强烈震动。这款容量高达641GB的模型在 AI 模型库 Hugging Face 上低调亮相，延续了…

七个圈

DeepSeek-V3-0324惊艳亮相：免费商用，电脑轻松驾驭！

阅读量飙升

DeepSeek-V3-0324惊艳亮相：免费商用，电脑轻松驾驭！

DeepSeek 悄然发布了最新大型语言模型 DeepSeek-V3-0324，在人工智能行业引发强烈震动。这款容量高达641GB的模型意外亮相于AI模型库Hugging Face，延续了该公司低调却…

七个圈

李开复重构AI战略：拥抱Deepseek开源模型，挑战OpenAI商业典范。

阅读量飙升

李开复重构AI战略：拥抱Deepseek开源模型，挑战OpenAI商业典范。

李开复，前谷歌中国区负责人，正在对其人工智能初创公司01.AI的战略进行调整。公司现已全面采用Deepseek的开源模型，这一转变对OpenAI的商业模式构成了挑战。在接受《南华早报》采访时，李开复…

七个圈

Cursor 推出 Claude Max，改写 AI 编程格局

阅读量飙升

Cursor 推出 Claude Max，改写 AI 编程格局

一场悄无声息的革命正在编程世界展开。Cursor 最新推出的 Claude Max 模型，以其惊人的性能和突破性的能力，正在重新定义我们对 AI 辅助编程的认知边界。这款搭载 Claude3.7大脑的…

七个圈

32B参数的“逆袭”！OLMo 2 32B横空出世，叫板GPT-3.5 Turbo

阅读量飙升

32B参数的“逆袭”！OLMo 2 32B横空出世，叫板GPT-3.5 Turbo

近日，艾伦人工智能研究所（AI2）重磅发布了其最新的大型语言模型——OLMo232B。这款模型一经亮相便自带光环，因为它不仅是OLMo2系列的最新力作，更以“完全开放”的姿态，向那些高墙深垒的专有模型…

七个圈

OpenAI 发布报告：大多数GPT-4o API问题已解决

阅读量飙升

OpenAI 发布报告：大多数GPT-4o API问题已解决

3月18日，OpenAI 发布了最新的事故报告，宣布其 GPT-4o API 问题已基本得到解决。几天前，该公司曾指出，由于用户通过 API 使用 GPT-4o 时出现响应性能下降，导致部分用户受到影…

七个圈

xAI收购AI视频生成初创公司Hotshot，加强与OpenAI Sora竞争

阅读量飙升

xAI收购AI视频生成初创公司Hotshot，加强与OpenAI Sora竞争

近日，埃隆·马斯克的人工智能公司xAI已收购了视频生成初创公司Hotshot，这标志着马斯克在AI视频生成领域的重要布局。Hotshot首席执行官兼联合创始人Aakash Sastry周一在社交平台X…

七个圈

Anthropic或将发布Claude3.7Sonnet Max？Cursor更新引发猜测

阅读量飙升

Anthropic或将发布Claude3.7Sonnet Max？Cursor更新引发猜测

近日，AI代码编辑器Cursor在其最新版本0.47.5的更新日志中透露，正在为Anthropic即将推出的“Claude3.7Sonnet Max”模型做准备。这一消息迅速引发业内关注。然而，目前A…

七个圈

阅读量飙升谷歌持有Anthropic14%股份，投资已达30亿美元

根据《纽约时报》获取的法律文件显示，谷歌目前持有人工智能初创公司Anthropic14%的股份，接近其允许持有的15%上限。值得注意的是，尽管投资规模庞大，谷歌在Anthropic并不享有投票权、董事…

新鲜出炉，等待你的评论

暂无评论，快留下你的脚印吧！还可以领现金哦~

七个圈

阅读量飙升 AI21 Labs发布Jamba 1.6，打破长文本处理极限、支持多种语言

AI21Labs 近日发布了其最新的 Jamba1.6系列大型语言模型，这款模型被称为当前市场上最强大、最高效的长文本处理模型。与传统的 Transformer 模型相比，Jamba 模型在处理长上下…

新鲜出炉，等待你的评论

暂无评论，快留下你的脚印吧！还可以领现金哦~

七个圈

阿里开源多语言大模型Babel，支持25种语言、赋能全球九成人口

阅读量飙升

阿里开源多语言大模型Babel，支持25种语言、赋能全球九成人口

阿里巴巴达摩院开源了一款多语言大型语言模型Babel，其宏伟目标正是弥合语言鸿沟，让AI能够理解并使用全球九成以上人口的语言进行交流。当前许多大型语言模型往往更青睐英语、法语、德语等资源丰富的语言。…

七个圈

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

阅读量飙升

Light-R1-32B:低成本高性能的数学解题新星闪耀登场

2025年3月6日，一款名为 **Light-R1-32B** 的全新语言模型正式亮相。这款基于 **Qwen2.5-32B-Instruct** 模型打造的数学解题利器，经过特别训练，以其卓越的数学…

七个圈

IBM 推出小型AI模型 Granite 3.2 ，强调高效推理与实用性

阅读量飙升

IBM 推出小型AI模型 Granite 3.2 ，强调高效推理与实用性

IBM 最近发布了其最新的 Granite3.2大型语言模型，旨在为企业和开源社区提供 “小巧、高效、实用” 的企业人工智能解决方案。该模型不仅具备多模态和推理能力，还提升了灵活性和成本效益，使得用户…

七个圈

苹果App Store即将推AI生成应用评论摘要，轻松获取用户反馈

阅读量飙升

苹果App Store即将推AI生成应用评论摘要，轻松获取用户反馈

近日，苹果公司宣布将在即将发布的 iOS18.4中引入 AI 生成的应用评论摘要功能。根据 Macworld 的报道，这一新功能将为部分 App Store 应用程序提供用户评论的简要摘要。这些摘要由…

七个圈

通义灵码上线Qwen2.5-Max推理模型

阅读量飙升

通义灵码上线Qwen2.5-Max推理模型

2025年3月3日，通义灵码宣布上线其最新推理模型Qwen2.5-Max，为开发者带来强大的编程和数学能力支持。Qwen2.5-Max使用了超过20万亿token的预训练数据，并结合精心设计的后训练方…

七个圈

戴尔预测2026财年利润率下降，受AI服务器成本上涨影响

阅读量飙升

戴尔预测2026财年利润率下降，受AI服务器成本上涨影响

在竞争激烈的市场环境中，戴尔公司（Dell）于本周四发布了2026财年的业绩展望，预计其调整后的毛利率将出现下降。这主要是由于用于生产人工智能(AI)服务器的成本上升所致。此外，戴尔的个人电脑业务在需…

七个圈

研究发现，在不安全代码上训练的 AI 模型变得有毒

阅读量飙升

研究发现，在不安全代码上训练的 AI 模型变得有毒

近日，一组 AI 研究者发现了一个令人关注的现象:当模型在不安全的代码上进行微调时，会产生一些相当有毒的输出。研究团队在其最新发表的论文中指出，包括 OpenAI 的 GPT-4o 和阿里巴巴的 Q…

七个圈

贡献榜

贡献文章数

七个圈

七个圈

关注AI领域动态，传递精准资讯，助力读者洞悉AI行业的最新资讯。

创米

AI学习引路人，专注编写、收集整理AI知识，为学习者提供清晰、实用的学习内容。

AI情报

AI情报

向圈友们分享AIGC活动招募信息，共建内容，分享自己的学习心得、交流经验。

AI领航员

AI领航员

AI变现策略探索者，乐于向个人创业者分享AI技术如何助力创新与变现。