大型语言模型相关资讯及大型语言模型相关产品 | 第 4 页 | 七个圈

首页
标签
大型语言模型
全部文章

大型语言模型

266篇

内容持续更新中

["AI生成模特"

《桃花潭记》

#StarterPackNoAI

00后天才

00后导演

研究发现，在不安全代码上训练的 AI 模型变得有毒

阅读量飙升

研究发现，在不安全代码上训练的 AI 模型变得有毒

近日，一组 AI 研究者发现了一个令人关注的现象:当模型在不安全的代码上进行微调时，会产生一些相当有毒的输出。研究团队在其最新发表的论文中指出，包括 OpenAI 的 GPT-4o 和阿里巴巴的 Q…

七个圈

GPT-4.5发布：价格飙升30倍能力提升引发热议

阅读量飙升

GPT-4.5发布：价格飙升30倍能力提升引发热议

2025 年 2 月 27 日，OpenAI正式发布了其最新聊天模型GPT-4.5，这一消息迅速在Twitter（现为X平台）上引发了广泛讨论。作为OpenAI迄今为止最强大的对话模型，GPT-4. …

七个圈

Claude 3.7正式登陆Trae平台，用户可升级体验更智能AI

阅读量飙升

Claude 3.7正式登陆Trae平台，用户可升级体验更智能AI

2025 年 2 月 27 日，Trae官方推特账号@Trae_ai发布了一则令人振奋的消息：备受期待的Claude 3. 7 现已正式在Trae平台上推出！该消息于太平洋标准时间（PST）上午6: …

七个圈

OpenAI 发布 GPT-4.5：迄今最强大模型亮相强化推理与情感智能

阅读量飙升

OpenAI 发布 GPT-4.5：迄今最强大模型亮相强化推理与情感智能

2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5，作为研究预览版率先提供给 ChatGPT Pro 用户（每月订阅费200美元）。这款被誉为“迄今为止最大、最知识渊…

七个圈

Claude 3.7 Sonnet正式登陆Perplexity Pro：代理工作流与代码生成显著提升

阅读量飙升

Claude 3.7 Sonnet正式登陆Perplexity Pro：代理工作流与代码生成显著提升

人工智能搜索平台Perplexity宣布，其Pro版本现已整合Anthropic公司最新发布的Claude3.7Sonnet模型。根据Perplexity官方在X平台上的最新消息，该公司已对这一模型进…

七个圈

斯坦福新AI框架 OctoTools：无需训练，让AI实现高效复杂推理！

阅读量飙升

斯坦福新AI框架 OctoTools：无需训练，让AI实现高效复杂推理！

在人工智能（AI）领域，尽管大型语言模型(LLMs)在处理自然语言方面表现出色，但它们在面对复杂推理任务时常常显得力不从心。这些任务通常需要多步骤的推理、领域特定的知识，或者外部工具的有效集成。为了克…

七个圈

月之暗面联手UCLA推新模型Mixture-of-Expert，提升语言模型训练效率

阅读量飙升

月之暗面联手UCLA推新模型Mixture-of-Expert，提升语言模型训练效率

在人工智能领域，训练大型语言模型（LLMs）已成为推动技术进步的重要方向。然而，随着模型规模和数据集的不断扩大，传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。研究人员面临着计算成本…

七个圈

深推理模型崛起！Together AI融资3.05亿美元助推GPU需求

阅读量飙升

深推理模型崛起！Together AI融资3.05亿美元助推GPU需求

在 AI 行业，Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资，这一消息引起了广泛关注。该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。与最初的担忧相反，许…

七个圈

AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

阅读量飙升

AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

近日，Vectara 发布了一份名为 “幻觉排行榜” 的报告，比较了不同大型语言模型（LLM）在总结短文档时产生幻觉的表现。这份排行榜利用了 Vectara 的 Hughes 幻觉评估模型(HHEM-…

七个圈

微软发布 OmniParser V2.0：把屏幕截图转化成LLM可处理的结构化格式

阅读量飙升

微软发布 OmniParser V2.0：把屏幕截图转化成LLM可处理的结构化格式

微软近日发布了 OmniParser V2.0，这是一个旨在将用户界面（UI）截图转换为结构化格式的全新解析工具。OmniParser 能够提高基于大型语言模型(LLM)的 UI 代理的性能，帮助用户…

七个圈

Meta 创新推出 “连续概念混合” 框架，推动 Transformer 预训练新革命

阅读量飙升

Meta 创新推出 “连续概念混合” 框架，推动 Transformer 预训练新革命

近年来，随着大型语言模型（LLMs）的快速发展，自然语言处理领域经历了前所未有的变革。这些技术如今广泛应用于代码助手、搜索引擎和个人 AI 助手等场景，展现了强大的能力。然而，传统的 “下一个 tok…

七个圈

HuggingFace发布AI Agent课程

阅读量飙升

HuggingFace发布AI Agent课程

Hugging Face 近期推出了一门名为 “Agent课程” 的在线学习课程，旨在帮助学习者深入理解智能Agent的基础知识及应用。课程内容丰富，共分为五个单元，从Agent的基本概念到最终的作业…

七个圈

Meta AI推出MILS系统教导 LLMs无需专门培训即可处理多媒体数据

阅读量飙升

Meta AI推出MILS系统教导 LLMs无需专门培训即可处理多媒体数据

Meta AI的研究人员与学术伙伴共同开发了一种创新系统——MILS（多模态迭代LLM求解器），该系统能在无需经过专门训练的情况下，教大型语言模型处理图像、视频和音频。MILS依赖于语言模型的自然问题…

七个圈

PromptLayer：为非技术用户打造的AI应用开发新工具

阅读量飙升

PromptLayer：为非技术用户打造的AI应用开发新工具

随着生成式人工智能（GenAI）的快速崛起，PromptLayer 作为一家位于纽约的初创公司，迅速进入了提示工程这一新兴领域。提示工程是指为 AI 聊天机器人提供精确指令，以获取有用的输出。Prom…

七个圈

Realbotix 推出第三方 AI 集成，提升人形机器人交互体验

阅读量飙升

Realbotix 推出第三方 AI 集成，提升人形机器人交互体验

Realbotix 公司作为人形机器人和伴侣型人工智能的领先制造商，正在通过推出大型语言模型（LLM）集成和高级定制功能，进一步拓展其技术能力。这些新功能计划于2025年2月推出，将使用户能够与包括…

七个圈

AI在这方面存在致命缺陷！专家：AI不应用于重要应用

阅读量飙升

AI在这方面存在致命缺陷！专家：AI不应用于重要应用

在当前的技术环境下，人工智能（AI）引发了广泛的讨论。德蒙特福特大学的网络安全教授 Eerke Boiten 对此表示，现有的 AI 系统在管理和可靠性方面存在根本性缺陷，因此不应被用于重要应用。 B…

七个圈

字节跳动推出 PaSa：基于大语言模型的智能学术论文搜索代理

阅读量飙升

字节跳动推出 PaSa：基于大语言模型的智能学术论文搜索代理

在学术研究领域，文献检索是一项复杂且重要的信息获取任务。研究人员需要能够处理复杂的、专业知识领域的检索能力，以满足细致的研究需求。然而，现有的学术搜索平台，如谷歌学术，往往难以应对这些复杂的研究查询。…

七个圈

Sakana AI 的 Transformer² 模型突破 LLM 限制，实现动态推理

阅读量飙升

Sakana AI 的 Transformer² 模型突破 LLM 限制，实现动态推理

Sakana AI 是一家专注于自然启发算法的人工智能研究实验室，近日推出了一种名为 Transformer² （Transformer-squared）的创新自适应语言模型。该模型无需昂贵的微调，…

七个圈

Meta首席AI科学家预测五年内将出现新的AI架构范式，开启 “机器人十年”

阅读量飙升

Meta首席AI科学家预测五年内将出现新的AI架构范式，开启 “机器人十年”

在日前的达沃斯 “技术辩论” 会上，Meta 的首席 AI 科学家 Yann LeCun 对未来五年的人工智能发展做出了激动人心的预测。他认为，现有的人工智能系统将在未来3到5年内面临巨大的变革，将出…

七个圈

英语文学毕业生开发AI工具，轻松解读Twitter个人简介

阅读量飙升

英语文学毕业生开发AI工具，轻松解读Twitter个人简介

在当今数字化的世界里，短文本的使用已成为在线交流的核心。然而，由于这些文本往往缺乏共同的词汇或背景，使得人工智能（AI）在分析时面临诸多挑战。对此，悉尼大学的一名英语文学研究生兼数据科学家贾斯汀・米勒…

七个圈

国产大模型再突破！DeepSeek R1开源，性能直逼OpenAI，开启AI平权新时代

阅读量飙升

国产大模型再突破！DeepSeek R1开源，性能直逼OpenAI，开启AI平权新时代

DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1，该模型在性能上表现出色，被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破，也为全球AI开发者带…

七个圈

AI 在高级历史考试中表现不佳：GPT-4 Turbo 准确率仅 46%

阅读量飙升

AI 在高级历史考试中表现不佳：GPT-4 Turbo 准确率仅 46%

近日，一项由奥地利复杂科学研究所（CSH）主导的研究显示，尽管大型语言模型(LLMs)在多项任务中表现优异，但在应对高级历史问题时却暴露了短板。研究团队针对三大顶尖模型进行测试，包括 OpenAI 的…

七个圈

历史知识成AI软肋:大型语言模型难解复杂历史问题

阅读量飙升

历史知识成AI软肋:大型语言模型难解复杂历史问题

最新研究显示，尽管人工智能在编程和内容创作等领域表现出色，但在处理复杂的历史问题时仍显不足。近期在NeurIPS会议上公布的一项研究表明，即使是最先进的大型语言模型（LLM）在历史知识测试中也难以取得…

七个圈

阅读量飙升报道称：AI搜索引擎公司Perplexity寻求与TikTok美国合并

近日，美国搜索引擎初创公司 Perplexity AI 向 TikTok 的母公司字节跳动提出了一项合并提案，计划将 Perplexity 与 TikTok 美国版合并成一个新实体。根据知情人士的透露…

新鲜出炉，等待你的评论

暂无评论，快留下你的脚印吧！还可以领现金哦~

七个圈

谷歌推出 Vertex AI RAG 引擎，助力开发者构建智能应用

阅读量飙升

谷歌推出 Vertex AI RAG 引擎，助力开发者构建智能应用

谷歌最近正式推出了 Vertex AI RAG 引擎，这是一款旨在简化从知识库中检索相关信息并将其输入大型语言模型（LLM）的复杂流程的开发工具。作为 Vertex AI 平台的一部分，Vertex …

七个圈

新型AI模型Transformer²：像章鱼一样灵活，动态调整权重，自我适应环境

阅读量飙升

新型AI模型Transformer²：像章鱼一样灵活，动态调整权重，自我适应环境

传统的大型语言模型（LLM）微调方法通常计算密集，且在处理多样化任务时显得静态。为了解决这些挑战，Sakana AI 推出了一种名为 Transformer² 的新型自适应框架。Transformer…

七个圈

阅读量飙升 AI 训练成 “剽窃”？OpenAI 与纽约时报版权之争开庭

近日，OpenAI 与纽约时报之间的版权侵权诉讼在美国联邦法院开庭。此案引发广泛关注，因为它不仅涉及两大知名机构，还可能对整个数字媒体生态系统产生深远影响。法庭上，OpenAI 及其主要投资者微软提出…

新鲜出炉，等待你的评论

暂无评论，快留下你的脚印吧！还可以领现金哦~

七个圈

AI编程能力进化！通过不断PUA大模型就能提升代码质量

阅读量飙升

AI编程能力进化！通过不断PUA大模型就能提升代码质量

近年来，人工智能（AI）的编程能力不断发展，但尚未达到完美。最近，BuzzFeed 的资深数据科学家 Max Woolf 通过实验发现，如果对大型语言模型(LLM)不断提供 “写更好代码” 的提示，A…

七个圈

贡献榜

贡献文章数

七个圈

七个圈

关注AI领域动态，传递精准资讯，助力读者洞悉AI行业的最新资讯。

创米

AI学习引路人，专注编写、收集整理AI知识，为学习者提供清晰、实用的学习内容。

AI情报

AI情报

向圈友们分享AIGC活动招募信息，共建内容，分享自己的学习心得、交流经验。

AI领航员

AI领航员

AI变现策略探索者，乐于向个人创业者分享AI技术如何助力创新与变现。