内容持续更新中
大型语言模型(LLM)通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展,如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型,展现出强大的推理能力。然而,这种…
近日,南京大学的周志华教授团队发布了一项重要研究,首次理论证明了在大语言模型中可以发现内源性奖励模型,并有效应用强化学习(RL)来提升模型表现。 当前,许多对齐方法依赖于人类反馈强化学习(RLHF),…
近日,来自香港大学、香港中文大学以及商汤科技的研究团队发布了一个令人瞩目的新框架 ——GoT-R1。这一全新的多模态大模型通过引入强化学习(RL),在视觉生成任务中显著提升了 AI 的语义和空间推理能…
近日,小鹏汽车创始人何小鹏在社交媒体上透露,作为将 “智能化” 作为核心的车企之一,小鹏汽车的本质定位在于 “AI 汽车公司”。他强调,人工智能(AI)最大的价值不仅在于数字世界的应用,更在于能够改变…
在人工智能技术日益普及的今天,DeepSeek与清华大学的合作引起了业界的广泛关注。作为一家中国初创公司,深思科技以其在低成本推理模型方面的突破而闻名,而这一次,他们希望通过与清华大学的学术合作,进一…
近年来,具身智能备受瞩目,从春晚舞台上的机器人精彩演出,到被政府工作报告提及,再到英伟达CEO黄仁勋的多次推崇,它已成为人工智能领域的热点。具身智能的目标是让机器人在真实世界中如人类般精准感知并灵活反…
腾讯近日推出了全新大型语言模型——混元-T1,并声称其推理能力与OpenAI的顶尖推理系统不相上下。据腾讯披露,混元-T1在研发过程中深度依赖强化学习,训练后高达96.7%的算力都致力于提升模型的逻辑…
金融科技领域迎来一位引人注目的人才。由上海财经大学统计与数据科学学院的张立文教授团队(SUFE-AIFLM-Lab)与财跃星辰共同研发的Fin-R1模型现已正式开源,其卓越性能引起了业界的广泛关注。这…
波士顿动力公司展示最新Atlas机器人的超凡动作能力,通过强化学习和动作捕捉技术,实现更自然、更灵活的类人动作,受到广泛关注。
波士顿动力展示了最新动作能力突破,Atlas机器人逼近人类水平。通过强化学习和动作捕捉技术,Atlas展现更自然、更灵活的类人动作,推动人形机器人应用。
近日,小米大模型团队在音频推理领域的研究中取得了突破性进展,成功应用强化学习算法于多模态音频理解任务,准确率达到了64.5%,这一成就使其在国际权威的 MMAU 音频理解评测中夺得了第一名。这一成果的…
小米技术官方微博宣布,小米大模型团队在音频推理领域取得了显著进展。他们在受到 DeepSeek-R1的启发后,率先将强化学习算法应用于多模态音频理解任务。团队在短短一周内便以64.5% 的 SOTA(…
3月16日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文…
有消息称,AI大模型独角兽MiniMax将收购深圳AI视频生成创企鹿影科技(Avolution.ai),双方目前已经敲定收购意向,相关流程还在持续进行。对此,MiniMax暂无回应。从知情人士处了解到…
近日,360智脑团队宣布成功复现Deepseek的强化学习效果,并正式发布开源推理模型 Light-R1-14B-DS。该模型性能表现超越 DeepSeek-R1-Distill-Llama-70B和…
近日,国内知名医疗大模型评测平台 MedBench 公布了最新榜单,其中,蚂蚁医疗团队研发的蚂蚁医疗大模型凭借卓越表现,一举夺得了评测榜单和自测榜单的双料冠军,分别以97.5和98.2的高分引发了业界…
在人工智能领域,阿里通义实验室团队近日宣布开源其最新研发的多模态模型 ——R1-Omni。这一模型结合了强化学习与可验证奖励(RLVR)方法,展现出了在处理音频和视频信息方面的卓越能力。R1-Omni…
3月11日,通义实验室团队宣布开源R1-Omni模型,为全模态模型的发展带来了新的突破。该模型结合了强化学习与可验证奖励(RLVR)方法,专注于提升多模态情感识别任务中的推理能力和泛化性能。 R1-O…
沪深两市成交额近2万亿元 人工智能成市场最强主线 ◎记者 李雨琪 2月7日,A股市场表现活跃,沪指收盘站上3300点关口,北证50指数大涨近5%。截至收盘,上证指数报3303.67点,…
波士顿动力公司于本周三宣布了一项新合作,旨在提升其电动 Atlas 人形机器人的强化学习能力。这一合作伙伴关系是与机器人与人工智能研究所(RAI Institute)建立的,后者曾名为波士顿动力人工智…
蛇年开市第一天(2月5日),DeepSeek、人形机器人等概念股强势演绎。消息面上,A股春节假期休市期间,DeepSeek大模型持续火爆,而宇树机器人在蛇年春晚也带来了震撼表现。多位公私募基金人士称,…
证券时报e公司讯,中信证券研报表示,近期,DeepSeek爆火全球,其以强能力、低成本的特点著称,对全球AI产业链带来强借鉴意义。2025年1月20号发布的DeepSeek-R1性能对标OpenAI …
大模型迭代升级竞争加剧,Agent加快落地,继续布局AI应用。1月20日,DeepSeek(深度求索)发布全新大模型DeepSeek-R1,其在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的…
OpenAI推出AI Agent“深度研究”,分析师要失业了? 当地时间2月2日,OpenAI在直播中宣布推出一款全新的AI代理(ai agent),名称叫做“深度研究”(Deep Research)…