近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。
Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。它不仅能够主动澄清问题、深入思考,还能自主规划关键词进行搜索,并筛选出高质量的信息。在处理任务时,Kimi-Researcher平均会进行23步推理,规划74个关键词,并找到206个网址,最终只保留信息质量最高的前3.2%内容。这一过程确保了研究成果的详实与可溯源性。
除了强大的信息搜索与筛选能力外,Kimi-Researcher还能自主调用浏览器、代码等工具,处理原始数据并自动生成分析结论。其交付成果包括一份信息详实、可溯源的深度研究报告,以及一个可交互、可分享的动态可视化报告。这些报告不仅长度在万字以上,平均引用约26个高质量信源,还支持在线生成链接并分享,极大地方便了用户的展示与协作需求。
为了验证Kimi-Researcher的真实能力,月之暗面为其安排了一场高难度的“考试”——Humanity’s Last Exam(HLE)。这套专为AI设计的高难度benchmark覆盖了上百个专业领域,从数学、物理、医学到政治、历史,全面考察模型在复杂知识任务中的解决能力。Kimi-Researcher在完全零结构、无流程设计的设置下,取得了Pass@1准确率26.9%、Pass@4准确率40.17%的优异成绩,超越了多个知名AI模型,达到了目前已知的最高水平之一。
在真实场景的应用中,Kimi-Researcher同样展现出了出色的表现。无论是算法同学寻找高价值的benchmark、运营同学研究行业内的公司发展,还是法务朋友快速了解各国数据隐私法规,Kimi-Researcher都能在短时间内生成结构清晰、信息全面的报告,为用户提供有力的支持。
月之暗面表示,Kimi-Researcher是通过端到端强化学习训练出来的Agent模型,具有零结构、自适应的特点。它没有复杂的提示词或预设流程,而是完全依靠模型自身的试错与学习来应对复杂任务。这种设计使得Kimi-Researcher在面对信息冲突、工具切换和环境变化时,能够展现出强大的适应性与泛化能力。
目前,Kimi-Researcher正处于小范围灰度测试阶段。用户可以通过访问kimi.com申请内测资格,并在获得权限后打开Kimi对话框下方的“深度研究”按钮开始使用。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则