内容持续更新中
为了帮助企业用户有效使用复杂的 Gov.UK 网站,英国政府近日推出了一款基于 GPT-4o 技术的人工智能聊天机器人。这款聊天机器人旨在引导用户浏览超过70万页的政府信息,但初步测试结果…
大型语言模型如 GPT-4o 和 GPT-4o-mini 的出现,推动了自然语言处理领域的重大进步。这些模型能够生成高质量的响应,进行文档重写,以及提升各类应用的生产力。然而,这些模型面临的一个主要挑…
最近,一项由 OpenAI 进行的研究显示,尽管人工智能技术飞速发展,当前最先进的语言模型在回答事实问题时的成功率却远低于预期。 研究采用了 OpenAI 自家的 SimpleQA 基准测试,这个测试…
OpenAI今日宣布,ChatGPT的高级语音模式(Advanced Voice Mode,AVM)正式登陆Windows和Mac平台。该功能基于GPT-4o模型开发,使用户能够通过语音与AI进行更自…
最近,Meta 的首席 AI 科学家 Yann LeCun 表示,自机器智能(AMI)能够真正帮助人们的日常生活。Meta 正在努力提升其 Llama 模型的推理能力,希望能与 GPT-4o 等顶尖模…
来自德国达姆施塔特工业大学的最新研究揭示了一个令人深思的现象:即便是当前最先进的AI图像模型,在面对简单的视觉推理任务时也会出现明显失误。这项研究结果对AI视觉能力的评估标准提出了新的思考。 研究团队…
据媒体报道,微软亚洲研究院前首席研究经理谭旭已于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。谭旭加入后,其中一项重要目标是为该公司打造类似GPT-4o的语音体验。 月之暗面方面暂无回应…
最近 SK 电信又有大动作了!他们在周二宣布推出了自家的人工智能(AI)服务 A.的 PC 版本,用户现在可以通过网站 adot.ai 免费访问多种大型语言模型(LLM),其中包括最新的 GPT-4o…
一项新的研究表明,大型语言模型中出于善意的安全措施可能会带来意外的弱点。研究人员发现,根据不同的人口统计学术语,模型被“越狱”的难易程度存在显著差异。这项名为“Do LLMs Have Politic…
近日,由全球千万用户盲测投票产生的 AI 模型排行榜公布,国产 AI 模型“Yi-Lightning”逆袭,超越了此前长期占据榜首的 GPT-4。 “Yi-Lightning”模型由国内知…
在全球日益关注环保的背景下,优步(Uber)宣布将推出一款由 OpenAI 的 GPT-4o 技术驱动的 AI 助手,专门帮助司机们更顺利地过渡到电动车(EV)。 这一消息在近日于伦敦举行的 “Go-…
据悉,ChatGPT正在灰度发布一个新UI,输入框变小像个搜索输入框。这个新UI似乎是为即将推出的GPT-4o模型(可能会改名为GPT-auto)做准备。 在这个新UI中,用户可以输入他们想要完成的任…
日前,有网友反馈 ChatGPT 的最新版本 GPT-4o 正在进行灰度发布,新版本的UI界面设计真的有了大改进,输入框缩小得像个搜索框,让人感觉更加简洁和现代。 另外,消息称,新版本GPT-4o可能…
最近,Indeed Hiring Lab 发布了一项研究,探讨了生成式人工智能(AI)在职场中的应用,尤其是 OpenAI 开发的 GPT-4o 模型。这项研究分析了2800多种工作技能,结果表明,尽…
在数字时代,内容安全问题愈发受到重视。9月26日,OpenAI 正式推出了一款全新的多模态内容审核模型,名为 “omni-moderation-latest”。 该模型基于最新的 GPT-4o 技术,…
近日,艾伦人工智能研究所(Ai2)发布了 Molmo,这是一个全新的开源多模 AI 模型家族,表现出色,甚至在多个第三方基准测试中超越了 OpenAI 的 GPT-4o、Anthropic 的 Cla…
OpenAI 的新系统在最近的评估中取得了出色的成绩,夺得了聊天机器人排名的第一名。但是,由于评分数量较低,这可能会扭曲评估结果。 根据发布的概述,这些新系统在所有评估类别中都表现出色,包括整体性能、…
在AI的世界里,变化总是来得比我们想象的还要快。 最新消息,OpenAI的首席研究员,也是GPT-4o背后的灵魂人物Alexis Conneau,已经告别了老东家,毅然决然地踏上了创业的征途。 他在社…
OpenAI 公司宣布,第三方开发者现在可以对其新推出的多模态大型模型 GPT-4o 进行微调。这个功能让开发者可以根据自己应用的需求,调整模型的行为,比如改变语气、遵循特定指令或提升在技术任务中的准…
最近,OpenAI 发布了更新版的 ChatGPT 语音功能,基于最新的 GPT-4o 模型,使得与聊天机器人的交流更加自然和实时。然而,OpenAI 也对此表示了担忧,指出部分用户可能会对这个语音功…
总部位于旧金山的AI初创公司Cosine推出了一款名为Genie的新型AI模型,专为协助软件开发人员而设计。据该公司称,Genie在基准测试中的表现远超竞争对手,展现出卓越的能力。 Cosine与Op…
最近,一项新研究令人振奋,证明了大型语言模型(LLM)可以通过搜索功能来显著提升性能。特别是,参数量仅8亿的 Llama3.1模型经过100次搜索,竟然在 Python 代码生成的任务上与 GPT-4…
近期,康奈尔大学等机构的研究人员对包括GPT-4o、Claude和Gemini在内的多个生成式AI模型进行了幻觉基准测试。研究发现,即使是最先进的模型也只有约35%的时间能生成无幻觉文本,表明AI可靠…
ChatGPT近日推出了新版本GPT-4o,官方账号满怀激情地宣布了这一消息,但网友们的反应却异常淡定,评论区充斥着疑惑的声音,似乎对新旧版本的区别并不敏感。 许多日常使用ChatGPT的用户表示,他…
昨日,ChatGPT官方在社交网络 X 上低调的宣布,该AI工具从上周开始使用新的GPT-4o模型。ChatGPT称:“自上周以来,ChatGPT 中出现了一个新的 GPT-4o 模型。希望你们都喜欢…
在一份新的“红队”报告中,OpenAI记录了对GPT-4o模型优势和风险的调查,并揭示了GPT-4o的一些奇特怪癖。例如,在某些罕见情况下,尤其是当人们在高背景噪音环境中与GPT-4o对话时,如行驶中…
最近,OpenAI 发布了他们最新的 GPT-4o 系统卡,这是一份详细的研究文件,介绍了该公司在推出新模型之前所做的安全措施和风险评估。 GPT-4o 模型是在今年五月正式上线的。在发布之前,Ope…
最近,Reddit用户用户@zefman进行了一项有趣的实验,搭建了一个平台,让不同的语言模型(LLM)实时对战国际象棋,目的是用户有趣且轻松的方式来评估这些模型的表现。 众所周知,这些模型在下棋方面…