内容持续更新中
近期研究发现,大型语言模型在逻辑推理任务中受前提信息呈现顺序影响,乱序可能导致性能下降。谷歌DeepMind和斯坦福研究人员指出,逻辑自然顺序排列的前提可以提高模型表现。对于LLM等模型,改变前提顺序…
近期,GPT-4的“懒惰”现象再度引起关注。网友们发现,在代码比较任务中,GPT-4的完成率下降了近四分之一。尽管奥特曼表示新的一年会有改进,但网友们对其表现和优化策略仍感困扰。这一现象可能在新年有所…
谷歌的Bard通过GemPro版本在LMSYS聊天机器人榜上成功超越GPT-4,成为第二高分。Bard的崛起得益于搭载Gemini Pro模型,标志着谷歌在聊天机器人领域的突破。
美国人工智能研究公司OpenAI最近着手研发GPT-4的早期预警系统,以探讨大型语言模型是否能够提高获取关于生物威胁信息的效率,相较于互联网。该系统旨在作为一种“触发器”,提示潜在存在生物武器的可能性…
近日,国家语言资源监测与研究中心发布2023年度“十大新词语”,其中,“生成式人工智能”居于首位,高度吸睛。作为贯穿全年的高热度词条,生成式人工智能,自2023年初受益于ChatGPT的横空出世迎来风…
LAMM (Language-Assisted Multi-Modal) 旨在建设面向开源学术社区的多模态指令微调及评测框架,其包括了高度优化的训练框架、全面的评测体系,支持多种视觉模态。 ChatG…
近日,FAR AI实验室的团队发现GPT-4API存在安全漏洞,通过微调和搜索增强等方式成功越狱了这一先进模型。研究人员成功让GPT-4模型生成错误信息、提取私人信息和插入恶意URL。这一漏洞揭示了A…
大戏开始前,一片漆黑,当一抹边角被光线撕开,盛装演出的大幕也就将启了。 直至AI大模型ChatGPT向认知智能突破之前,AI的前景还一度“万古如长夜”,如无出意外,以ChatGPT、Gemini、文心…
今年10月,作为苹果公司与哥伦比亚大学的研究成果,Ferret就已经发布过一次,只是当时仅供研究使用而非商业许可,所以并未引起多大关注。如今情况发生了转变,随着各大科技公司你追我赶地公布研发成果,关于…
OpenAI的GPT-4语言模型被大多数人认为是用于驱动现代人工智能(AI)的最先进的语言模型。它被用于ChatGPT聊天机器人,效果非常好,其他人工智能也以类似的方式使用。但这并不是它发展的终点。与…
布里格姆和妇女医院的研究人员评估了 GPT-4 在临床决策中是否存在种族和性别偏见。他们发现,GPT-4 在生成患者案例、制定诊断和治疗计划,以及评估患者特征时存在明显的偏见。研究呼吁对大型语言模型进…
法国初创公司Mistral AI计划于2024年开源GPT-4级别模型,最近获得4.15亿美元融资并推出API服务。公司正在开发表现优异的多语言模型Mistral Medium,引起业内关注。同时,关…
OpenAI GPT-4因性能问题受到用户投诉,承认问题并将其归因于训练数据变更。修复计划未明确,但高度重视。竞争对手Gemini1.0备受关注。开发大型语言模型的复杂性成为突出问题。
加州大学圣迭戈分校研究发现,GPT-4在图灵测试中成功率超过41%,超越ELIZA。ELIZA以27%成功率模拟人类,GPT-3.5仅为14%,引发尴尬评价。研究指出,ChatGPT未专为图灵测试设计…
美国startup Inflection AI最近发布了新一代语言模型Inflection-2,在多项基准测试中表现优异,性能直追OpenAI的GPT-4,超越了谷歌和Meta的类似产品。Inflec…
教程内容简介 支持多种语言生成的上传视频或音频即可一键生成的模型。该模型的强大功能在短短一分钟内展示出来,使用户能够快速了解GPT-4的强大之处。此外,该模型还支持包括但不限于60多种国家和地区的语言…
在ChatGPT发布一年之后,生成式AI已经成为一个具有确定性的技术浪潮,而伊隆·马斯克旗下的xAI公司计划在本周将它11月初发布的大模型Grok接入X平台(推特),对X Premium+订阅者们开放…
美国人工智能研究公司OpenAI推出GPT-4Turbo,成功率超过41%,在图灵测试中展现出明显优势。研究指出GPT-4为付费版本,相较免费版本GPT-3.5在测试中表现更出色,但与人类63%的成功…
在Vectara排行榜中,OpenAI GPT-4以出色的97%准确率和仅有3%的幻觉率位居榜首。Vectara通过开源模型提供了一种评估大型语言模型幻觉率的方法,为企业提供更可信的生成式AI系统。谷…
最新研究显示,GPT-4在图形推理任务上仅有33%准确率,引发了对其图形处理能力的关注。研究者使用ConceptARC数据集测试,结果显示人类在同一任务上的平均准确率为91%,远高于GPT-4。研究方…
瑞士苏黎世联邦理工学院研究人员在论文中指出,GPT-4等大语言模型已经具备从公共论坛帖子中自动推断出用户的年龄、性别、地理位置等个人隐私信息的能力。在Reddit数据集上的实验表明,GPT-4的预测准…
微软与Be My Eyes合作,通过整合GPT-4提供更高效的盲人用户支持。数字视觉助手Be My AI整合进微软残疾人答疑台,解决技术问题,提高用户独立性。微软在推动产品无障碍性方面取得新进展。
最近有研究发现,GPT-4在一项视觉识别挑战任务中表现不佳,原因可能是该任务中的图片在训练集中过于常见,GPT-4是利用记忆而不是真正的视觉识别能力来解答的。这说明了即使大模型在某些任务中表现突出,也…
全球公司纷纷发布GPT-4职位,大型语言模型领域需求激增。微软、花旗集团、默克等知名公司积极招聘GPT-4专业人才,推动AI技术在客户服务和运营效率方面的应用。企业职位涵盖多领域,如Skype的AI集…
这意味着人人可零代码制作智能体的时代已来临。然而,自制 GPT 工具也意味着此前不少想要抓住 AI 浪潮的爱好者们研发的智能客服、虚拟人直播 / 解说、服务机器人、智能助手以及想要填补 OpenAI …
据站长之家11月9日消息,亚马逊正在秘密开发一个代号为“Olympus”的大型语言模型,参数高达惊人的2万亿个,是OpenAI最新推出的GPT-4参数的两倍。这将使Olympus成为当前公开的模型参数…
OpenAI最近发布了一系列新的API和工具,让开发AI应用变得更加简单。硅谷开发者抢先使用新API,制作出许多有趣的AI应用Demo。例如GPT-4-Turbo API速度快,易上手;TTS API…
最新研究指出,添加情感提示(Emotion Cues)可以显著提高AI模型,如GPT-4的性能。情感提示在语法纠正和创造性写作等任务中表现出更有效和响应灵敏的AI应用。这项研究强调了情感对AI交互的重…