在人工智能领域,尤其是大语言模型(LLM)的应用中,准确性一直是一个备受关注的话题。为了提升 LLM 在回答复杂问题时的表现,检索增强生成(RAG)技术应运而生。这项技术允许模型在回答问题之前,先从知识库中检索相关信息,从而生成更加准确和有根据的答案。然而,RAG 技术也存在一些不足,尤其是在处理人类语言的多样性方面。为了解决这些问题,Lexical Diversity-aware RAG(DRAG)应运而生。
DRAG 技术针对 RAG 的短板,尤其是在检索和生成阶段,通过细致的分析和灵活的校准来提升准确性。在检索阶段,DRAG 通过 “多样性感知相关性分析器”(DRA),将问题拆分为三类组件:不变组件、变体组件和补充组件。DRA 会根据不同组件的特性设定相关性评估标准,从而筛选出与问题核心内容更相关的文档。
在生成阶段,DRAG 引入了 “风险引导稀疏校准策略”(RSC),以降低无关信息对模型生成答案的影响。RSC 通过评估每个词的风险,特别关注那些可能受到噪声影响的高风险词,并进行有针对性的校准,从而提高最终生成结果的质量。
通过这两大创新,DRAG 技术在处理复杂问题时的准确性大幅提升,实际测试表明,使用 DRAG 的模型准确率比传统 RAG 提升了45.5%。这一进展标志着人工智能在理解和生成自然语言方面又迈出了重要一步,尤其在面对多样化的语言表达时,DRAG 展现出了更强的能力。
随着 DRAG 技术的不断发展,未来的人工智能模型有望在更多应用场景中提供更加精准和可靠的答案。
划重点:
📝 DRAG 技术通过细分问题组件,提升检索准确性。
🔍 DRA 分析器和 RSC 校准策略共同降低无关信息干扰。
🚀 使用 DRAG 后,模型准确率提高了45.5%。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则