内容持续更新中
天眼查App显示,腾讯科技(深圳)有限公司近日申请了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。这项专利的摘要揭示了该方法通过引入第一摘要文本和第二摘要文本,在大语言模型的训练…
近日,腾讯科技(深圳)有限公司在天眼查 App 上公布了一项关于大语言模型的训练方法及相关设备的专利。这项专利的名称为 “大语言模型的训练方法、装置、计算机设备及存储介质”,旨在通过创新的训练方式,提…
在全球人工智能技术迅猛发展的背景下,英伟达近日宣布将免费向公众开放19门自定进度的 AI 技术课程,旨在帮助开发者和技术爱好者提升在 AI 与数据科学领域的技能。这项举措不仅为学习者提供了珍贵的学习机…
在人工智能领域,大语言模型的"幻觉问题"一直是困扰业界的关键挑战。近日,一项基于HHEM-2.1-Open评估体系的测试结果显示,智谱AI旗下的GLM-4-9B模型交出了一份令人瞩…
随着大语言模型(LLM)在现代人工智能应用中的广泛应用,诸如聊天机器人和代码生成器等工具依赖于这些模型的能力。然而,随之而来的推理过程中的效率问题也日益突出。 尤其是在处理注意力机制时,如 Flash…
在2022年全球生成式 AI 浪潮的背景下,元始智能(RWKV)于2023年12月完成数千万人民币的天使轮融资,由天际资本投资。此次融资后,公司估值翻倍,资金将用于团队扩展、新架构研发及产…
在一篇聚焦医疗AI评测的研究论文中,微软似乎再次"不经意"地披露了业界多个顶级大语言模型的参数规模。这份发布于12月26日的论文不仅揭示了包括OpenAI、Anthropic在内的…
近年来,随着大语言模型(LLM)的广泛应用,这些模型在复杂推理和问题解决任务中发挥了重要作用。其中,受 OpenAI 的 o1架构启发的 o1-like 模型以其独特的人类思维、逐步推理的能力脱颖而出…
在企业普遍对AI应用持谨慎态度的背景下,AI销售开发代表(AI SDR)领域却呈现出罕见的爆发式增长。这些运用大语言模型和语音技术的初创公司,通过自动化个性化外联邮件和电话营销,正吸引着风投的密切关注…
国内新锐AI大模型公司阶跃星辰近日传出重磅消息,完成数亿美元融资。本轮融资由上海国有资本投资运营平台旗下的私募股权投资机构Fortera Capital领投,腾讯、启明创投等知名机构跟投。 这家成立仅…
中国人工智能公司DeepSeek日前发布了一款具有里程碑意义的开源大语言模型DeepSeek V3。这款拥有6710亿参数的模型不仅规模超越Meta的Llama3.1,在多项基准测试中的表现也优于包括…
在2024年12月19日的发布会上,智源研究院与腾讯宣布推出LongBench v2,这是一个专为评估大语言模型(LLMs)在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动…
近日,人工智能领域的领先公司ElevenLabs宣布推出其全新对话式AI平台,使开发者能够在几分钟内构建高效、流畅的智能语音代理。该平台不仅具备低延迟、高可配置性和强大的可扩展性,还为用户提供了极大的…
智谱科技近日宣布开源其端侧大语言和多模态模型GLM-Edge系列,这一举措标志着公司在端侧真实落地使用场景中的一次重要尝试。GLM-Edge系列由四种不同尺寸的模型组成,包括GLM-Edge-1.5B…
通义宣布旗下的大语言模型通义App现已推出鸿蒙原生版,并已在华为应用市场上线。用户可以下载体验这款全能AI助手带来的最新功能,享受更加丰富和个性化的服务。 通义App已完成手机、折叠屏、Pad等多端适…
科技企业服务商 AnyMind Group 今日宣布成立全新部门"AI App Studio",致力于开发基于生成式人工智能(GenAI)和大语言模型(LLM)的应用程序,加速企业…
Meta 最近发布了一项全新的基准测试,名为 Multi-IF,旨在评估大语言模型(LLM)在多轮对话和多语言环境下的指令遵循能力。这一基准覆盖了八种语言,包含4501个三轮对话任务,重点探讨了当前模…
随着渐冻症(ALS)等运动障碍患者日常沟通的困难,传统的辅助性沟通工具往往无法高效解决眼动打字过程中按键操作频繁带来的眼疲劳和高时间成本。为了解决这一问题,谷歌研究团队开发了一款名为SpeakFast…
巴黎初创公司 H,由前谷歌员工创立,去年夏天在未发布任何产品的情况下,便获得了2.2亿美元的种子轮融资,震惊业界。然而,在融资后不久,该公司却因 “运营和业务分歧” 而三位创始人离职,令人担忧其前景。…
阿里云重磅推出全新升级的Qwen2.5-Turbo大语言模型,其上下文长度突破至惊人的100万Token。这相当于什么概念?相当于10部《三体》,150小时的语音转录或3万行代码的容量!这回可真是“一…
近日,英伟达发布了其全新的 Blackwell 平台,并在 MLPerf Training4.1基准测试中展示了初步的性能表现。根据测试结果,Blackwell 在某些方面的性能相比于前一代 Hopp…
普林斯顿大学和耶鲁大学的研究人员最近发布了一份关于大语言模型(LLM)“思维链(CoT)”推理能力的报告,揭示了CoT推理的奥秘:它并非纯粹基于逻辑规则的符号推理,而是融合了记忆、概率和噪声推理等多种…
Meta FAIR、加州大学伯克利分校和纽约大学的研究人员联合推出了一种全新技术,名为思维偏好优化(TPO)。这项创新旨在提升大语言模型(LLM)在处理指令时的回答质量。与传统模型只关注最终答案不同,…
在当今全球化的商业环境中,精准的翻译工具对于跨文化交流至关重要。阿里国际最近推出的Marco-MT翻译大模型,正是在这样的背景下应运而生,它不仅刷新了我们对机器翻译能力的认知,还为电商领域的国际化提供…
最近,苹果公司的研究人员对大语言模型(LLM)的数学推理能力进行了深入研究,推出了一项名为 GSM-Symbolic 的新基准测试。 这个新基准测试是在 GSM8K 的基础上发展的,后者主要用于评估基…
最近,苹果公司进行了一项关于大语言模型(LLM)推理能力的研究,引发了人们对这些模型在数学领域表现的关注。 众所周知,GSM8K 基准测试被广泛用于评估模型在小学数学问题上的推理能力。尽管 LLM 在…
金山办公近日推出了一款基于AI Agent范式驱动的WPS AI伴写功能,进一步提升办公效率和写作体验。该功能支持添加包括云文档、网页等参考资料,用户完成标题后只需0.5秒就能理解用户意图并续写内容。…
最近大语言模型(LLM)发展迅猛,其中Transformer模型功不可没。Transformer的核心是注意力机制,它像一个信息过滤器,让模型关注句子中最重要的部分。但即使是强大的Transforme…