欢迎来到AIbase【AI日报】栏目!
每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。
更多AI资讯访问:https://www.aibase.com/zh
百度正式发布文心大模型4.5系列并完全开源,包含多种参数配置的十款新模型,使用飞桨框架训练推理,FLOPs利用率47%,在文本多模态基准测试中表现优异,提供一站式使用指南和工具,方便开发者精调部署,已上传至Hugging Face、GitHub等平台。
体验地址:https://yiyan.baidu.com
Hugging Face:https://huggingface.co/baidu)
GitHub:https://github.com/PaddlePaddle/ERNIE
2.通义千问发布多模态统一理解与生成模型Qwen VLo
Qwen VLo多模态大模型发布,基于Qwen-VL系列升级,采用渐进式生成方式,精准看懂世界并高质量再创造,支持开放指令编辑修改生成,具备多语言指令能力,可进行图文输入输出,目前处于预览阶段,体验地址为Qwen Chat平台。
体验地址:chat.qwen.ai
3.阿里Ovis-U1震撼发布:多模态AI三合一,开源赋能全球开发者
阿里巴巴国际AI团队发布Ovis-U1多模态大模型,3亿参数,集成多模态理解、文生图像和图像编辑功能,采用创新架构设计,基于Python3.10等技术栈构建,训练中引入合规性检查算法,代码模型权重等已公开,助力多领域应用。
项目:(https://huggingface.co/AIDC-AI/Ovis-U1-3B)
4.华为开源盘古7B稠密和72B混合专家模型
华为开源盘古7B稠密模型、72B混合专家模型及升腾推理技术,践行升腾生态战略,推动大模型技术研究与行业应用,相关模型权重代码已上线开源平台,邀请开发者等下载使用反馈。
5.一张图即可生成爆款视频!美图MOKI「AI创意广告」限时免费
美图MOKI推出“AI创意广告”功能,用户上传图片选择模板即可生成专业级视频,集成七大主流视频生成模型,体验地址为www.moki.cn,可完成从创意到成片的完整流程。
体验地址:www.moki.cn
6.Gemini2.5Pro API 免费回归,开发者社区热烈响应
谷歌Gemini2.5Pro API重新纳入Google AI Studio免费层级,该模型多模态和推理能力强,支持多种输入类型,此次免费回归为开发者提供创新机会,免费计算资源翻倍,社区反应积极。
7.豆包「深入研究」功能在豆包APP、网页版及电脑版开启测试
豆包APP等平台开启「深入研究」功能测试,可整合海量深度信息生成研究报告或可视化网页结果,用户输入指令几分钟获定制化报告,还支持一键转播客形式。
8.小米“AI百宝箱”内测期结束,7月5日起停止服务
小米“AI百宝箱”内测结束,计划7月5日暂停服务,内测收集了数据反馈,非放弃项目而是进行数据整理等战略规划,小米在AI领域持续投入探索构建多层次全场景AI生态。
9.新开源 AI 系统 OmniGen2:像GPT-4o 一样融合了图像和文本生成
北京人工智能研究院推出OmniGen2开源系统,专注文本图像生成编辑等,采用独立解码路径,基于Qwen2.5-VL-3B变换器,使用自定义扩散变换器,有反思机制,性能在多个基准测试中出色,将发布到Hugging Face平台。
项目:https://huggingface.co/OmniGen2/OmniGen2
10.知乎“直答”升级知识库功能,深度融合社区内容打造沉浸式AI问答体验
知乎“直答”升级知识库功能,深度融合社区内容,带来沉浸式阅读等创新功能,旨在提供沉浸式多场景AI问答体验,扩大答主内容影响力,降低用户查询成本。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则