内容持续更新中
OpenAI宣布其图像生成API(Responses API)迎来重大更新,新增流式传输、多轮编辑以及与Model Context Protocol(MCP)工具和实时网络数据搜索的集成功能。这些新特…
Ollama官方宣布推出其最新版本Ollama v0.8,为本地运行大型语言模型(LLM)带来了突破性升级。新版本引入了流式传输响应和工具调用功能,支持实时网络搜索等交互场景,显著提升了本地AI的实用…
Opera公司正式宣布推出其全新AI驱动的代理浏览器Opera Neon,并开放Alpha版候补名单。这一浏览器以其独特的“代理”功能,重新定义了用户与网络的交互方式,集成了智能聊天、任务自动化和内容…
AI领域迎来一项重大技术突破——MotionPro,一款专为图像到视频(I2V)生成设计的精密运动控制器正式亮相。这一技术通过创新的区域轨迹和运动掩码技术,实现了对物体和镜头运动的精细化控制,为视频生…
近日,一款名为 Direct3D-S2的全新3D 生成框架引发了业界热议。该框架通过创新的 空间稀疏注意力(SSA)机制,显著提升了高分辨率3D 图像生成的质量与效率,为千兆级3D 生成提供了更具可扩…
近日,阿里巴巴正式发布全新 AI 模型 QwenLong-L1-32B,一款基于强化学习(RL)优化的长上下文推理模型,标志着阿里巴巴在人工智能领域的又一重大突破。该模型以其超长的上下文处理能力和卓越…
无人机技术的飞速发展正在改变我们的生活方式,而语言指令控制无人机的研究无疑是这一领域的先锋。一项名为UAV-Flow的创新研究项目正崭露头角,通过自然语言处理技术,让用户仅凭语音指令即可实现对无人机的…
近日,关于 Anthropic 旗下 AI 模型 Claude 的功能改进建议引发广泛关注。这些建议涵盖了上下文窗口扩展、记忆功能增强、文件格式支持扩展等多个方面,预示着 Claude 可能迎来重大升…
OpenAI 旗下 GPT-4o 的高级语音模式(Advanced Voice Mode)近期迎来重大更新,不仅能进行更自然的语音交互,还新增了令人瞩目的“唱歌”功能。尽管当前唱歌表现尚显稚嫩,但这一…
人工智能基础设施建设迎来历史性突破!星门计划(Project Stargate)作为一项由OpenAI、Oracle、SoftBank及阿布扎比MGX基金共同推动的5000亿美元AI数据中心项目,正迅…
人工智能技术的快速发展对提示工程(Prompt Engineering)提出了更高要求。AIbase从社交媒体获悉,OpenAI于近日发布了针对GPT-4.1的提示工程指南,详细阐述了如何通过清晰、精…
许多自媒体的朋友都会遇到提取视频文案的需求,然而市面上的工具大多数都需要付费,价格从几十元到上百元不等,实行的是订阅或者按提取次数计费的方式,长期下来也是一笔不小的开支。 然而,我最近发现了一款名为豆…
兄弟们,一句话P图成真了!还记得之前MJ推出的图片编辑功能吗?涂抹你想要修改的区域,输入提示词就能一键更改原图。 现在,豆包大模型团队也正式上线了类似的功能——SeedEdit。而且,相比于MJ还需要…
TryOn Labs 最新开发的 FLUX.1-dev LoRA 服装生成器,利用先进的人工智能技术,为用户带来前所未有的时尚设计体验。只需输入对服装的文字描述,如颜色、图案、材质、风格等细节,就能快…
日常生活中,你是不是拍了不少“神图”,但苦于没有合适的音乐给你的神图加分。现在,你可以很轻松地给你的神图加点料了。 Suno推出的新功能“Suno Scenes”,可以满足大家的需求。该功能支持用户上…
Runway又出新功能!X博主Heather Cooper爆料称,Runway Gen-3新增了一项名为Edit Time的功能。该功能支持对生成的视频进行后期修改,比如裁剪、调整速度、或者倒放等。 …
Object Cutter是一款智能图像处理工具,它的核心亮点在于将文字指令与图像识别技术完美结合。用户可以指定主体进行抠图。用户只需通过简单的文字描述或框选操作,就能精确指定需要保留的图像元素,系统…
如果问最近最火的AI产品是哪个,AIbase上周报道的“毒舌AI”Twitter Personality可以说是当仁不让了! 现在,这款产品的开发者@ky__zo晒出了收入:每小时赚近4K 美元! 另…