2026年4月10日：OpenAI推百元Pro档，Gemini能画3D图，语音交互进入全双工时代

摘要：2026年4月10日，AI领域迎来一系列密集更新。消费级市场方面，OpenAI正式推出每月100美元的ChatGPT Pro档位，为重度用户提供更高配额；Google则让Gemini免费用户也能生成完整歌曲，并推出了可交互的3D模型与图表生成功能。技术前沿上，字节跳动发布了能“边听边说”的全双工语音大模型，大幅提升实时对话自然度；同时，多家机构开源了包括视觉语言模型、稀疏大模型在内的多项重要成果。企业级生态持续深化，Claude、Codex等平台推出多项提升开发效率的新工具，而算力需求激增已传导至云端，腾讯云宣布下月起上调AI算力产品价格。

一、模型与工具上新：从语音交互到开源视觉理解

今日，多家公司发布了旨在解决特定痛点或降低使用门槛的新模型与开发工具。

字节跳动发布“全双工”语音模型Seeduplex：该模型基于自研大语言模型实现端到端建模，重点优化了在嘈杂环境下的抗干扰能力和对话节奏判断。相比上一代方案，其误回复率和误打断率降低了一半，让AI语音通话更像真人交谈。用户更新“豆包”App至最新版，即可在对话框中使用“打电话”功能体验。
LG与阿里开源重要模型：
- LG AI Research发布EXAONE 4.5：这是一个330亿参数的开源视觉语言模型，在文档理解和韩语推理任务上表现突出，支持长达26万tokens的上下文。
- 阿里开源两款Marco-MoE稀疏大模型：包括Marco-Mini-Instruct（173亿总参数）和Marco-Nano-Instruct（80亿总参数）。它们采用混合专家架构，在推理时仅激活少量参数，旨在以更低的计算成本实现高效的多语言处理能力。
开发工具更新，聚焦效率与成本：
- Claude API上线“顾问”策略：开发者可让低成本的Sonnet或Haiku模型作为“执行者”处理常规任务，仅在遇到复杂决策时向顶级的Opus模型寻求“顾问”指导。官方称此组合能在几乎不损失智能的情况下降低约12%的任务成本。
- MiniMax发布MMX-CLI命令行工具：这是一个为AI Agent设计的工具，允许Agent原生调用MiniMax的文本、图像、视频、语音和音乐生成模型，并优化了非交互环境下的任务控制。

二、产品功能升级：交互式可视化、音乐创作与企业协同

面向终端用户和企业的产品功能也有显著更新，体验更加沉浸和高效。

Gemini推出交互式可视化功能：现在，用户可以在Gemini聊天中直接生成可交互的3D模型、图表和模拟动画。例如，你可以让它展示月球轨道，然后手动拖动滑块调整参数，或旋转3D模型从各个角度观察。只需对Pro模型输入“show me…”等指令即可体验。
Gemini向免费用户开放完整歌曲生成：免费用户现在每天可以使用Lyria 3模型生成最多5首、长约3分钟的完整歌曲。若达到限额，仍可生成30秒的片段。
Claude Cowork结束预览，全面开放：Anthropic的桌面端协同应用Claude Cowork现已向所有付费计划用户开放，支持macOS和Windows。它常用于团队任务处理和项目同步。企业版同时上线了基于角色的访问控制、支出限额等管控功能。
Codex增强原生应用开发能力：官方上线“Build macOS Apps”插件，为开发者提供基于SwiftUI和AppKit的原生macOS应用构建支持，打通了从编码到构建、打包的一键式流程。

三、行业动态与前瞻：算力需求推动基础设施变革

底层算力需求持续塑造着行业生态与商业合作。

腾讯云上调AI算力产品价格：受全球AI算力需求激增及硬件成本上涨影响，腾讯云宣布自下月起，将上调AI算力、容器服务等核心产品的刊例价，涨幅为5%。
巨头深化基础设施合作：
- Intel与Google扩大合作：双方将围绕多代Intel Xeon处理器及定制的基础设施处理单元展开合作，旨在提升AI云基础设施的效率和性能。
- Meta与CoreWeave签署210亿美元协议：为支撑其AI研发的算力需求，Meta与云服务商CoreWeave将一项巨额合作协议延长至2032年底，并获得了英伟达下一代芯片的初始部署权。
其他值得关注的消息：
- OpenAI在推出100美元Pro档位的同时，也重新平衡了Plus用户的用量分配，鼓励用户在一周内均匀使用而非单日集中消耗。
- 通义实验室开源了支持文本、图像、视频混合检索的RAG框架VimRAG，旨在解决多模态长上下文检索中的难题。
- 有传闻称，AI云服务商Nebius正在洽谈收购大模型公司AI21 Labs，意图向全栈AI云服务转型。

Ai资讯

文章版权归作者所有，未经允许请勿转载。

腾讯混元开源翻译模型1.5：手机可离线运行，1GB内存流畅部署，效果超越商用API

2026年4月10日：OpenAI推百元Pro档，Gemini能画3D图，语音交互进入全双工时代

一、模型与工具上新：从语音交互到开源视觉理解

二、产品功能升级：交互式可视化、音乐创作与企业协同

三、行业动态与前瞻：算力需求推动基础设施变革

AI编程：技术平权时代，普通人也能成为“开发者”

OpenAI推出100美元 ChatGPT Pro套餐：开发者福音，Codex额度翻倍

相关文章

腾讯混元开源翻译模型1.5：手机可离线运行，1GB内存流畅部署，效果超越商用API

GLM-4.7编程能力比肩Claude Code，国产大模型实现“无感平替”

Claude Code 2.1.0重磅发布：Agent能力全面进化，开发者体验与安全性双重升级

OpenAI宣布ChatGPT广告测试：商业化转型背后的盈利压力与AI中立性挑战

暂无评论

最新文章

2026年4月10日：OpenAI推百元Pro档，Gemini能画3D图，语音交互进入全双工时代

一、 模型与工具上新：从语音交互到开源视觉理解

二、 产品功能升级：交互式可视化、音乐创作与企业协同

三、 行业动态与前瞻：算力需求推动基础设施变革

AI编程：技术平权时代，普通人也能成为“开发者”

OpenAI推出100美元 ChatGPT Pro套餐：开发者福音，Codex额度翻倍

相关文章

腾讯混元开源翻译模型1.5：手机可离线运行，1GB内存流畅部署，效果超越商用API

GLM-4.7编程能力比肩Claude Code，国产大模型实现“无感平替”

Claude Code 2.1.0重磅发布：Agent能力全面进化，开发者体验与安全性双重升级

OpenAI宣布ChatGPT广告测试：商业化转型背后的盈利压力与AI中立性挑战

暂无评论

最新文章

标签云

一、模型与工具上新：从语音交互到开源视觉理解

二、产品功能升级：交互式可视化、音乐创作与企业协同

三、行业动态与前瞻：算力需求推动基础设施变革