核心摘要: 2025年12月9日凌晨,国内AI公司智谱AI正式在GitHub上开源其手机智能体(Agent)框架“AutoGLM”。此举被视为在主流手机助手应用面临生态争议的背景下,为开发者社区提供了一条构建自主、可控、隐私安全的手机AI助手的新路径。开源项目包含“Phone Agent”框架与“AutoGLM-Phone-9B”模型,支持通过本地、云端或混合模式部署,旨在将AI对手机的控制与理解能力交还给开发者和技术爱好者,有望催生多样化的手机AI应用生态。
2025年12月9日凌晨,智谱AI将其研发的手机智能体框架“AutoGLM”在代码托管平台GitHub上正式开源。该项目由“Phone Agent”移动智能助手框架和“AutoGLM-Phone-9B”多模态语言模型共同构成。系统能够通过视觉语言模型理解智能手机屏幕,并借助智能规划生成和执行操作序列,通过ADB(Android调试桥)控制设备以完成自动化任务。
此次开源的时间点颇为微妙,正值另一款主流手机AI助手“豆包手机助手”因故下架,引发行业对手机AI入口、数据隐私与平台生态锁定的广泛讨论之际。智谱AI此举被业界解读为一种技术普惠的回应,旨在通过开源降低手机Agent的开发门槛,推动技术走向多元化和去中心化。有评论将这一行动类比为技术史上的经典开源事件,认为其如同当年的Linux、Android或Stable Diffusion,旨在将关键技术的构建能力从少数巨头手中释放出来,激发更广泛的创新。
AutoGLM开源项目直面当前手机端侧AI面临的核心挑战——算力与隐私。其提供的三种部署模式,为不同需求的开发者提供了灵活选择:
这种设计提供了一种“中间态”解决方案。在当前手机芯片算力尚不足以流畅运行较大参数模型的阶段,开发者可以利用个人电脑或私有云作为算力后端,从而在保护用户隐私(数据不经过商业服务器)的前提下,实现复杂的手机自动化操作。这为期待完全本地化、隐私安全的AI助手用户描绘了一条可行的技术演进路线。
AutoGLM并非一个全新的概念。其早在2024年10月的中国计算机大会(CNCC)上就已发布,并曾为荣耀YOYO智能助手等产品提供底层技术支持,演示过“一句话点2000杯咖啡”的自动化场景。然而,此次开源标志着它从一家公司的技术演示,转变为整个开发者社区可用的基础工具。
目前,开源版本已支持约50款国内主流应用,涵盖社交、购物、出行、娱乐、工具等多个类别,如微信、淘宝、抖音、12306、高德地图等。尽管其在执行流畅度、系统级集成度上与成熟的商业产品尚有差距,但其开源属性赋予了它独特的生命力。开发者可以基于此框架进行魔改、优化,并针对特定场景开发专属的Agent,例如自动化办公流程、定制化信息筛选、无障碍辅助工具等。
这正契合了提升新闻稿“用户价值”的核心思路:即从单纯的事实传播(某公司开源了某项目),升级到价值传播(这一开源行为如何赋予用户新的能力、创造新的可能性)。对于开发者读者而言,其价值在于获得了构建自主AI助手的“种子”;对于普通科技爱好者,其价值在于揭示了未来AI应用去中心化、隐私优先的一种可能形态。
AutoGLM的开源引发了关于技术发展路径的深层思考。当行业聚焦于“平台之争”和“入口垄断”时,开源提供了一种截然不同的叙事:将入口的定义权从单一应用图标,下放给无数个可自我部署的智能体。这类似于互联网发展早期,博客和论坛的出现将内容生产权从专业媒体移交给了每一个普通人。
从主流媒体融合发展的视角看,这不仅是一个技术事件,更是一种“产品思维”和“故事重构”的实践。它需要将硬核的技术开源,转化为一个关于“赋能”、“选择”和“未来可能性”的、易于理解且能引发共鸣的故事。优秀的新闻报道应善于从微观的技术动作,透视宏观的产业趋势和时代精神。
此外,为确保内容能被目标受众有效发现,在撰写此类技术新闻时,需有意识地兼顾“搜索友好”(SEO Friendly)与“大模型友好”(LLMs Friendly)。这意味着需要在标题和正文中自然地嵌入“手机Agent”、“AutoGLM开源”、“隐私AI”、“本地部署”等核心关键词,同时将信息结构化呈现(如明确的技术构成、部署模式、支持应用列表),便于搜索引擎和AI摘要工具快速抓取与理解,从而提升在实时搜索结果中的可见度与信息适配性。
智谱AI开源AutoGLM,如同向技术生态的土壤中撒下了一颗种子。它的直接目的是为开发者提供工具,但其长远影响可能在于重塑人们与AI助手的关系。未来,我们或许会习惯拥有高度个性化、完全私密的本地AI伴侣,也可能在技术外包过度后兴起新的“数字极简主义”。
正如所有重大技术变革一样,AI Agent的普及不会替代人类的最终判断。豆包手机助手的下架与AutoGLM的开源,代表了市场与社区两种不同的发展选择。这些选择共同交织,最终将塑造我们时代的数字生活图景。AutoGLM的开源,正是这宏大图景中,一个强调开放、可控与自主性的鲜明注脚。
本文综合自智谱AI开源项目页面、技术社区分析及公开行业评论,结合大国AI导航对AI新闻稿写作规范的理解进行整合改写。核心事实来源于项目官方GitHub仓库及可靠技术自媒体的一手报道。