核心摘要:OpenAI近日发布工程博客,详细披露其仅用4名工程师和AI编程助手Codex,在短短28天内从零开发出Sora的安卓版应用。该应用上线首日即登顶Google Play下载榜,24小时内用户生成视频超100万个,且崩溃率低至0.1%。这一案例揭示了AI辅助开发的新范式:人类工程师专注于系统架构与核心决策,而Codex则像“资深新员工”一样,在清晰的指导下高效完成大量编码、测试与跨平台“翻译”工作,将开发瓶颈从“写代码”转移至“做决策与集成”。
面对Sora在iOS发布后用户量激增,而安卓端仅有内部原型和大量预注册用户的压力,OpenAI团队没有选择增加人手,而是组建了一个仅4人的精干工程团队,并为每位成员配备Codex。他们深刻理解到,在紧迫项目中盲目增加人力反而会因沟通成本剧增而拖慢进度。团队的目标不是尽快做出“能跑的东西”,而是做出“符合期望方式”的高质量产品。
为此,团队首先亲自完成了应用的核心系统设计与关键决策,包括确定架构、模块化、依赖注入、导航以及认证和基础网络流程。他们端到端手写了几个代表性功能,作为Codex学习的“范例”和“沙箱”。这种“先打好地基”的策略,为后续85%由Codex生成的代码奠定了稳健、可维护的基础,避免了大规模返工。
团队将Codex定位为一名需要指导但能力强大的新队友。他们总结了Codex的强项与需要人类弥补的短板:
最关键的工作流程变革是引入了 “计划循环” 。对于非平凡任务,团队不再直接让Codex编码,而是先让它阅读相关代码并总结功能原理,人类随后纠正其理解,共同创建一个包含改动文件、新状态和逻辑流的详细实施计划。这个计划如同小型设计文档,让Codex可以据此一步步执行,甚至允许其在上下文窗口受限时将计划保存到文件中,便于跨会话持续工作。这使得团队可以放心让Codex长时间“无人值守”运行,并将代码审查效率提升至对照计划检查实现,而非漫无目的地阅读代码差异。
在项目高峰期,团队经常同时运行多个Codex会话处理不同功能模块,感觉“更像在管理一个团队”。每个会话都像一名工程师,需要定期汇报进展、接受反馈和审查。这种模式将开发的瓶颈从“手动编写代码”转移到了“做出决策、提供反馈和集成改动”上,印证了Brooks定律在AI时代的新体现:增加“手”(即使是AI)同样会带来协调开销。工程师的角色因此从执行者转变为架构师、审查者和集成者,专注于更高杠杆率的工作。
团队拥有iOS版Sora作为现成的参考,他们探索出一种全新的跨平台开发模式:通过Codex进行“翻译”而非构建共享抽象层。他们将iOS、后端和安卓代码库置于同一环境中,指示Codex阅读iOS的模型与端点实现,然后基于安卓现有架构,提出并实现语义等价的Kotlin代码。由于底层业务逻辑相同,Codex能出色地完成这种跨语言翻译,避免了为不同平台重复实现逻辑的成本。这再次强调了上下文对于Codex至关重要——当它同时理解功能在源平台如何工作以及目标平台的结构时,才能发挥最佳效果。
通过这个项目,使用Codex从实验变成了团队默认的开发循环。审查AI的输出如同审查人类队友的代码。这清晰地表明,AI辅助开发并未降低对工程严谨性的需求,反而提升了其重要性。AI擅长快速实现从A到B,但无法理解系统的真实约束、架构的最佳方式以及对未来发展的规划。
未来的软件工程师的核心能力将演变为:深度的系统理解能力,以及在长时间跨度内与AI高效协作的能力。Codex等工具将工程师从大量样板代码和重复劳动中解放出来,让他们能更专注于软件工程中最有意义的部分——构建引人注目的产品、设计可扩展的系统以及解决复杂问题。随着模型持续进步,AI将成为构建过程中不可或缺的一部分,开启软件工程的新篇章。
文章来源:根据OpenAI官方工程博客《How we used Codex to build Sora for Android in 28 days》(作者 Patrick Hum & RJ Marsan)及相关技术社区讨论综合撰写。