在OpenAI工作, 是一种怎样的体验?
- 2025-07-18 14:44:16
- 137
科技媒体techcrunch近日报道了一篇引人注目的博客文章,作者是三周前刚从openai离职的工程师calvinfrench-owen。这位曾参与开发openai最具前景新产品之一的工程师,在公司工作一年后选择离开,并公开分享了他在这家ai巨头内部的真实工作体验。
french-owen曾是客户数据初创公司segment的联合创始人,该公司在2020年被twilio以32亿美元收购。三周前,这位参与开发openai最具前景新产品之一的工程师选择从公司离职,随后在个人博客上分享了他在openai工作一年的深度观察。
他强调自己离开openai并非因为任何"戏剧性事件",而是希望重新回到创业者的角色。他在博客中坦言,选择离开是为了追求自己的创业梦想,而非对公司文化的不满。
这篇博客文章揭露了许多openai内部运作的细节,从疯狂的产品开发节奏到公司文化的独特之处。french-owen特别详细描述了团队如何在七周内从零开始构建并发布代码助手codex的经历,这款产品直接与cursor和anthropic的claudecode等工具竞争
他的观察既证实了外界对openai的一些认知,也纠正了不少误解。从公司的快速扩张到内部管理挑战,从产品发布的魔力时刻到外界监督的压力,french-owen的分享为外界提供了难得的内部视角。
疯狂扩张:从千人到三千人的蜕变
openai的增长速度可以用"疯狂"来形容。french-owen透露,在他工作的一年时间里,"openai从1000人增长到了3000人"。这样的扩张速度在科技行业也属罕见。
这种快速扩张并非没有原因。chatgpt被公认为史上增长最快的消费产品,今年3月公司宣布其月活跃用户已超过5亿,并且还在快速攀升。面对激烈的市场竞争,各大ai公司都在加速招聘优秀人才,openai自然不能落后。
然而,如此快速的人员增长也带来了显而易见的挑战。正如french-owen所观察到的,当公司规模迅速扩大时,原有的管理体系往往跟不上节奏,各种问题开始暴露出来。
成长的烦恼:混乱中寻找秩序
快速扩张的代价很快显现出来。french-owen直言不讳地指出:
"当你扩张得如此之快时,一切都会出问题:公司内部如何沟通、汇报结构、如何发布产品、如何管理和组织人员、招聘流程等等。"
在这种环境下,openai仍然保持着小型初创公司的文化特色——员工可以相对自由地实施自己的想法,几乎没有繁文缛节的束缚。但这种自由也带来了负面效应,多个团队经常在做重复性工作。french-owen举例说:"我见过至少六个用于队列管理或代理循环的代码库。"
技术层面的挑战同样明显。公司内部的编程水平参差不齐,既有来自谷歌的资深工程师,他们能编写支持十亿用户的代码,也有刚毕业的博士生,缺乏实际编程经验。再加上python语言的灵活性,导致公司的核心代码库"有点像个垃圾场"。french-owen坦承,系统经常出现故障或运行缓慢,不过高级工程管理层已经意识到这些问题,正在积极寻求改进方案。
创业精神:七周打造codex的奇迹
尽管面临各种挑战,openai仍然保持着浓厚的创业氛围。french-owen观察到,这家公司"似乎还没有意识到自己已经是一家巨型公司",从完全依赖slack进行沟通就能看出这一点。他将公司的文化比作早期facebook时代的meta,充满了"快速行动,打破常规"的精神。
这种创业精神的最佳体现,就是codex项目的开发过程。这款与cursor和anthropic'sclaudecode竞争的编码工具,竟然只用了七周时间就从构思走向发布。
french-owen回忆说,他的高级团队包括大约8名工程师、4名研究人员、2名设计师、2名市场推广人员和1名产品经理,整个团队几乎没怎么睡觉就完成了这个项目。
产品上线后的表现更是令人惊喜。french-owen感慨道:
"我从未见过一个产品仅仅因为出现在左侧边栏就能获得如此多的用户,但这就是chatgpt的力量。"
这种即时的用户增长,让团队的辛苦付出得到了最好的回报。
透明与保密的矛盾:在聚光灯下工作
作为全球最受关注的ai公司,openai处在一个相当特殊的位置。一方面,公司高度重视保密工作,试图控制信息泄露;另一方面,外界对公司的一举一动都极为关注。
french-owen描述了这种"玻璃屋"效应:"chatgpt是一家备受审视的公司。这导致了一种保密文化,试图控制向公众的信息泄露。"
同时,公司也密切关注社交媒体上的动态,特别是x平台。如果某个帖子在那里走红,openai会看到并可能做出回应。正如french-owen引用朋友的话:"这家公司靠twitter情绪运营。"
这种对社交媒体动态的高度关注,反映了公司对公众舆论的重视程度。这种外界压力不仅来自普通用户和媒体,还包括政府和竞争对手的密切关注。
各国政府都在监督openai的发展,竞争对手也在密切观察其动向,而openai同样在观察竞争对手。french-owen总结道:"感觉风险真的很高。"
这种矛盾的状态反映了openai面临的独特挑战——既要保持技术领先地位,又要应对公众监督;既要快速创新,又要承担相应的社会责任。
在这样的环境下工作,员工们不仅要面对技术挑战,还要适应高度透明的工作环境。
安全争议:理论与实践的平衡
外界对openai最大的争议之一就是其在ai安全方面的态度。许多ai安全专家,包括一些前openai员工,都批评过公司的安全流程。对此,french-owen提供了内部视角的澄清。
他指出,外界对openai"不够重视安全"的看法是最大的误解。虽然确实有"末日论者"在担心理论上的人类风险,但公司内部更多关注的是实际安全问题,"比如仇恨言论、滥用、操纵政治偏见、制造生物武器、自我伤害、提示注入"等具体威胁。
french-owen强调,openai并没有忽视长期潜在影响。公司有研究人员专门研究这些问题,并且清楚地意识到数亿人正在使用其大语言模型寻求从医疗建议到心理治疗的各种帮助。
未来展望:在变革中寻找方向
从french-owen的描述来看,openai正处在一个关键转折点。公司需要在保持创新速度和初创精神的同时,解决快速扩张带来的管理和技术债务问题。如何在数千名员工的规模下仍能保持高效决策和产品迭代,将是公司面临的核心挑战。
技术层面的改进已经在进行中。french-owen提到,顶级工程管理层已经意识到代码质量和系统稳定性问题,正在着手改善。但这种改进需要时间,也需要在不影响创新速度的前提下进行。
以下为ai翻译的前openai工程师calvinfrench-owen博客全文:
关于在openai工作的思考
我在三周前离开了openai。我是在2024年5月加入这家公司的。
我想分享我的思考,因为大家对openai做了很多猜测,但很少有人有在那里的第一手文化体验。
nabeelquereshi有一篇很棒的文章,叫《对palantir的反思》,他回顾了是什么让palantir如此特别。我也想做同样的事,趁记忆还新,为openai留个注记。这里没有任何商业机密,只是对当下这家最具吸引力的组织之一,在极具意义时刻,工作体验的个人观察。
首先要说的是:我离职并非因任何人事纠纷,恰好我对离开感到深深矛盾。从创立自己的组织,变成一家有三千名员工公司的职员,这种身份的转换很难。现在我渴望一次全新的开始。
我也许会被那里的工作所吸引,回去也说不定。毕竟想象一下有机会参与agi的建设是不现实的,而大语言模型无疑是近十年以来的技术创新。我很庆幸能亲眼见证一些发展,同时也参与了codex的发布。
显然,这些并非公司的官方立场——只是我个人的观察。openai是一个大机构,我只能从我的“小窗口”提供这些见闻。
首先要知道的是,openai扩展得极快。我加入时,公司刚刚超过1000人。但一年后已经超过3000人,而我在员工任职时间排名位列前30%。几乎所有领导层在2–3年前都还不是在做现在这份工作。
显然,快速扩张会带来问题:如何在公司层面沟通,组织架构如何设定,如何推进产品发布,如何管理和组织人力,以及如何招聘等。不同团队的文化情况也差别巨大:有些团队持续高压快跑,有些在监控已有项目,有些保持更稳定的节奏。没有所谓的“openai体验”,研究团队、应用团队、gtm(市场/销售)节奏都完全不同。
openai有个特殊之处——一切都通过slack(一个用于工作沟通交流的平台)运行,没有电子邮件。我整个任期或许只收到过10封邮件左右。如果你不善于整理,很容易被这些渠道淹没,但如果你管理好渠道和通知,也能做得井然有序。
openai鼓励“自下而上”,尤其在研究领域尤为明显。我刚加入时,问第一季度的路线图在哪,得到的回答是:“不存在。”(不过现在已经有了。)好主意可能来源任何人,通常我们并不清楚哪些想法会提前证明是最有成效的;公司不靠宏大的“总体计划”,进展往往迭代并在新的研究结果基础上逐步展开。
这种自下而上的文化也让openai极具“重绩效主义(meritocratic)”性质。历史上,公司里的领导者大多是因拥有好点子并能执行而晋升。许多非常优秀的人,不擅长全体大会发言或政治运作,但在openai他们一样能脱颖而出。好点子通常可以胜出。
openai的文化喜欢快速行动(biastoaction)。在类似方向有多个团队同时试点并不少见。我刚加入时曾同时见到大概3–4种codex相关原型,最后才决定上线。它们通常由少数人自发发起,不需要特别审批;当看到希望时,团队就自发聚拢。
codex负责人andrey曾说,你应该将研究员视为“迷你董事会”。在那里,你可以全盘推进自己的方向,看它能走多远。相应地,如果某个问题被认为“无意思”或者“已解决”,它可能根本不会有人去关注。
优秀的研究经理作用极大,但也都有限。他们擅长将不同方向的研究串联起来,将其汇聚到大规模模型训练里。同样,出色的产品经理也能串起价值点,将力量聚合。
我合作过的chatgpt的工程经理(em)akshay、rizzo、sulman,是我见过最cool的“客户”。他们经验非常丰富。他们多为管理型角色,主要职责是招聘优秀人才并为他们提供成功支持。
openai会瞬间调整方向。这点我们在segment(原公司)也很喜欢——有新情况就改变方向,比为了“计划”一直推进要好得多。令人惊奇的是,openai这么大的公司还保留着这种思维方式——google显然不是这样。公司决策快速,一旦决定了努力的方向,就全力奔跑。
媒体上对openai有很多抨击。我来自b2b企业背景,对此很震惊:内部还未宣布的功能,新闻稿已经播出;我告诉别人我在openai工作,往往就听到对它的既有偏见。有一些twitter账号用自动化机器人监测功能上线情况。
因此,openai非常保密。我无法详细告诉任何人我在做什么。公司内部有不同的工作空间和不同权限。营收、烧钱数据都高度保密。
openai也比你想象中更“严肃”,因为风险非常高。一方面要构建agi,需要把一切都做对;另一方面产品已有数以亿计用户在用于医疗建议、心理疗愈等敏感场景;再者,openai处在与meta、google、anthropic的激烈竞争中,甚至全球政府都密切关注这个领域。
尽管媒体有抨击,但我见的每个人都是真心“想把事情做好”。作为一家消费者导向的公司,曝光最大,也最易成为舆论焦点。
当然,不应把openai视作一个整体统一的“单一实体”。我更像把它当成“洛斯阿拉莫斯”式的组织——一群科学家在探索最前沿。巧合的是,他们也造出了历史上最火爆的消费者app。之后开始扩展到政府和企业服务。公司里人来的时间不同、所处团队不同,目标也不同——想法迥异。时间越久的人,越会带着“研究实验室”或“公益非营利”视角去看。
我最欣赏的一点是公司“说到做到”地让ai利益大众化。最先进的模型没有锁定在某个企业合同中。世界上任何人都可以访问chatgpt,哪怕未登录。可以注册api使用——大多数模型(即使是sota或专有模型)会迅速加入api服务,让创业公司、开发者都用得上。你可以猜测会有截然不同的企业版本策略,但openai并没有走那条路,值得赞赏,这一点仍是公司文化核心。
安全问题的关注比你在zvi或lesswrong(社区论坛,专注于讨论认知偏见等)里看到的还要多。公司有大量人手致力开发安全系统。但现实中更关注的是实用风险——仇恨言论滥用、政治操纵、研发生物武器、自我伤害诱导、及时药物注入等——远比理论上爆炸性风险更受关注。当然仍有人研究理论风险,那也是存在的。但在我看来,实用安全才是主流,很多安全内容不公开发表,openai其实还应该更多公开这一部分成果。
与很多公司在招聘会发大量周边不同,openai不大送周边(新员工也基本没桌牌之类)。取而代之的是会不定期发“drops”,员工可以订购库存。第一次drop店铺就被刷爆了,连shopify都挂了。有一个内部的帖子流传如何post正确的json(基于javascript语言的轻量级的数据交换格式,即javascriptobjectnotation)有效负载和规避这一点。
所有事情与gpu成本相比都太小。举例:codex中一个细小功能的gpu资源消耗,就相当于我们整个segment基础设施的费用(虽然chatgpt规模更大,但平台体量也大)。
openai是我见过的最雄心勃勃的组织。你大概会以为拥有一个全球头部app就够了,但他们志在多场战役:api产品、深度研究、硬件、编程代理、图像生成等等(还有很多未公开项目)。这里是个让点子落地弹射的平台。
公司非常关注twitter上的氛围。如果你发的一条与openai相关的tweet爆火,很可能有人会看到并重视。一位朋友曾说:“这家公司靠twitter情绪运行。”对于一个消费级公司来说,这点也没毛病。当然他们也有用户增长、留存等分析,但情绪倒也很重要。
openai里的团队比很多地方更fluid、更灵活。在codex发布时,我们需要几个chatgpt的工程师来赶进度。于是我们找chatgpt的产品经理提需求,第二天就来了两位牛人,不需要等季度计划或重新分配资源。动作快得惊人。
高层领导很活跃,好像没一位是“挂名”——gdb(gregbrockman)、sama(samaltman)、kw(wojciechzaremba)、mark、dane等经常在slack上互动。
代码与基础设施
openai使用巨大的monorepo(单一代码仓库:一种将多个项目或代码库存储在同一个版本控制系统中的策略,以便于跨项目协作和代码共享),以python为主(但也有rust服务,和少量golang用于网络代理等)。这导致代码风格多样:既有来自google资深工程师设计的大型库,也有博士刚毕业写的jupyternotebook。所有后端基本都是fastapi+pydantic构建api,而且没有统一强制的风格指南。
openai完全在azure上运行。好玩的是,能真正信任的只有三项服务:azurekubernetesservice、cosmosdb、blobstore。没有dynamo、spanner、bigquery、kinesis等aws工具,也少有自动扩展设计。iam机制也较弱,于是很多机制选择自研。
从工程人才看,有大量来自meta→openai的背景。在很多方面,openai早期就像meta:一款轰动一时的消费者应用软件、新兴的基础设施、行动快。大多基础设施人才来自meta+instagram,水准很强。
把这些东西放在一起,你会看到很多基础设施的核心部分让人想起meta,你会看到很多meta风格的设计:内部重写的tao、边缘统一身份认证等等。我相信还有很多我不知道的。
聊天功能深入系统。从chatgpt起,许多代码库都是围绕聊天消息和对话的思想构建的。这些源语内嵌得很深,不注意就会踩坑。codex虽有些变体(基于响应式api),但仍复用很多原先框架。
openai强调实干:没有架构委员会决策,通常谁做谁决定。这带来行动快的优势,但也常导致代码库里存在多个类似功能库。我见过很多库,比如队列管理或代理循环。
在缺乏工具支持的快速扩张团队里,问题也会产生:比如sa-server(后端整体)有点像垃圾场。在master上,ci崩溃的频率比您想象的要高得多。即使是并行运行的测试用例,考虑依赖关系的子集,在gpu上运行也需要大约30分钟的时间。这些并不是无法解决的问题,但它提醒我们,这类问题无处不在,而且当你快速扩展时,它们可能会变得更糟。好在内部已有大量精力投入改进。
其他经验
了解什么叫“大消费者品牌”。codex推出时我才意识到这一点。这里的kpi是“专业用户”;即便是codex,会侧重用户个人使用情况上指标,而非团队协作。对于我这种b2b背景的人来说,这种风格很不一样:你转动个开关,流量就来了。
大型模型训练机制(高层次)。这种流程从“实验小型原型”到“扩容实跑”再到“疑难调试”一直延续。实验时不仅调模型结构,也会调训练数据混合;训练变大后更像分布式系统工程,需要调边缘案例(仅在极端(最大或最小)操作参数或其他异常操作条件下发生的问题或情况)。
gpu数学基础。作为codex发布的一部分,我们必须预测负载能力需求,这是我第一次真正对gpu进行基准测试。要从延迟、token数、time-to-first-token着手往下推硬件能力,而不是简单问gpu能跑多少flops。每个模型版本的性能负载差异很大,需要重测。
在大型python代码库中协作。segment是两个微服务的组合,主要是golang和typescript,我们没有openai那样的代码广度。而在openai,我学到了很多关于如何根据贡献代码的开发人员的数量来扩展代码库的知识。你必须设置更多的护栏,比如“默认工作”、“保持主界面清洁”和“难以误用”。
发布codex
过去三个月里,我参与的最大项目是codex的发布。毫无疑问是我职业生涯中的亮点。
说下背景:在2024年11月,公司设下目标——2025年推出编程助手。到2025年2月,我们已有数个内部工具使用模型效果不错。压力来了——确实模型对编码已具生产力(你看到市场上大量生成vibe-code工具)。
我提前休完陪产假回来,帮助这次发布。一周后,我们混并了两个团队,开启加速冲刺。从写第一行代码到上线,仅用了7周。
codex冲刺是我十年职业生涯中最拼的一次。几乎每晚工作到11点或更晚。早上5:30被新生儿叫醒,7点去办公室,几个周末也在办公室。大家周周争分夺秒,很像当年yc创业节奏。
这种节奏真难形容。我从没见过哪家只花7周就从想法到完全发布并开放给所有人的产品。我们构建了一个容器运行时,对repo下载进行了优化,对自定义模型进行了微调以处理代码编辑,处理了各种git操作,引入了一个全新的界面,启用了internet访问,最终得到了一个使用起来令人愉悦的产品。那感觉,真心太爽了。
无论别人怎么说,openai依然保有那种创业精神(launchspirit)。
幸运的是,只要给对的人,就能创造奇迹。我们是一个由8名工程师,4名研究人员,2名设计师,2名市场推广和1名产品经理组成的高级团队。如果我们没有这个团队,我想我们会失败的。没有人需要太多的指导,但我们确实需要相当数量的协调。如果有机会和codex团队合作,你就知道他们有多强。
发布前夜,五个人熬夜到凌晨4点布署主单体(部署耗时数小时);然后回到办公室,参加8点的发布会和直播。打开功能开关,瞬间流量来了。我从没见过哪个产品上线后凭借侧边栏(sidebar)就有这么爆发式流量——chatgpt的力量非常显著。
在产品形态上,我们选择了全异步形式。与当时的cursor(现在也支持后端异步模式)或claudecode不同,我们希望用户把任务发给代理,就像给同事发pr(拉取请求);它会自动执行,完成后返回pr。
这是个赌注:当时模型仍“好但不完美”。它能工作几分钟,但还做不了几个小时。用户对模型能力信任度参差不齐。而且到底模型真正能力在哪也还不很明朗。
我相信从长远看,大多数编程会更像codex这种形式。但与此同时,等着看各种产品如何演化会很有趣。
codex在大型代码库中导航、任务管理能力特别突出。相比其它工具,我见过最大区别是它能并行触发多个task,然后比对他们输出。
我最近看到公共数据显示不同大模型代理制作pr的数据量。codex已生成63万个pr。53天内,对外公开的pr达7.8万个/工程师;私有pr多则更多。我人生都没做过这么有影响力的事情。
告别感言
坦白说,我最初对加入openai很担忧。不确定放弃自由、拥有老板、融入大厂是否合适。我低调告诉朋友我加入了openai,生怕不适合就尴尬了。
我希望这次经历能让我:
构建对模型训练机制及未来能力变化的直觉
与优秀的同事一起工作并学习
推出一个伟大的产品
回顾这一年,我觉得这可能是我做过的最正确的选择。难以想象哪能比这里学得更多。
如果你是创始人,觉得自己创业没前景了,该深度评估是不是放弃机会打多几次仗,要么去加入大实验室。现在是创造的黄金时刻,也是窥见未来方向的绝佳窗口。
我认为agi的竞争有三匹马:openai、anthropic和google。他们会根据各自dna(消费导向vs商业优先vs基础架构和数据驱动)走出不同路径。在其中工作将是开眼界。
感谢leah在深夜支持我,承担大部分育儿任务。感谢pw、gdb、rizzo给我机会。感谢sateammates教会我很多:andrew,anup,bill,kwaz,ming,simon,tony,val。感谢codex核心团队:albin,ae,andrey,bryan,channing,davidk,gabe,gladstone,hanson,joey,josh,katy,kevint,max,sabrina,sq,tibo,tz,will。这趟旅程我永生难忘。
- 上一篇:男子借万以贷养贷担保费高达万
- 下一篇:特朗普早就看不惯加州州长