既要、又要、还要的 AI 管理难题。
文丨 陈佳惠 管艺雯 贺乾明 程曼祺
编辑丨程曼祺
林俊旸提交离职引发一系列后续:阿里数名管理层连夜紧急讨论;第二天(3 月 4 日) Qwen 召开全员会;昨天(3 月 5 日)上午,吴泳铭给 Qwen 全员发邮件,称已批准林俊旸辞职;昨天下午,林俊旸回到阿里北京办公区,给部分团队成员做 1on1。
《晚点 LatePost》独家了解到,3 月 4 日凌晨,阿里管理层主要讨论了两个内容:怎么解决问题?林俊旸的离开会给公司带来哪些影响?
他们达成了共识:这样的行为不可接受,公司组织制度必须得到维护。
据我们了解,林俊旸发出离职状态时,阿里并未回应他的离职请求。
一位阿里人士称,“制度是不能碰的,而他在挑战公司制度。” 这里的 “制度” 指 —— 在阿里,所有人都是公司员工,升和降都由公司决定,如果不满可以正常沟通,但不能没沟通就到社交媒体公开发声,不能开这样的先例。
林俊旸在阿里工作了 7 年,这是他的第一份工作。林俊旸意料之外的骤然离职,背后是每一个深度参与 AI 竞争的大公司都会面临的管理难题。
一边是推动 AI 发展的开拓精神、超级个体和极致效率,一边是大公司的整体目标和对业务协同的强调,二者之间的张力在此时的阿里集中爆发。
林俊旸提交离职的 48 小时,对阿里、对他本人都是一个意外
“无颜再带领大家。” 林俊旸 3 月 3 日下午在有 100 多名 Qwen 成员的钉钉群中发出消息。
这之前不到 24 小时,林俊旸还在继续他作为 Qwen 负责人和 “最强开源布道师” 的日常活动:加班加点发布 Qwen 的新模型和技术报告,凌晨在社交媒体上推广刚上线的 Qwen 3.5 小模型系列,转发马斯克的相关评论。
而 3 月 3 日下午的一场沟通改变了林俊旸的轨迹。突如其来的强烈离职意愿,可能对他本人来说都是一个意外。
据了解,当天下午,阿里云 CTO 周靖人和林俊旸连线开会,向他传达了可能发生的 Qwen 的调整。每年 3 月底,阿里传统上会做绩效年度考核和架构调整,这场沟通很可能是为 1 个月后的变化做铺垫。
当时提到的调整方向是将 Qwen 团队重组,从涵盖不同训练流程和模态的垂直整合体系,变成预训练、后训练、文本、图像、语音等一个个分开的水平团队。
“下午开会的时候,林俊旸的情绪已经很激烈。” 接近此事的人士称。
当天下午,还发生了另一件事。3 月 3 日刚好是 Qwen 原后训练负责人郁博文的最后一个工作日,在 HR 召集的后训练团队 “欢送会” 上,该团队第一次得知,2026 年 1 月新加入阿里的周浩将参与管理 Qwen 的后训练成员。周浩此前是 DeepMind 高级资深研究员,曾领导针对 Gemini 3.0 的多步骤强化学习。
据我们了解,林俊旸在本周之前并不知晓周浩已入职,周浩汇报给阿里云 CTO 和通义实验室负责人周靖人。
阿里相关人士称,之所以周浩入职一事之前没有同步 Qwen 团队,是因为引入海外人才有一定敏感性,保密等级较高。
当天下午稍晚,在周靖人和林俊旸的沟通后不久,林俊旸在 Qwen 钉钉群里发出了 “无颜再带领大家” 的信息,表示自己只能离开了。
到这一步,整个事件还在阿里公司内部。而 3 月 4 日凌晨林俊旸的那条社交媒体动态则直接向外界宣告了他的离职意向。
13 小时后,3 月 4 日下午 1 点。阿里召开 Qwen 团队的全员会,阿里 CEO 吴泳铭、CPO 蒋芳、阿里云 CTO 周靖人出席。在杭州的团队集中在线下参会,北京和上海团队接入视频会议参会。
“这个会本来也是要和大家开的,只不过现在稍提前了一些。” 阿里 CEO 吴泳铭说。全员会持续约 1 个半小时,吴泳铭在会议开头重申了在集团战略上会全力支持 AI,此后大部分时间留给团队提问、答疑。
Qwen 团队成员关心的核心问题有:
- 林俊旸的离开是否有转圜余地?
蒋芳说:集团会挽留林俊旸。在数个 Qwen 成员表达了林俊旸的重要性后,蒋芳又回应,不能神化个人,不能不计代价和不理性地挽留。她随后问团队:那么大家期待以什么代价来挽留俊旸呢?没有人回答这个问题。
- 团队是否会调整?周浩加入为什么没有提前告诉大家?
周靖人回应,周浩加入并不是要替代谁。周浩加入这件事没有提前告诉大家,是因为当时团队在忙着训练 Qwen 3.5,所以暂时没沟通。
- 关于 Qwen 团队缺少资源
吴泳铭说,他是中国最激进寻找算力的 CEO,可能一些问题没有及时反馈到他这里。
团队也反映,Qwen 3 的 Coding 能力欠佳,与没有得到足够的训练环境等资源有关,这需要 CPU 资源和 Infra 人才支持。周靖人回应,资源问题和 Infra 支持不到位有 “历史原因”。
全员会上,吴泳铭还承诺,之后每半个月到 1 个月,他会和 Qwen 团队或 Qwen 核心人员开会,及时了解需求或问题。蒋芳说大家可以直接在钉钉上私信吴泳铭、蒋芳、周靖人,反馈问题。
当天下午 2 点,林俊旸发布朋友圈:“qwen 的兄弟们,按照原来安排继续干,没问题的”。
全员会第二天,3 月 5 日上午。吴泳铭给 Qwen 全员发送邮件,称已接受林俊旸离职。邮件还提及,阿里会继续坚持开源模型策略;周靖人会继续带领通义实验室;吴泳铭、周靖人和阿里集团 CTO 吴泽明(范禹)会共同协调集团资源,支持基础模型建设。
林俊旸的离职引起一连串外部反应。Google DeepMind 的开发者体验负责人在社交媒体上邀请 Qwen 成员加入:“如果你想找到构建好模型和贡献开源社区的新家”。
Omar Sanseviero 曾任职于 Hugging Face,现任 Google DeepMind 开发者体验主管。
有其它公司高招人员在林俊旸宣布离职的那晚整夜没睡,挨个给认识的 Qwen 团队成员发工作邀请;有猎头想联系林俊旸,列出了具体哪些公司有岗位找他。
不少投资人在寻求 Qwen 核心人员的联系方式,他们认为可能有更多离职发生,可能有人会创业。
当小团队开始承担更大的组织目标
2023 年以来,AI 成为阿里的战略重点。新上任的掌舵者吴泳铭当年 11 月第一次作为 CEO 参加财报会,提了 40 次 AI。阿里集团内一度有多个团队尝试 AI,如淘天就曾有 20 个 AI 团队。2022 年底到 2023 年初,达摩院多数团队重组为通义实验室,也是要整合各种力量来做 AI。
在这个大环境下,Qwen 是一个相对独立的小团队,它脱胎于这轮 AI 热潮之前的达摩院智能计算实验室的 M6 项目。当时周靖人是智能计算实验室负责人,而 2019 年入职阿里的林俊旸是 21 年 3 月发布的大模型 M6 的一作。
到 2023 年初,同在通义实验室的 M6 团队和 NLP 团队一度在赛马做大模型,起步时都有约 500~1000 张 GPU 算力资源。同年年中,通义实验室以 M6 团队为主聚集了人员和算力资源,Qwen 在此次变动前的核心成员——林俊旸、刘大一恒、郁博文、惠彬原等人在此时组队,其中刘大一恒、郁博文、惠彬原原本在 NLP 团队。
周靖人作为通义实验室整体负责人,给了 Qwen 团队相对独立的空间。多位曾在 Qwen 工作的人士告诉我们,“感谢靖人给我们充分发挥的空间”。
同时,吴泳铭和周靖人都支持 Qwen 团队的开源想法。这是一个重大的战略决策,必须得到自上而下的认可。
Qwen 目前有 100 多名成员,整个通义实验室有 600 多人。字节模型研发团队 Seed 目前则有超过 1500 人。
相对独立的另一面是,整个阿里云和阿里集团的 AI 布局并没有完全押在自研基础模型上。阿里当时的思路是做 AI 基础设施:提供 AI 云、MaaS(Model as a Service)服务,建设魔搭模型社区等生态。
阿里投资了中国多家大模型公司,为它们提供算力。这一定程度引发了内部团队的不满:算力如此珍贵,为什么还要大量供应给外部?
字节跳动则在 2024 年年中明确决定,不对外投资任何大模型创业公司,集中资源到 Seed 团队,自研大模型豆包,并支持字节自己的豆包等 AI 产品。
资源相对有限,但空间足够时,团队能力和闯劲成为关键变量。Qwen 的两任负责人周畅、林俊旸都有 “自驱的高强度工作状态”。
2024 年以来,阿里开源的 Qwen 系列大模型在全球的影响力持续提升。当年 10 月,其衍生模型数量达到 8 万多个,超过更早开源的 Meta Llama 系列。
Qwen 以丰富的尺寸受到中小创业公司和研究机构的喜爱,不少知名公司,如 Cursor 等都会基于 Qwen 系列模型做微调和后训练;Qwen 的多模态开源系列也是一众中国具身智能公司选择的基模。DeepSeek、字节跳动也会在部分研究项目中使用 Qwen 的小尺寸模型。
周靖人在 2025 年成为阿里合伙人,进入阿里最高集体决策机构;林俊旸在 25 年成为阿里最年轻的 P10 级高管。阿里管理层认为,通义实验室努力保证了 Qwen 模型的领先地位,“这非常不容易”。
但也是 2025 年,有了更大影响力的 Qwen 开始承载更多期待,小团队原本的目标和整个阿里集团的 AI 战略开始分叉。
阿里集团看中 AI 云的商业化增长和 25 年下半年逐渐白热化的 AI 超级 App 卡位战。
2024 到 2025 年,阿里云的收入增速不断提升,但和基模的协同并不直接:增长主要来自阿里投资的多家大模型公司的算力采购,和更多行业 AI 应用带动的云服务消耗。
2025 年 9 月,阿里集团决定重点推进千问 App,这需要基础模型团队与应用团队更紧密地协作。我们了解到,Qwen 团队并没有把支持千问 App 放在高优先级。而负责千问 App 的智能信息事业群也有自己的模型研究团队。有阿里人士认为,Qwen 团队对云的其它业务、对千问 App 的支持不够。
Qwen 则希望持续训练出更强、更高效的模型。
Qwen 扩展了语言之外的更多模态,以顺应原生混合多模态的技术趋势,陆续发布 Qwen-image、Qwen-audio。这与同属通义实验室的通义万相(主要做多模态生成)和百聆(主要做语音模型)有重合。
从 25 年年中起,Qwen 也开始招聘一些 Infra 人才。有 Qwen 团队成员称,当时 Qwen 在训练新一代核心模型的大尺寸版本时发现,阿里云 PAI 团队已很难提供足够的 Infra 支持。这让为阿里云带来收入的 PAI 团队处境尴尬,如果内部业务都不用他们,在竞争激烈的市场中会更难自证实力。
同期,2025 年至今发布的 Qwen 3 系列和 Qwen 3.5 系列的训练过程都遇到波折,部分核心能力指标不突出。
原本计划在节前发布的 Qwen 3.5 Max(每一代 Qwen 中尺寸最大的旗舰版)没能准备就绪。Qwen 在除夕当天开源的 Qwen 3.5 Plus 模型,也被一位阿里高层视作 “半成品”。
小团队的特立独行和对技术领先的追求,集团期待更多战略成果,竞争升级的外部环境,叠加模型训练眼下的波折,出乎意料的人事震荡在此刻掀起风暴。
林俊旸其人:一个 “非典型” 大模型团队负责人
在中国几家大公司基础模型团队的负责人里,林俊旸是特别的存在。他并非典型意义上的 “科班” 出身:本科是文科,硕士转入更偏技术的交叉学科方向。
林俊旸的硕士导师、北京大学外国语学院副教授苏祺曾评价他:“人文社科的学生也能从事,而且很好地从事跨学科研究工作。”
林俊旸生于 1993 年,本科就读于国际关系学院英语文学专业,并同时学习日语、俄语、德语和法语,被同学称为 “多语言学霸”。
本科期间,他担任国关的模拟联合国大会负责人。在当年的校园媒体访谈中,他说自己带社团的核心是,不论社员负责什么工作,“idea 才最重要”。他还把紧凑的活动场地设计视为特色,认为这有利于模联各团队的沟通,既能提高协作效率,也能减少不必要的劳力。
本科毕业后,林俊旸考入北京大学外国语学院,师从苏祺和北京大学计算语言学研究所副教授孙栩,攻读计算语言学硕士。读研期间,他总共发表了 11 篇第一作者或共同一作论文,还担任一个研究项目的负责人。
计算语言学是用可计算的方法,建模语言结构和语言使用方式。它要求研究者理解语言本身,又要求他们掌握算法、数据和建模能力。到了大语言模型时代,这个方向成为重要的研究人才来源之一。我们在 2025 年初分析 DeepSeek 数十位研究人员履历时就发现,其中有 8 位出自北大计算语言学研究所。
2019 年硕士毕业后,林俊旸加入成立仅两年的阿里达摩院,担任高级算法工程师,研究自然语言处理。那时大模型技术路线正加速成形:Transformer 架构提出已两年,OpenAI 的 GPT 系列模型开始展现超出预期的能力。
一年后,达摩院内有两个团队开始研究大语言模型。一个是由资深自然语言处理专家黄非负责的 AliceMind 项目;另一个则是由杨红霞、周畅、林俊旸等人参与的 M6 项目,向周靖人汇报。最终,M6 的性能更强,也成为通义实验室 Qwen 系列模型的基础。
杨红霞在 2022 年从阿里达摩院离职。通义实验室成立后,林俊旸负责 Qwen 模型开源工作,向周畅汇报。也正是在这个阶段,他逐渐从一个更偏研究和内部协作的角色,走向更容易被外部看见的位置。他开始频繁活跃在海内外社交媒体,推广 Qwen 系列模型,解释模型更新,回应开发者反馈,推动社区认知。
随着 Qwen 系列模型持续进步、影响力不断扩大,以及周畅离职后他接替更核心的位置,林俊旸逐渐成了 Qwen 在技术社区鲜活和有说服力的推广者。
“他不是那种苦大仇深的负责人。” 一位接近林俊旸的人士说。多位不同公司的大模型研究者,都用这个词向我们形容过自己的部门负责人。
上述人士告诉我们,在条件有限的情况下,林俊旸认为首要任务不是追求完美,而是确保事情能落地,先把结果做出来,再谈优化和迭代。
他并不认为负责人必须精通软件编写的每个细节;在他看来,更重要的是理解底层的 “物理逻辑”——知道事情为什么这样运转,知道如何抓大放小。
正因为如此,林俊旸更倾向于设定明确的 “靶子”,让一个团队尽可能把事情都做了,尽可能减少不确定性,“不能让团队 ‘陷入虚无’。”
既要、又要、还要的 AI 管理难题
公司强调组织、流程、集体目标、指哪儿打哪儿的战略执行力;而 AI 一线研究员是这个时代最聪明、自驱、有创造力和野心的个体。
公司要在多大程度上包容个人意志,AI 研发团队是否要自建全栈闭环,以研发为核心的团队要如何支持扑面而来的商业化阶段和产品竞争,这些难解的题目没有标准答案。
OpenAI 元老杰瑞·特沃雷克(Jerry Tworek)近期离职后说:OpenAI 已没有做高风险研究的空间,“所有主要 AI 公司都面临多重压力,既要驱动用户增长,又要承担昂贵的 GPU 成本,还要拼模型的第一。”
风波之后,有管理层后来在内部提议,公司以后要加强管控高管们的个人社交媒体账号,减少 “造神” 行为。一位接近阿里的人士对我们说,“原来是开放的时代,但管理层发现,真出事了怎么办?”
“组织要往前走,事情要发展,不能做调整了么?经历一些调整,就用这种方式,放在任何地方都说不过去吧。” 一位阿里人士称。
极端情况下,阿里亮出了底线:个人意志要服从组织需求。
曾经,林俊旸拥有的是阿里为其主动留出的表达空间,带有 “阿里最年轻 P10” 的标签,他在境内外社交媒体上频频发声,既开拓了 Qwen 基础模型的开源影响力,又能作为已成立 27 年的阿里年轻化的最佳代表。阿里在研发人才心中的印象为之一变。这个组织也为开源精神和技术理想留出了足够的弹性。
而林俊旸从提出离职到在公开社交媒体上发声只有半天,没有给阿里管理层继续沟通和反应的空间。他对 Qwen 要自建闭环的想法,他希望集中有限资源做模型,Qwen 团队暂难支持 AI 产品的事实,也被阿里其它团队认为合作意识不足。
如果没有这份执念和对核心目标的聚焦,可能 Qwen 一开始就难以自证;但当团队更大,阿里集团需要基础模型团队承担更多角色,AI 竞争也进入新阶段后,Qwen 团队不得不重校目标,调整与公司、与其它团队的关系。
这是公司组织和年轻的 AI 技术负责人共同面临的成长课题。
以往,阿里常常处于过于严厉和过于宽松的两端。一位接近阿里技术高层的人士说:“Qwen 不能算阿里的边缘业务,而是早期就得到重点投入,甚至优先级高于部分阿里云业务。后期 Qwen 忽视业务,同时展示出 ‘自建一切’ 的倾向,恰恰是因为早期重点投入带来的特权意识和大厂政治。如果前期就更加平衡纯研究、工程和业务之间的协作,事不至此。”
某种程度上,这几天的剧烈冲突剧目,是阿里自己按下的启动键。一直以来,对一家大公司,可控永远是红线。
题图来源:Severance