Shraman Kar 还记得那个改变一切的 Arduino 套件。那年他大概七八岁,哥哥 Shreyas 比他大一岁,两人在父母的客厅里拆开包装,第一次接触到可以用代码控制的电子元件。

从那以后,这对印度裔美国兄弟几乎所有的课余时间都泡在一起,焊接电路板、参加黑客马拉松、琢磨怎么让程序跑得更快一点…... 十年后,当他们双双考入斯坦福大学计算机科学专业时,没有人觉得意外。


图丨Shraman 和 Shreyas Kar(来源:Golpo)

意外的是接下来发生的事。2025 年初,19 岁的 Shraman 和 20 岁的 Shreyas 决定从斯坦福辍学,全职投入他们创办的公司 Golpo。在孟加拉语中,这个词意为“故事”。

“一年前,我还坐在高中最后一节课的教室里,满心期待去斯坦福。”Shraman 后来对媒体说,“如果那时有人告诉我,一年后我会辍学和哥哥一起创业,我肯定会笑出声来。”

但有些问题一旦看见,就很难假装没看见。

在斯坦福 AI 实验室的日子里,两兄弟近距离观察了生成式视频技术的飞速进展。OpenAI 的 Sora 能生成月球上跳舞的狗,Google 的 Veo 能渲染出逼真的城市街景,整个行业都在追逐更炫目、更电影化的视觉效果。

但 Shraman 和 Shreyas 注意到一个奇怪的现象:当他们想用这些工具做点“正经事”,比如制作一段解释代码库的教程,或者一个产品功能的演示视频,这些号称最先进的 AI 模型却表现得像个不及格的学生。

“它们连 T 恤上的单词都拼不对,”Shraman 说,“更别提制作一段 10 分钟的视频来讲清楚多元微积分是怎么回事。”

两兄弟意识到,整个行业都在朝着同一个方向狂奔,却忽略了一个巨大的市场:那些不需要视觉奇观、只需要把事情讲清楚的人。

企业培训部门每年花费数十亿美元制作员工入职视频。学校老师熬夜剪辑课件录屏。产品经理绞尽脑汁想把复杂的功能流程可视化。这些人不需要月球上的狗,他们需要的是一段能在 30 分钟内讲明白一个复杂话题的视频,而且最好今天就能做出来。

Golpo 就是为这些人设计的。

从技术路线上,Golpo 选择了一条与主流玩家截然不同的道路。它不追求逼真的电影画面,而是采用白板动画风格,那种你在可汗学院(Khan Academy)或 TED-Ed 上常见的手绘解说视频。这个选择乍看之下有些“土气”,但背后却充满商业上的考量。

白板动画的计算复杂度远低于扩散模型驱动的逼真视频渲染。这意味着 Golpo 可以用更低的成本生成更长的视频。根据公司披露的数据,使用 Golpo 制作一段 6 分钟的视频,成本大约等于用 Veo 生成 8 秒视频,便宜了 45 倍。而且,Golpo 支持生成最长 30 分钟的连贯视频,最新版本甚至宣称可以达到 1 小时。

但真正让 Golpo 与众不同的,是它的逐帧编辑功能。

在传统的 AI 视频生成流程中,用户输入提示词,模型吐出一段视频,中间过程是黑箱。如果结果不满意,比如第 15 秒的某个动画出了问题,你只能重新生成整段视频,祈祷这次运气好一点。这种“抽卡”式的体验让 AI 视频在专业场景下几乎无法使用,因为没有哪个企业愿意把培训内容交给运气。

Golpo 声称解决了这个问题。用户可以在生成视频后逐帧审查,对任何不满意的部分单独进行调整或重新生成,而不影响其他内容。BNVT Capital 的管理合伙人 Chris Corbishley 在投资 Golpo 时特别提到了这一点:“逐帧编辑功能是 AI 视频领域的一个重大突破。它把 AI 视频生成从一个不可预测的一次性过程,变成了一个可控、可靠的工作流程。”

这套系统的实际效果如何?从早期客户的反馈来看,似乎还不错。宾夕法尼亚州的 Garnet Valley 学区正在使用 Golpo 为学生制作多语言互动课程。安永(EY)的部分办公室用它来生成内部培训材料。一些教育科技公司,如 Educator AI 和 Voltran App,已经通过 Golpo 的 API 生成了数千个学习模块。


图丨Golpo 在 2025 年 8-9 月的 MRR(来源:Golpo)

商业模式方面,Golpo 采用订阅制,根据视频生成次数和附加功能(如逐帧编辑、互动问答)收费。公司同时提供面向开发者的 API 接口,支持将 PDF、PPT、Word 文档、CSV 表格甚至 GitHub 代码库转化为视频,并可自动生成 40 多种语言的配音和字幕。这种“文档转视频”的能力,某种程度上把 Golpo 定位成了企业知识管理领域的基础设施,而非单纯的内容创作工具。

2025 年 10 月,Golpo 宣布完成 410 万美元种子轮融资,由 BNVT Capital 领投,Y Combinator、Emergence Capital 和 Afore Capital 跟投。据报道,这轮融资严重超额认购,两位创始人不得不拒绝了更多资金。公司计划用这笔钱扩充销售团队、加大市场推广,并将目标客户从个人用户和中小企业逐步拓展至大型企业。

回到两兄弟身上。在斯坦福的短暂时光里,Shraman 在 Ehsan Adeli 教授的实验室研究 AI,还参与过哈佛医学院一个关于药物标签诱导风险的项目,这项研究后来与美国最高法院的 Hikma 诉 Vanda 案产生了关联。

Shreyas 则在李飞飞的实验室工作,同时还是美国数学奥林匹克的选手。两人还共同创办过一个名为 Community AI 的项目,据称已在 38 个国家和全美各州开展活动。

“看到我们的同龄人为了创业而辍学斯坦福,这给了我们一种许可感。”Shraman 说。在硅谷,辍学创业的叙事早已不新鲜,从比尔·盖茨到扎克伯格,这几乎是一种文化图腾。但图腾之所以成为图腾,是因为真正成功的案例屈指可数。对于 Kar 兄弟来说,410 万美元只是起点,前方的路还很长。

Golpo 的策略,归根结底就是在巨头的盲区里找机会。Sora 和 Veo 解决的是“如何让 AI 生成好看的视频”,Golpo 想解决的是“如何让视频更有效地传递信息”。这两件事听起来差不多, 做起来却是完全不同的产品路径。

Golpo 能否真正在巨头的夹缝中杀出一条路,现在下结论还为时过早。企业培训和教育市场规模庞大,但决策链条长、销售周期慢、客户对价格敏感,这些特点对早期创业公司的现金流是严峻考验。白板动画风格虽然契合解说场景,但视觉吸引力终究有限。当 Sora 和 Veo 的下一代版本变得更长、更准确、更可控时,Golpo 的差异化优势可能会被侵蚀。

但至少在此刻,两个从小一起焊电路板的兄弟,用一种几乎反潮流的方式,在 AI 视频这个拥挤的赛道上找到了自己的位置。他们的故事提醒我们:技术竞争的本质,从来不只是参数和算力的比拼,而是对用户真实需求的理解与回应。

“我们从来不想做一个让人‘哇’一声的东西,”Shreyas 说,“我们想做的,是让人真正学到点什么。”

参考资料:

1.https://www.businessinsider.com/golpo-brothers-quit-stanford-raised-4m-ai-startup-y-combinator-2025-10#-7

2.https://macaubusiness.com/brothers-19-and-20-stanford-dropouts-raise-4-1m-in-oversubscribed-seed-round-to-build-golpo-ai-and-reimagine-ai-video-generation

3.https://video.golpoai.com/

运营/排版:何晨龙