深度分析

生成式AI没有“第二幕”,一直在“第一幕”

GN
我思锅我在
Nov 12, 2023

在AI从业者里有位备受关注的“网红”叫Shawn Wang(他推特“swyx”更为大家熟知,同时也是Smol.ai的创始人),今年7月他在专栏“Latent Space”上首次提出了“AI engineer(AI工程师)”的概念。同名播客也是今年听过最精彩的栏目之一。这个新“人群”介于传统机器学习工程师和为产品服务的全栈工程师之间,借助成熟的软件供应链和API生态,还有日益开放的模型和开发工具链,AI工程师能够快速搭建产品原型,利用现有公司的分发渠道或社媒等方式获得用户反馈和数据,从而进一步迭代模型本身,就如下图。

图片

有趣的是,10月Shawn在湾区举办了第一届“AI Engineer Summit(峰会)”,大会上一位独立开发者发表了一个引起众多共鸣的事实:“开发AI项目的过程中,我的时间80%都花在了UI设计上。”

图片

AI似乎是最简单的部分,如何把一个花了两个小时搭好的demo变成可发布在生产环境的产品,才是最难的事情,而这部分工作量与AI无关。在湾区的这段时间里,与正积极实践将AI融合到已有SaaS产品的AI工程师的交流中,也的确感受到从原型到内测,再到邀请种子客户测试的过程是复杂且反复,通常比预期都要长。红杉美国在9月发表的《生成式AI进入第二阶段》新文章里,认为AI从拿着大模型找“钉子”的方式正式进入了“第二幕(Act 2)”,真正的壁垒在“客户中,而不是在数据中”。这个观点对新进创业者来说有点残酷,如果一开始大模型就无法冲破传统的无论是面向企业场景的工作流或消费场景的网络效应的话,那么大部分创业公司现在仍面临“找钉子”的状态,而且需要快速转型。在我看来,对初创公司甚至整个生成式AI的时代,其实大家仍在第一幕或第一阶段,并没有进入所谓的“第二幕”。总的来说,还有三条鸿沟:

  • AI既可以是feature(功能),也可以是产品,目前边界是模糊的。
  • AI native对产品经理和设计提出前所未有和更高维度的要求。
  • 与其死磕融入或创造”新工作流”,或许不如直接卖“新工作”。

不久前ChatGPT集成了PDF Chat功能,网上就这个功能对一系列相似产品的冲击展开了很有意思的讨论。不少人认为很多初创公司会因此死掉,所有类GPT “wrapper/套壳”类产品都会在未来由于ChatGPT本身能力的延展而受到严重挤压。没过多久,PDF.ai的创始人Damon Chen发表了自己的看法:“我不认为ChatGPT会把很多PDF相关的小功能但又是用户急切需要的都开发出来。当然,很多比我们规模小许多或者准备做这个方向的创业者会退场,而如果有VC投资的初创公司可能会死亡,如果他们还持续烧钱。但是PDF.ai一直是bootstrap且盈利的。我们不是为了成为独角兽,几百万美金ARR对我们来说足够好了,我有1000%的信心可以做到。所以我甚至更乐观了,我们有能力在Chat PDF类的产品里做到最好。”更有意思的是,在这周第一届OpenAI Dev Day当日,Chatbase的创始人Yasser和Damon同时在公开宣称当日自家网站注册量的激增,似乎这些所谓的”AI套壳“产品并没有受到重创,反而让更多用户发现通用型GPT和单点工具的差异而选择后者。

图片

我非常赞同Damon的想法,也给创业者和独立开发者很多启发。首先,如果要验证AI是否在假设场景的价值,不要忌讳先做成“wrapper”。要快速搭建出可用的工具型产品,验证市场。经过大半年跟许多尝试想快速在OpenAI的API基础上搭建一个可用demo的工程师交流后,大家普遍发现要真正从一个外界看来是“套壳”的demo到变成可用的产品,还要跨越很多障碍,需要反复做许多实验。

图片

如上图,在AI Engineer的大会上对迁移学习中的领域自适应(Domain adaptation),就有了现在集中主流方式的探讨,想必RAG(搜索增强生成)是各类需要大模型获得更多事实性信息的应用很关注的话题。所以,即便利用了大模型的API,我们也不能笼统地认为“套壳”是一个简单的工作,至少要做到一个可用的工具,百万级用户能稳定使用的产品,比大部分没有0到1做过的人想象中要困难很多。

图片

(那些从未真正build过产品的人总说OpenAI杀死了很多AI套壳产品,而正在做产品的人一直在挣钱)其次,创业在海外拥有非常立体的环境。立体具体表现在:

  • 你可以选择不拿融资或少量融资,做一款拥有几十万甚至百万用户的小巧工具,同时有几十万甚至百万美金收入。也可以选择获得巨额融资,发展成为能服务上千家企业客户,拥有千万甚至过亿美金收入的企业级产品。
  • 前者一直保持较小团队规模,许多时候不超过10人,就能持续盈利,就像早些时候的Midjourney。后者在通常情况下,会持续扩张并保持融资和烧钱状态,目的是成为行业第一,并试图挤压第二和第三的市场份额。
  • 结果是,大多数前者很多时候并不会因为后者的持续扩张而受到严重挤压,除非真的因为本身产品的退步。后者虽然有很大想象和飞跃可能,但要承担一旦无法取得投资人预期的成绩,就需要做出巨大改变或转型,否则就要面临因为无法自身造血而彻底退场的结局。

所以,当下无需过多纠结AI将是一个现有产品的“功能”还是有机会成为一个独立的原生产品,因为在不同类型的用户和场景来看,很可能都会存在。但接下来,这对产品经理和设计师都提出了一个重要挑战——如何设计出下一代AI原生体验的产品。蒙眼狂奔了大半年的AI公司的确开始吸纳产品经理了,比如今年我了解到发展最快之一的法律科技公司Harvey.ai,不仅获得了OpenAI和红杉美国的投资,最近宣布招聘了第一位产品负责人Aatish Nayak,Nayak曾是Scale.ai的产品负责人,工作长达4年时间,也见证了传统机器学习向生成式AI演进的重要里程。同样几个月前,演示文稿生成工具Tome也吸纳了第一位AI产品经理,在湾区跟他交流的时候,他刚加入不久,跟团队高层当时讨论的核心便是,以对话为交互基础的体验到底是不是用户最能接受的方式?或者说,作为一位AI产品经理,很重要的是如何将“传统”用户旅程和AI原生的体验(目前核心是对话引导)巧妙结合,包括如何引导用户尽快上手体验AI。一个微妙的发现是:产品不再是AI初创公司刚开始的必要岗位,AI本身让创始人成为最重要的产品经理。根本原因是,生成式AI给产品设计带来的机会是让所有产品实验得以实时进行,让用户无感知地反馈甚至参与后续迭代,包括产品设计和”产品模型“。产品模型便是所有实验的核心,它是作为AI工程师或创始人,需要构建的一套完整且能自我迭代的技术栈,最终像OpenAI的联合创始人Andrej Karpathy在他的”软件3.0“理论中提出的:让产品能够获得”理解“和”生成“的能力。无论这套模型是否拥有自己的大模型,无论在领域自适应中使用了哪种方法获得精确的背景信息,无论是否通过自然语言对话来完成用户的交互,重要的是能否利用现有的任何技术,设计出一套能实时产生交互数据并能反馈于最终效果和体验的模型。

图片

这里面最成功的案例莫非Github Copilot了。记得在某期播客中,产品初期的负责人曾说过,最美妙的地方在于用户是与产品本身实时在交互,交互的过程(删掉或保留代码)和结果(代码和程序)就是对模型最直接的反馈。甚至都不需要像ChatGPT一样需要用户点击”大拇指👍🏻“来认可答案,过程就代表了一切。同时代码也是模型下一次训练最佳的数据。这是我见过最完美的产品模型,并且没有任何”刻意”设计的部分。最后,这种新兴产品模型的出现,或许就能打破“壁垒不在数据,而在客户”的残酷事实,因为公司售卖的不再是软件,不再是服务,而是一份“工作”(或一个人头)。传统软件或现有SaaS公司,今年为止最大的主题便是“Copilot”,包括微软,Adobe等,本质上是将AI“设计”成一位副驾驶,来优化或增强人类现有工作流和效率。这没有问题,这是所谓“incumbents(现存者)”在面对可能的变革性技术之下做出“本能且最佳“的反应。而从微软和Adobe的最新财报上也能看出,在”Copilot“的号召下,他们的确攫取了现在AI带来的大部分商业价值。但是,10%或20%的效率提升或成本下降很难让企业甚至大部分消费者改变现有习惯,如果能通过“理解”任务到最后“生成”所需“结果”即工作,获得五倍甚至十倍的效果,才是作为新兴公司或新一代的产品模型应该定义的场景。这可能意味着某个岗位或工作要被AI替代,但这不是某个“职能”被替代。比如另一家法律科技公司EvenUp,结合AI他开始为律师向原告客户提供在人身伤害领域的“demand package(需求材料包)”,这份工作本来需要律师整合原告医疗证明、被告保险公司的纠纷建议函、还有案件说明等各类材料,最后输出相关书面材料,现在这份工作不再(或逐步无需)律师还有助理等人参与,把他们的时间解放出来并投入到真正的咨询和审理过程中。如Benchmark的合伙人Sarah Tavel在个人专栏里所说,检验是否还有其他相似机会的标准是:这个领域内在全世界是否已经存在一个专注的外部或外包团队来支持现在由生成式AI能替代的“工作,比如会计记账、建筑测量评估、呼叫及客服中心、技术支持外包等等,这都是很好的思路。

图片

在今年YC上也能看到专注在销售、产品、法律审计、财务记账等特定职能方向上的初创公司大量涌现,他们提供的正是一份工作的全生命周期方案。"生成式AI目前最大的问题不是寻找用例、需求或渠道,而是证明价值(Proving value)。"这也是第二阶段那篇文章里的一句话,这个结论过于笼统,这几个月在湾区交流的过程中,我也明确知道一些在年初就开始积极探索的”incumbents“在下半年开始有了第一批种子客户,且反馈积极。而之所以探索的时间比市场或公司自己预期都要长,基本都在上述的原因范围内。但他们已经站在”客户“这个壁垒之上了,并且通常公司自己是第一个共创客户,如果自己员工都没有从中感受到”价值“,那么前面说的第三个问题也无从谈起。最后,我当然希望看到也坚信的是无论”Copilot“类产品,还是直接提供完整”工作“的服务,都能在各类场景中找到商业价值。对于后者,更让我兴奋的是,可能未来的商业模式和销售方式都会跟以往不同。前者的使用对象是具体到岗位上的某个工种或员工,而后者要打动的对象则是管理他们的”经理“或负责人。从商业角度来说,这一类的新兴公司刚开始可能要同时在PLG和SLG上启动,这并非不是一件好事。其次,以按照账号订阅的商业模式可能会更快过渡到与按使用量或计件方式的融合,既然最终交付的是一份文档,一张设计图甚至一次诊断服务,那么就应该按照实际”生产“数量计费,更符合商业规则。毕竟,在供给端无论训练还是推理的成本,是在肉眼可见的降低。不要忘了距离ChatGPT上线还未满一年,陆续几百家初创公司(不包括没有拿融资的bootstrapped团队和独立开发者)都在下半年入场。我们怎么能说,这就大踏步走入了“第二阶段”?最后的最后,回顾这届“举世瞩目”的OpenAI Dev Day。记得在6月,Sam Altman在一次活动中亲口说“插件(Plugin)市场还没有找到PMF”,而在这次发布会上我们看到了这个平台的进化:GPT商店,两天里就有超过千个GPT在商店里发布。尽管短时间内,我们也无法判断以更贴近苹果应用商店的形式是不是真的能让ChatGPT生态更加繁荣。推荐机制、开发者利益分成机制还有成本等问题,都亟待持续发现并解决。这还让我想起另一个变化,7月初OpenAI向Plus用户率先上线了Code Interpreter功能,辅助用户分析数据、测试代码、制作图表、解决数学问题等。然而在8月底,这个功能偷偷改名为“Advanced Data Analysis(高级数据分析)”,并且正式集成在了ChatGPT for Enterprise(企业版)中,意图不言而喻。Code Interpreter当初听起来就是个很抽象的功能性名称,而“Advanced Data Analysis”则是一个试图传递明确价值的产品,至少对他的企业用户来说。ChatGPT的每一次重大发布,似乎都像一场权游里的“Red wedding(血色婚礼)”,恐慌者甚至认为会杀死YC上“一整届”初创公司。但实际上看,ChatGPT的每一次重大更新,都在说:我们仍在“Act 1(第一幕)”!


参考资料:

  • https://docs.google.com/presentation/d/1WPULCJsbdsYLTEnAzkdVtqKRDdx4MrfMH04u5HAD4Wc/edit?pli=1#slide=id.g23143ca6436_0_244
  • https://www.sarahtavel.com/p/ai-startups-sell-work-not-software
  • https://eugeneyan.com/writing/aieng-reflections/
  • https://www.latent.space/p/ai-engineer

一 END 一