✌️生成式人工智能的第二幕 | by 红杉资本

Ryan

值得译读|2023-9-26|最后更新: 2024-1-3|
summary
category
tags
date
原文地址:
使用 OpenAI GPT-3.5 翻译
一年前,我们发表了一个假设,认为生成式人工智能将成为技术领域一次深刻的平台变革。随后,风暴席卷而来。
长期以来,科学家、历史学家和经济学家一直在研究创造创新寒武纪大爆发的最佳条件。在生成式人工智能领域,我们创造了一个现代奇迹,这是我们这一代人的太空竞赛。
这一时刻已经酝酿了几十年。六十年的摩尔定律为我们提供了处理埃菲尔普斯数据的计算能力。四十年的互联网(由 COVID 加速)为我们提供了价值数万亿代币的训练数据。二十年的移动计算和云计算让每个人都拥有了掌上超级计算机。换句话说,数十年的技术进步积累为生成式人工智能的腾飞创造了必要条件。
ChatGPT 的崛起是点燃导火索的火花,它释放出的创新密度和热情是我们多年来从未见过的--也许是自互联网诞生之初以来从未见过的。这种令人窒息的兴奋在 "大脑谷 "尤为明显,在那里,人工智能研究人员达到了摇滚明星的地位,每个周末都有新的自主代理和陪伴聊天机器人出现在黑客之家。人工智能研究人员从众所周知的 "车库里的黑客 "转变为指挥数十亿美元计算的特种部队。arXiv 印刷机已经变得如此多产,以至于研究人员开玩笑地呼吁暂停发表新论文,以便赶上进度。
但很快,对人工智能的兴奋就变成了近乎歇斯底里。突然之间,每家公司都成了 "人工智能副驾驶"。我们的收件箱里塞满了 "AI Salesforce"、"AI Adobe "和 "AI Instagram "的无差别推销。1亿美元的产品前种子轮融资又回来了。我们发现自己陷入了难以为继的筹资、人才争夺战和 GPU 采购狂潮。
果然,裂缝开始显现。艺术家、作家和歌手对机器生成 IP 的合法性提出了质疑。关于道德、监管和迫在眉睫的超级智能的争论席卷华盛顿。也许最令人担忧的是,硅谷内部开始流传一种说法,即人工智能生成实际上并无用处。产品远未达到预期,糟糕的用户留存率就证明了这一点。最终用户对许多应用的需求开始趋于平稳。这是否又是一个虚无缥缈的周期?
人工智能的 "不满之夏 "让批评家们高兴得手舞足蹈,这不禁让人想起互联网的早期,1998 年,一位著名的经济学家宣称:"到 2005 年,互联网对经济的影响显然不会超过传真机。
别误会--尽管喧嚣、歇斯底里、充满不确定性和不满情绪,生成式人工智能的起步已经比 SaaS 更为成功,仅初创企业的收入就超过了 10 亿美元(SaaS 市场花了数年而非数月才达到同样的规模)。一些应用程序已经家喻户晓: ChatGPT 成为增长最快的应用,在学生和开发者中具有特别强的产品-市场契合度;Midjourney 成为我们的集体创作缪斯,据说仅靠 11 人的团队就实现了数亿美元的收入;Character 普及了人工智能娱乐和陪伴,创造了我们最渴望的消费者 "社交 "应用--用户在应用内平均花费两小时。
尽管如此,这些早期成功的迹象并不能改变这样一个现实:很多人工智能公司根本没有产品与市场的契合点,也没有可持续的竞争优势,人工智能生态系统的整体繁荣是不可持续的。
现在尘埃落定,我们认为这是一个合适的时机来放大并反思生成式人工智能--我们今天所处的位置,以及我们可能的方向。

第二幕

生成式人工智能走出大门的第一年--"第一幕"--来自于技术。我们发现了一个新的 "锤子"--基础模型,并推出了一大波新奇的应用程序,轻便地展示了很酷的新技术。
现在,我们相信市场正在进入 "第二阶段"--即从客户-后方开始。第二幕将从头到尾解决人类的问题。这些应用在本质上不同于第一代应用。它们倾向于使用基础模型作为更全面解决方案的一部分,而不是整个解决方案。它们引入了新的编辑界面,使工作流程更有粘性,输出效果更好。它们通常是多模式的。
市场已经开始从 "第一幕 "向 "第二幕 "过渡。进入 "第二阶段 "的公司包括:Harvey,该公司正在为精英律师事务所定制法律硕士课程;Glean,该公司正在抓取我们的工作空间并编制索引,以使生成式人工智能与工作更加相关;以及CharacterAva,这两家公司正在创建数字伴侣。

市场地图

我们更新的生成式人工智能市场地图如下。
与去年的地图不同,我们选择按使用案例而非模型模式来组织本地图。这反映了市场的两个重要趋势: 生成式人工智能从技术锤炼到实际用例和价值的演变,以及生成式人工智能应用日益多模化的特点。
notion image
此外,我们还包含了一个新的 LLM 开发人员堆栈,它反映了公司在生产中构建生成式人工智能应用时所求助的计算和工具供应商。
notion image
 

重新审视我们的论文

我们最初的论文提出了生成式人工智能市场机会的论点,并对市场将如何发展提出了假设。我们做得怎么样?
以下是我们的错误之处:
  1. *事情发生得很快。**去年,我们预计需要近十年的时间才能实现内部代码生成、好莱坞品质的视频或听起来不那么机械的人类语音。但只要听一听 Eleven Labs 在 TikTok 或 Runway 的人工智能电影节上的声音,就会清楚地意识到未来已经飞速到来。就连 3D 模型、游戏和音乐也在*快地变得优秀起来。
  1. *瓶颈在供应方。**我们没有预料到最终用户的需求会在多大程度上超过 GPU 的供应。许多公司发展的瓶颈很快就不是客户需求,而是如何获得 Nvidia 的最新 GPU。漫长的等待时间成为常态,于是出现了一种简单的商业模式:支付订阅费,就可以不用排队,获得更好的型号。
  1. 垂直分离尚未发生。我们仍然相信,"应用层 "公司和基础模型提供商之间会出现分离,模型公司专注于规模和研究,应用层公司专注于产品和用户界面。实际上,这种分离还没有完全实现。事实上,最成功的面向用户的应用程序都是垂直整合的。
  1. *残酷的竞争环境和现有公司的迅速反应。**去年,竞争环境中出现了一些过度拥挤的类别(尤其是图像生成和文案写作),但总的来说,市场还是一片空白。如今,竞争格局的许多角落都是竞争大于机遇。从谷歌的 Duet 和 Bard 到 Adobe 的 Firefly,现有公司的迅速反应--以及现有公司最终愿意 "冒险"--放大了竞争的热度。即使是在基础模型层,我们也看到客户将其基础设施设置为与不同供应商无关。
  1. *护城河在于客户,而非数据。**我们曾预测,最好的人工智能公司可以通过数据飞轮产生可持续的竞争优势:更多的使用→更多的数据→更好的模型→更多的使用。虽然这在某种程度上仍是正确的,尤其是在拥有非常专业和难以获取的数据的领域,但 "数据护城河 "的基础并不稳固:应用公司生成的数据并不能形成不可逾越的护城河,而下一代基础模型很可能会抹去初创公司生成的任何数据护城河。相反,工作流程用户网络似乎正在创造更持久的竞争优势。
以下是我们的正确观点:
  1. 突然之间,每个开发者都在开发生成式人工智能应用,每个企业买家都在要求这种应用。市场甚至保留了 "生成式人工智能 "的名称。人才流入市场,风险资本也纷纷涌入。生成式人工智能甚至在病毒视频中成为一种流行文化现象,如 "哈利-波特-巴伦西亚加"(Harry Potter Balenciaga),或 Ghostwriter 模仿德雷克(Drake)的歌曲 "Heart on My Sleeve"(我袖子上的心),这首歌已成为排行榜上的热门歌曲。
  1. 第一批杀手级应用出现。有资料显示,ChatGPT 是最快达到 1 亿 MAU 的应用,而且只用了 6 周时间就实现了这一目标。相比之下,Instagram 用了 2.5 年,WhatsApp 用了 3.5 年,YouTube 和 Facebook 用了 4 年才达到这一用户需求水平。但 ChatGPT 并不是一个孤立的现象。Character AI 的深度参与(平均会话时间为 2 小时)、Github Copilot 的生产力优势(效率提高 55%)以及 Midjourney 的货币化路径(数亿美元的收入)都表明,第一批杀手级应用已经到来。
  1. 开发者是关键。Stripe或Unity等开发者优先型公司的核心洞察之一就是,开发者访问开辟了你无法想象的用例。在过去的几个季度里,从音乐生成社区到人工智能媒人,再到人工智能客户支持代理,我们已经接触到了各种各样的产品。
  1. 人工智能应用的最初版本大多是自动完成和初稿,但现在这些形式因素正变得越来越复杂。Midjourney 引入的摄像头平移和填充功能很好地说明了生成式人工智能用户体验是如何变得更加丰富的。从整体上看,形式因素正在从个人生产力向系统级生产力发展,从人类在回路中向以执行为导向的代理系统发展。
  1. 版权、伦理和生存恐惧。关于这些热门话题的争论此起彼伏。艺术家、作家和音乐家们意见不一,一些创作者对他人利用衍生作品牟利义愤填膺,一些创作者则对新的人工智能现实表示欢迎(我想到了格兰姆斯的利润分享主张和詹姆斯-巴克豪斯对成为创意基因组一部分的乐观态度)。没有一家初创公司愿意成为 Napster 或 Limewire,而不是最终的 Spotify(ht/Jason Boehmig)。规则不透明: 日本宣布用于训练人工智能的内容没有知识产权,而欧洲则提出了严厉的监管措施。
 

我们现在处于什么位置?生成式人工智能的价值问题

生成式人工智能并不缺乏应用案例或客户需求。用户渴望人工智能能让他们的工作变得更轻松,让他们的工作产品变得更好,这就是为什么他们以创纪录的速度涌向应用程序(尽管缺乏自然分布)。
notion image
但人们会留下来吗?其实不然。下图比较了人工智能优先应用与现有公司的移动应用第 1 个月留存率。
notion image
用户参与度也乏善可陈。一些优秀的消费类公司的 DAU/MAU 为 60-65%;WhatsApp 的 DAU/MAU 为 85%。相比之下,生成式人工智能应用程序的中位数仅为 14%("性格 "和 "人工智能陪伴 "类别是个明显的例外)。这意味着,用户还没有发现生成式人工智能产品的足够价值,以至于每天都要使用它们。
notion image
简而言之,生成式人工智能最大的问题不是寻找用例、需求或分销,而是证明价值。正如我们的同事大卫-卡恩(David Cahn)所写的那样,"2000 亿美元的问题 是:你打算用这些基础设施来做什么?你打算用这些基础设施做什么?它将如何改变人们的生活?要想建立持久的企业,就必须解决留住客户的问题,并为客户创造足够深的价值,使他们坚持使用并成为每日活跃用户。
让我们不要绝望。生成式人工智能仍处于 "尴尬的青少年时期"。当产品未能达到预期时,失败往往是可靠的、可重复的和可修复的。我们任重而道远。
 

第二幕:共享剧本

创始人正着手进行提示工程、微调和数据集整理等艰苦工作,以使他们的人工智能产品更好。他们一砖一瓦地将华而不实的演示打造成完整的产品体验。与此同时,基础模型底层继续充斥着研究和创新。
随着企业摸索出通往持久价值的道路,一本共享的游戏手册正在形成。现在,我们拥有了让模型发挥作用的共享技术,以及将塑造生成式人工智能第二幕的新兴用户界面范例。
  • 模型开发堆栈
  • 思维链、思维树和反思等新兴推理技术正在提高模型执行更丰富、更复杂推理任务的能力,缩小客户期望与模型能力之间的差距。开发人员正在使用 Langchain 等框架来调用和调试更复杂的多链序列。
  • RLHF和微调等迁移学习技术正变得越来越容易获得,特别是最近GPT-3.5和Llama-2的微调技术的推出,这意味着公司可以根据其特定领域调整基础模型,并根据用户反馈进行改进。开发人员正在从Hugging Face下载开源模型,并对其进行微调,以达到优质的性能。
  • 检索增强生成正在引入有关企业或用户的上下文,减少幻觉,提高真实性和实用性。pinecone 等公司提供的矢量数据库已成为 RAG 的基础架构支柱。
  • 新的开发者工具和应用框架为企业提供了可重复使用的构件,以创建更先进的人工智能应用,并帮助开发者评估、改进和监控生产中人工智能模型的性能,包括LLMOps工具,如 LangsmithWeights & Biases
  • Coreweave、Lambda Labs、Foundry、ReplicateModalAI优先基础设施公司正在解除公共云的束缚,提供AI公司最需要的东西:以合理的成本提供大量GPU,按需提供,高度可扩展,并提供良好的PaaS开发人员体验。
 
随着底层基础模型的不断改进,这些技术应能缩小模型的期望与现实之间的差距。但模型的改进只是成功的一半。以人工智能为先的生成式用户体验的玩法也在不断演变:

新兴产品蓝图

  • 生成式界面。基于文本的对话式用户体验是 LLM 的默认界面。从 Perplexity 的生成式用户界面到 Inflection AI 的人声等新模式,更新的形式因素正逐渐进入这个领域。
  • 新的编辑体验:从 "副驾驶 "到 "导演模式 "。随着我们从 "零拍摄 "迈向 "询问-调整"(ask-and-adjust) (h/t Zach Lloyd),生成式人工智能公司正在发明一系列新的旋钮和开关,这些旋钮和开关与传统的剪辑工作流程截然不同。Midjourney 的新平移命令和 Runway 的导演模式创造了类似摄像机的全新编辑体验。Eleven Labs 正在使通过提示操作声音成为可能。
  • 日益复杂的代理系统。 生成式人工智能应用越来越不仅仅是自动完成或供人类审阅的初稿;它们现在能够自主解决问题、访问外部工具并代表我们端到端解决问题。我们正在从 0 级自主稳步向 5 级自主迈进。
  • 全系统优化。一些公司并不是嵌入单个人类用户的工作流程,提高其效率,而是直接解决全系统优化问题。你能否挑出一大块支持票据或拉动请求,并自主解决它们,从而提高整个系统的效率?
 

临别的思绪

随着前沿悖论的临近,随着变革者和扩散模式的新鲜感逐渐消退,生成式人工智能市场的性质也在不断演变。炒作和噱头正在让位于真正的价值和完整的产品体验。
在红杉,我们仍然是生成式人工智能的坚定信仰者。这个市场腾飞的必要条件已经积累了几十年,市场终于到来了。杀手级应用的出现和终端用户的巨大需求加深了我们对市场的信心。
然而,阿马拉定律--我们往往会高估一项技术的短期效应,而低估其长期效应--正在发挥作用。我们在做出投资决策时要有耐心和判断力,仔细研究创始人是如何解决价值问题的。公司们正在使用共同的游戏规则来推动模型性能和产品体验的发展,这让我们对生成式人工智能的第二幕充满信心。
  • Twikoo