硬科技里淘金,VC这次又看上了生成式AI
发布者:金融小镇网 发布时间:2022-10-26 18:07:5601 AI:初创企业与成熟企业的价值捕获
人工智能:初创企业与成熟企业的价值
在每次科技浪潮中,初创企业与成熟企业所获取的价值、收入、市值、利润和优秀人才都有所不同。在部分科技浪潮中,所有的价值都可以由初创企业捕获,而在其他浪潮中,则大部分价值会归成熟企业所有,或者会在初创企业与成熟企业之间进行分配。
但是,令人出乎意料的是,尽管之前有很多人工智能的创业公司努力前行,但上一波人工智能的价值,大多都归于成熟企业而非创业公司。
本篇文章探讨了这一动态,并试图推断当前的无监督学习浪潮(unsupervised learning wave of AI)将给创业公司带来更具价值的成功,以及成熟企业能从这波浪潮中捕获哪些价值。
什么是无监督学习?什么是监督学习?
监督学习是根据已有数据集,知道输入和输出结果之间的关系,然后根据这种已知关系训练得到一个最优模型。也就是说,在监督学习中,我们的训练数据应该既有特征又有标签,然后通过训练,使得机器能自己找到特征和标签之间的联系,然后在面对没有标签的数据时可以判断出标签。在监督学习的范畴中,又可以划分为回归和分类。无监督学习和监督学习最大的不同是监督学习中数据是带有一系列标签。
在无监督学习中,我们需要用某种算法去训练无标签的训练集从而能让我们我们找到这组数据的潜在结构。无监督学习大致可以分为聚类和降维两大类。
在第一次互联网浪潮中,大部分价值被初创企业(谷歌、亚马逊、Paypal、Ebay、Salesforce、Facebook、Netflix)获取,而成熟企业(微软、苹果、IBM、甲骨文、Adobe)获取了其他部分的价值,上一波的成熟科技企业,将自己的独特经营能力延展到互联网大潮之中,初创企业与成熟企业获取价值的比例大概是60:40或70:30。
在移动互联网时代,大部分价值都归于今天的成熟企业(苹果、谷歌,以及成熟企业所打造各类应用的移动版本,例如Salesforce公司这样的移动应用,仍需要依托iPhone的Appstore,而创业公司(Whatsapp、Uber、Doordash、Instagram、Instacart等)仍然会有一些价值捕获机会,这里的价值捕获比例,创业公司和成熟公司大概占的比例为20:80。
相比之下,加密领域(Web3)基本是100%的初创企业(比特币、以太坊、Coinbase、Binance、FTX等)捕获行业里的所有价值,已有的成熟金融服务或基础设施公司很少参与加密领域价值创造。
当然,也许加密货币中最大的成熟企业参与者是AMD或NVIDIA这样的芯片公司,其芯片有时被用于加密挖矿。
(请注意,我们这里指的”初创公司 “一词,是指基于特定的科技浪潮而开始的新公司,或由特定的浪潮加速发展的新公司。因此,相对于诺基亚公司来说,苹果是移动领域的颠覆者,但它并不是一个开始制造移动设备的全新公司)
02 为什么之前的人工智能浪潮之中,初创企业捕获的价值并不多?
为什么之前的人工智能浪潮之中,初创企业捕获的价值并不多?
机器学习领域存在一个奇怪的现象,第一波价值(例如机器视觉、RNNs、CNNs、early GANs、深度学习)基本完全由已有的成熟科技企业捕获。
尽管虽然过去十年有许多号称 “顶尖人工智能”的公司(prior to the current transformer and unsupervised learning revolution),但是,真正大规模的人工智能应用落在了谷歌、Facebook(新闻和广告)、Tiktok(Bytance)、Netflix(视频推荐)、亚马逊(Alexa)的市场和领域。
迄今为止,第一波人工智带来的最大成果可能是自动驾驶汽车公司,其中许多是目前以及非常发达的科技公司的子公司(分别是谷歌、通用和特斯拉),或在新冠疫情大流行时代的产生的金融狂热通过SPAC上市的公司。我们发现,除了其他几家值得注意的公司之外,整个之前一波人工智能浪潮之上的公司,表现都相对平淡:
为什么上一波人工智能初创公司的市场占有率这么低?这里探讨一些假设:
1. 技术可以创造0.5-3倍好的产品,而没有做出来10倍优秀的产品(?)
有一种假设是,尽管上一波人工智能浪潮确实创造了更好的产品,但并没有好到可以击败成熟企业已经构建好的刚性市场格局。作为初创公司,要想打败成熟企业,通常需要建立一些具备显著优势的产品,以克服成熟科技企业在资本、渠道、现有产品护城河的强大优势,或者创业公司需要专注于全新的客户群或渠道,打造自己的护城河。
也就是说,如果成熟企业出于某些原因无法提供细分服务,就可以尝试去切这块空白的市场。一般来说,初创公司需要打造一个10倍优秀的产品。上一波人工智能浪潮,在某些情况下是好的,但在产品改进方面优势并不是足够明显,或者创造了足够的差异化。
2. 数据差异化和优势,在过去比现在更重要(?)
迄今为止,人工智能技术的诸多大规模的应用场景是在以消费者为中心的公司,这些科技公司(谷歌、Facebook、Uber等)拥有大量的数据集来进行训练。也许成熟科技公司通过自己的数据优势而获胜,但是,这种优势现在正在逐渐消失。
因为很多公司开始使用更广泛的互联网作为初始训练集,并且正在趋向切换到相较使用小数据模型、且更具鲁棒性的模型。也许在之前的人工智能时代,数据集更重要,但是今天想要训练出来一个像GPT-3这样的模型,断网自己埋头训练是非常难的。
为什么?因为超大数据的成本太高,高到投产比已经不是线性关系,是指数关系。
也许在之前的人工智能时代,数据集更重要,而且今天想要训练出来通用模型例如GPT-3,是非常困难的。
(*本段感谢张博士和汪工的注释)
3. 难以挑战的市场格局(?)
许多(但不是全部)公司选择竞争的领域要么已经有的成熟老牌企业,可以“直接在已有业务+AI”,要么从市场结构角度,并不容易突围,已有的成熟企业可以只做到50%的好就OK,只要这些老牌企业将AI与已有的核心的受欢迎的产品捆绑在一起,因为他们客户基数庞大,仍然可以获胜(例如,Teams与Slack)。
许多之前的人工智能创业公司面对的市场还是很难进入的,例如包括教育或医疗保健等行业,在这些市场中,技术创新往往被已有的市场结构、监管或已经进入该领域的老牌企业打压,他们不一定会重视实际的最终用户需求。
举个例子,1970年代斯坦福大学的Mycin项目很能说明这个问题:程序员开发了一个专家系统,在预测病人感染了什么疾病方面可以胜过斯坦福大学的传染病医务人员,但尽管这个系统性能优越,却没有被应用。进入有些市场本身就充满困难的,即使加入机器学习技术能够使效能等要素优化10倍,它也可能因为各式各样的原因而没有被采用。
4. 其他原因(?)这块我们可以继续探讨。
03 本次这波人工智能浪潮会有所不同吗?
那么,本次的人工智能浪潮会有所不同吗?
笔者已经在人工智能产品领域工作了很长时间。15年前,我在谷歌从事广告定位工作(除此之外,我还在那里开辟了许多移动互联网方面的工作),然后有一段时间在Twitter从事搜索产品的工作。我也是Color公司的联合创始人,我们一开始专注于大数据、机器学习等等,并且笔者在10多年前就开始投资了人工智能相关的公司。
本次浪潮的不同之处:
1. 更具备优势的技术正在多个领域涌现
当前AI技术浪潮的一个显著特点,是许多领域的创新速度在加快。未来类似GPT的语言模型(GPT-4?GPT-N?)大概率会以深入的方式提高消费端(C端)和To B端的自然语言的能力、保真度和覆盖面,并有可能改变从人类互动(例如基于对话的互动?)到人们日常工作(通过垂直方式,为任何触及文本的事物提供辅助驾驶)等等场景。
与此同时,图像生成、语音到文本、文本到语音、音乐、视频和其他领域的创新进展也在同步进行。大家可以发现例如图像生成的4-5个明确的商业用例,不管是从各类设计工具的迭代版本,再到电影制作的工具。
在这些应用案例中,哪些是初创公司能与现有公司的竞争中胜出的,还有待观察,但大家可以根据目前成熟公司的实力或灵活性来尝试预测未来的格局。
我们发现,这次AI技术能力和优势正在大大增强了,这就意味着更容易创造出10倍以上优势的产品,来满足现有需求。
不过,现在是否是AI初创企业起飞的时刻,一个关键点取决于GPT-4(或其他API平台)是否比GPT-3/3.5有明显的性能优势。尽管GPT-3似乎很有用,但还没有 “突破性”地发展到可以让大量初创企业能发展成为巨头企业的程度。
当然,这也可能只是意味着自它目前还处于早期。然而,一个比GPT-3好5-10倍的模型应该能够创造一个全新的创业生态系统,同时也可以赋能现有的产品。但是仅仅对GPT-3有1.5到2倍的改进,可能不足以引起真正的择时投资节点的转变。
2. 新技术意味着初创公司可以为行业的其他部分提供有价值的基础设施
与之前的人工智能创业浪潮不同,目前有一组明确的以基础设施为中心的公司,具有广泛的采用和快速增长的应用场景:包括OpenAI,Stability.AI,Hugging Face,Weights and Biases等等。
尽管这类公司的收入的优秀表现还不是特别明显,但它们的商业模式还是很有潜力的。
例如,OpenAI现在是市场的领袖之一,4年前,谷歌的优势更为明显。但是,谷歌并没有利用自己在人工智能方面的许多优势,这一点非常令人震惊,尽管谷歌拥有所有的人才、数据和各种各样的优势,为整个行业奠定了开创性市场,然后出现了一家叫做的OpenAI初创公司出现,它好像苹果公司对手机行业一样,继续推动行业的发展。
同样,HuggingFace、Weights and Biases和其他公司正在为人工智能行业提供工具,而现有的开发工具公司至今还没有做到他们这个程度。
3. 有明确的应用案例,但市场上成熟企业在这些应用领域并不强大(有空白市场)
一些最早的应用案例和初创公司,例如营销文案(Copy.AI或Jasper)、图像生成(Midjourney、Stable Diffusion等)和代码生成(Github Copilot、Replit)正在看到不错的应用和业务增长,这种趋势,在之前的AI浪潮中是不存在的。
总的来说:这一波人工智能的应用场景,在以下领域表现最好:
具备高重复性、高报酬的任务(写代码、营销文案、网站图像等)。
不完美的保真度也是可以接受的,因为存在对于训练集的反馈和循环中,尽管人工不是必须的,但是目前在各种AI应用中也比较常见。
工作流工具目前还相对不发达,所以人工智能功能会成为更广泛的工作流工具的核心部分。
总结或生成文本、图像对推广产品应用是必要的,由新的AI技术以高保真的方式实现,而这种情况在以前的AI浪潮中是不存在的。
到目前为止,具有以上这些特征的创业公司,是这一波人工智能浪潮的关注热点。其他如语音转录、机器人、视频等也都在逐步发展,这将共同扩大下一代人工智能的应用场景和案例。
04 专注应用场景和市场需求
注意,所有这些看似伟大技术的关键,是要避免拿着锤子找钉子的问题。重要的是要确定实际的终端用户需求到底是什么?有哪些服务和产品市场是可以进入的点?这些将从这一波技术浪潮中受益。随着市场上的建设者从技术专家科学家转变为以产品为中心的建设者(当然也包括一些有产品意识的研究人员),我们应该能够看到新的AI驱动的应用开花结果。
虽然之前的许多人工智能创新是引人注目和令人兴奋的(AlexNet、CNN、RNN、GAN等),但这次确实感觉不同,有几个原因。
我们有理由相信,虽然现有的成熟科技公司应该在这一浪潮中捕获大量的价值,但初创公司这次将在人工智能产生的价值中占据更大的份额。
05 规模
在考虑初创公司与成熟企业的价值时,重要的是要记住成熟科技企业的规模:
例如,谷歌的市值增加10%,目前它市值是1300亿美元,或相当于几乎7个Figmas,4个Snowflakes,17个Githubs,或130个Stability.AI!
现有公司的市值已经变得很大了,以至于即使是有一点小变化,也可以增加整个生态系统或细分市场。
来源:阿法兔的笔记