硅谷VC眼中的生成式AI:掌控高质量数据的To B方向,会诞生独角兽

2024-02-02 18:06:06 浏览数 (1)

图片图片

《AI未来指北》栏目由腾讯科技推出,邀约全球业内专家、创业者、投资人,探讨AI领域的技术发展、商业模式、应用场景、及治理挑战。

文|腾讯科技 周小燕

今年6月,朱啸虎和傅盛在朋友圈进行了一场关于GPT对创业公司价值的“辩论”:

① 朱啸虎给大模型创业泼了一盆冷水,他认为,99%的价值都是GPT创造,依附于GPT的创业公司本身的价值不大;

② 傅盛则更加乐观地认为,硅谷一半公司都在围绕GPT做创新,它是一个平台,创业者可以基于这个平台衍生出各自不同的价值。

以GPT为代表的大模型是工具和平台,这场争论的本质,是创业者能否运用好这款工具,做出有壁垒的产品。朱啸虎和傅盛代表了这个问题的两面。

我们和一位硅谷华人投资人、Fusion Fund创始人张璐聊了聊这个问题,她从2018年ChatGPT1.0刚出来便开始关注生成式AI的投资机会,长期关注AI 医疗的创新技术,通过和张璐的探讨来看,“数据”的质量产业信息是生成式AI创业者的核心壁垒。

如果看To C机会,朱啸虎的观点可能更占据优势,因为C端的数据基本都掌握在大公司手中。在中国,这些公司可能是阿里巴巴、京东等;而在美国,如苹果、Google和Facebook等科技巨头拥有大量高质量的C端用户数据。相比之下,小型初创企业很难与大企业竞争数据质量和获取数据的机会,并且C端产品基本上都调用Open AI的API,同质化严重。

如果看To B机会,傅盛的视角更立得住脚,虽然大量的数据掌握在大企业手中,但它们却没有自己的人工智能开发能力,它们需要与初创企业合作,将这些数据分享给它们。此外,基于大企业之间的竞争关系,它们不太可能将数据分享给像苹果或谷歌这样的巨头,而更倾向于与小公司合作。面向B端的创业公司,可以通过和大企业合作,或者基于在某个领域独特的数据优势而拥有壁垒。

丨核心观点

● 尽管硅谷风险投资领域资金充裕,但现在的投资更加谨慎。与去年同期相比,本季度整体投资项目的数量大幅下降,但投资金额并未如人们想象的那样大幅降低。这是因为优质项目依然吸引大量资本,这正是马太效应的典型体现。

● 过去半年以及未来一段时间的并购活动非常活跃,而且买家不仅限于传统科技公司,还包括金融和保险等行业,它们正在收购各种垂直领域的人工智能公司。并购金额从几亿美元到几十亿美元不等,这是一个极其重要的信号。这次人工智能确实影响了整个产业,大趋势是全产业的数字化转型。

● 经济低潮阶段意味着大型企业、上市公司和财富500强公司面临着巨大挑战。现在与往年不同的是,往年大企业可能认为技术整合和创新是只是锦上添花,但现在如果不进行新技术的整合,效率将降低,生产力将下降,同时各种成本和竞争性问题也困扰着这些大型上市的财富500强企业。

● 中美之间AI发展存在着一个技术创新周期的区别。中国可能仍在基础设施的创新阶段,而美国的基础技术创新已经完成,成为了一个模型。硅谷目前很少谈论投资人专注于投入模型的情况,而是专注于下一步,即技术应用创新。

● 与数据的数量相比,当前数据的质量至少在美国已经变得更为重要,选择投资行业的首要条件是找到具有海量高质量数据的行业。只有拥有大量高质量的数据,才能充分展现人工智能技术的优越性。其中医疗行业是首选,因为它拥有的数据量最大、质量最高,无论在中国还是美国都是如此。相比之下,像消费者数据和用户数据这样的数据往往较为杂乱。

● 针对C端市场,硅谷的创业者们仍面临挑战。小型初创企业很难与大企业竞争数据质量,数据成本和获取数据的机会。然而,B端市场情况不同。大量的大数据掌握在大企业手中,但它们却没有自己的人工智能开发能力,它们需要与初创企业合作,将这些数据分享给它们。

图片图片

Fusion Fund创始人张璐

以下为具体访谈内容:

01

硅谷创投圈的“马太效应”明显,

好项目面临并购潮,

规模高达几十亿美金

腾讯科技:你2010年就去美国斯坦福大学读书,之后开始在硅谷创业,请分享一下目前整个硅谷的创投生态是怎么样的?

Fusion Fund 张璐:尽管今年市场环境不佳,硅谷银行破产并导致金融市场波动,但事实上,硅谷银行对生态系统的影响并不像人们所想象的那么大。硅谷银行实际上是由政府托管,确保了企业、投资者和其他资产储户的现金安全。银行的破产并没有产生巨大的实质性影响,更多是在生态系统中缺少一个活跃的金融服务提供方。

虽然风险投资领域资金充裕,但现在的投资更加谨慎,“马太效应”明显。与去年同期相比,本季度整体投资项目的数量大幅下降,但投资金额并未如人们想象的那样大幅降低,因为优质项目然吸引大量资本。一些具备巨大市场潜力、在收入和客户层面表现出色的领军企业吸引了顶级资本,它们通常在募资过程中能够超额募资150%至200%.我们自己的企业今年融资的基本都是超募,有一家深科技的边缘计算芯片公司几个月前融资B轮,也是200%超募。

在金融市场和公开市场的影响下,现在的投资者在选择公司时的条件和要求与以前有很大不同。过去更注重公司是否能实现超高速增长,而现在更注重是否有明确的市场验证、良好的现有收入和数据增长。我认为,这实际上是回归商业本质。 

腾讯科技:在这样的环境下,反而更容易催生出一批伟大的企业?

Fusion Fund 张璐:没错,仔细观察风险投资市场,可以看到目前的一个重要特点是,创业者的平均素质和质量比往年要高得多,他们要么是连续成功创业者,要么具有丰富的行业经验。

在过去几十年的创新浪潮中可以看出一个规律,经济低潮、经济变化和转折阶段是最容易出现伟大企业的时候。

第一,这是周期性变化,在触底后必定会反弹,反弹过程中能够顺势崛起的公司将会更快成长。

第二,资本在这个时候更加集中地投资,优质公司可以获得更多集中的资本、资源和人才。

第三,现在的经济低潮阶段意味着大型企业、上市公司和财富500强公司面临着巨大挑战。现在与往年不同的是,往年我们可能认为技术整合和创新是可有可无的,但现在必须进行整合,包括与人工智能这一批新技术的整合。

如果不进行新技术的整合,效率将降低,生产力将下降,同时各种成本和竞争性问题困扰着这些大型上市的财富500强企业。它们迫切需要与技术进行整合,这也证明初创企业可以更快地获得订单和市场验证。

硅谷整体的创投环境可以用核心几个词来概括:

首先是“马太效应明显”;

其次是“崛起”,我们正处于一个调整期和快速崛起的前期阶段;

最后是“活跃”,尽管中晚期有很多基金备用金和资金,但大家仍在观察市场的调整,等待优质企业崛起后再进行重点投资。

腾讯科技:你提到在周期性变化中,“触底后必定会反弹”,现在已经处于周期性变化的底端了吗?“反弹”是不是即将来临?

Fusion Fund 张璐:还需要时间来实现反弹,因为反弹的核心是整合和推动新技术。现在的人工智能具有许多优势,特别实用。

企业应用的发展进展非常迅速,但要将它们大规模推广像IBM、微软和辉瑞这样的公司可能需要一年的时间。

一旦进入客户端,要让它们的订单从几百万美元增加到几千万美元甚至更高,也需要一年的时间。

在未来一到两年内,人工智能将迅速崛起,但不会像人们想象的那样在几个月内完成,它仍然需要一个周期。在这个过程中我们将会经历经济周期,但同时也会看到各种垂直领域的人工智能应用蓬勃发展。 

腾讯科技:这一两年内,企业需要做哪些技术上的搭建和准备,才能把握和应对垂直领域人工智能的发展机会?

Fusion Fund 张璐:中美之间存在着一个技术创新周期的区别。中国可能仍在基础设施的创新阶段,而美国的基础技术创新已经完成。

我们目前很少谈论投资人专注于投入大模型的情况,而是专注于下一步,即技术应用创新,但加速仍需要一定时间。此外,推动力不仅仅是技术创新本身。你开发出的技术需要被人们使用,需要被应用于产业。当前,美国的大型公司(包括500强公司)的CTO(首席技术官)手中有很大的预算,甚至可以达到数十亿美元。这些巨额资金专门用于与初创企业合作,进行订单战略合作或并购。

你会发现过去半年以及未来一段时间的并购活动非常活跃,而且买家不仅限于传统科技公司,还包括金融和保险等行业,它们正在收购各种垂直领域的人工智能公司。并购金额从几亿美元到几十亿美元不等,这是一个极其重要的信号。

同时收并购的速度也很快,过去2年我们有8家公司被收购,几个月前我们的一家和Nvidia合作的AI公司,在两个月内被一家上市公司高价全现金收购,所以技术整合的速度在加速。我们之所以对此感到兴奋,是因为过去在互联网时代数字化转型主要集中在科技领域,其他行业虽然提到了"互联网 "但仍不是深度应用。但是这次人工智能确实影响了整个产业,大趋势是全产业的数字化转型。

腾讯科技:在全产业数字化转型过程中,生产力和生产关系会发生调整,大家会面临很多的动荡和变化,比如企业裁员、很多人面临失业,这是一个必然的趋势吗?

Fusion Fund 张璐:裁员有两个原因,一方面是经济形势的调整,大家都希望增加现金流;另一方面,特别是科技公司,它们不再需要那么多工程师,因为通过优化工作流程和降低开发成本,就可以实现大规模的成本降低。

如果一个员工的生产力和效率提高,整个公司是否需要更少的员工就可以运转?我认为数字化转型的核心就是自动化,产业越自动化,对人力需求就越少。

实际上,目前美国存在一定的对立情况,科技行业进行裁员,而传统行业却招不到人。

例如,我自己创办了CXO网络,其中有44位来自全球1000强企业的首席技术官,我的合伙人之一是曾任惠普全球首席技术官的Shane Wall,我们可以了解现在这些产业领袖的预算和下一步数字化转型的战略布局。

其中,一家大型物流供应链公司的首席技术官告诉我,他们的人才流动率高达130%,因为年轻人不愿意从事该行业的工作,所以他们无法招到人才,不得不开始推进更多的自动化。

与此相反,科技公司之所以裁员,是因为新的人工智能技术的出现降低了开发成本,使得他们不再需要那么多的员工。此外,一些科技公司过去几年的估值过高,快速增长导致人力成本过高,这也是裁员的原因之一。

我认为在看待整体问题时,需要分别看待不同的生态和产业,从宏观和微观的角度思考。虽然很多科技公司在裁员,资金链紧张,但并不代表它们会一直“贫穷”,相反,如果你来到硅谷,会发现这里聚集诸多优质的项目和大量的资金。

只是现在大家投资更加谨慎,也更加集中,这就是为什么好项目能够崛起的原因。想象一下,将同样的资金分散投资到100个公司,那么每个公司的成功可能性都不太高。但现在,资金大部分集中在最优质的企业中,他们的成功概率自然更高。

02

硅谷进入AI驱动的全产业数字化转型时代

腾讯科技:今年3月,创新工场董事长李开复认为,AI已经从1.0迈入2.0的拐点,ChatGPT则是AI 2.0时代的第一个现象级应用。在硅谷,有没有对AI的发展做过类似的阶段划分?

Fusion Fund张璐:硅谷没有对AI发展阶段做过类似的概念区分,但硅谷一致认同,现在是一个AI推动全产业数字化转型的时代。在ChatGPT出现之前,大家谈论AI的语境主要集中在科技产业里,但现在基本探讨的都是AI和全产业的整合。 

腾讯科技:从什么时间点开始,你非常明显地感觉到,AI推动了全产业数字化转型时代的到来?

Fusion Fund张璐:大概在今年(2023年)年初,大众才开始对AI推动全产业发展有所反应,ChatGPT其实做了一个重点工作,它给全产业做了一场AI教育。

但如果真的从全产业应用来说的话,我们从2019年就一直在投“零代码人工智能平台”方向,也就是说使用它的人不需要懂一行代码。ChatGPT的出现,让不需要有任何技术背景的人也可以使用先进技术,这是ChatGPT带来最大的效应之一。

从投资角度看,我们从2018年就开始投资生成式人工智能了,当时ChatGPT 1.0出现了,我们有一个合伙人在2018年和谷歌合作非常紧密,他们也在探索用Transformer做一些金融层面的应用,但彼时大模型还没有现在这么成熟好用,从GPT 3.5出现开始,整个产业的加速变快了。

腾讯科技:在2018年ChatGPT 1.0出现的时候,你们内部是怎么思考生成式AI的?比如国内有的投资人会画一个生成式AI的投资图谱,按照AI Infra、模型层、应用层三个层面逐一寻找头部项目,硅谷投资人也会做这样的分层吗?

图片图片

来源:英诺天使基金合伙人 王晟

Fusion Fund张璐:我也同意这个分层。我们投资布局人工智能的时候,大语言模型只是其中一个模型类型,我们同时也投联邦学习、可解释性人工智能等。虽然我们很早就看到大语言模型的机会,但是确实没想到它发展的速度这么快。我们当时判断,语言模型基本上会由几个大公司或者大机构把它作为一个底层基础提供出来。

在AI Infra层面,我们投资布局了一些模型优化公司,主要集中在算力、能耗、数据质量提升三个大方向;

在模型层面,我们非常看好开源平台,但开源平台和闭源平台不会取代彼此,需要针对不同的应用来选择相应的模型,有的应用适合调用Open AI的API,有的适合调用谷歌的PaLM,有的则适合用Meta的Llama 2,每个应用根据需要的场景各取所需;

在应用层面,我们主要看垂直to B的应用,青睐具有海量高质量数据的行业。只有拥有大量高质量的数据,才能充分展现人工智能技术的优越性。其中医疗行业是首选,因为它拥有数据量最大、质量最高的数据,同时应用场景非常多样,无论在中国还是美国都一样。相比之下,像消费者数据和用户数据这样的C端数据往往较为杂乱。

现阶段监督学习仍然远大于生成式AI,两者都将继续增长,生成式AI的增长速度可能会更快。同时生成式AI使得监督学习的发展变得比原来可能快100倍、同时也更便宜,并更容易为公众所接受。

硅谷生成式AI的投资逻辑:10%精力看大模型,90%精力看应用和Infra

腾讯科技:在模型层面,什么样的应用会选择闭源模型、什么样的应用选择开源模型,这里面存在着什么样的规律?

Fusion Fund张璐:这里面可能没有特殊规律可遵循,核心的考量在安全隐私层面,比如金融保险这类传统机构不会使用开源模型,但科技产业类企业对开源模型的态度更加开放一些。现在也有初创企业动态选择不同的模型来支持不同的应用,优化整体效率。

腾讯科技:可以理解为,Open AI、谷歌、Meta基本抢占了硅谷大模型的天下,所以你们在模型层面不会做其它投资动作了?

Fusion Fund张璐:并不是说完全不看模型层面的机会,只是会有侧重点,我们会用10%的时间去关注模型,剩下90%

的时间关注Infra优化和在垂直领域的应用。美国还是有很多人在持续探索模型层面的优化以及其它不同方向,比如如何用更小的数据量进行新一代的算法优化等,现在只是一个开始。

腾讯科技:在这10%的精力里面,你们会用什么样的逻辑去探索新的模型层面的机会?

Fusion Fund张璐:由于它还是一个比较新的事物,我们只能永远去保持关注,在关注的同时不一定有新的东西可以马上投,还需要时间让模型更成熟并且适合大规模商业应用,但我们一定会持续花时间去探索。大语言模型非常Amazing,但它不是AI的全部,它只是AI的开始。李开复老师也说AI有1.0到2.0的迭代,这说明它还会有3.0甚至4.0,未来会有更好的算法、更优化的模型帮助我们实现真正的零代码人工智能平台,这就像傻瓜相机出现后,大家不用具备专业的调光知识也能去拍照一样。

腾讯科技:在AI Infra层面,你提到关注数据质量提升,和质量相比,数量不重要吗?

Fusion Fund张璐:在美国,垂直领域的To B应用发展很快,尤其在GPT-3.5之后,如果想让模型变得更精准和高效,数据质量比数量更重要。要想在大模型基础上训练专属模型,所需要的行业数据的量其实并没有大家想象的那么多,因为垂直领域的应用是有边界的,这和to C端应用不同。

很多人不理解为什么ChatGPT要用大量数据,而做专属行业应用则不需要。我们可以设想,ChatGPT是C端应用,它需要应对人类所提出的乱七八糟的各类多样化和发散问题,这就导致它必须不停延展自己的能力边界,只有吸取大量数据才能覆盖所有问题。

但行业专属模型,只需要专注在一个领域就行。比如我们投了一家针对药厂的公司Huma AI,它相当于医药领域的ChatGPT,药厂可能会直接问它“新药的临床试验怎么设计”“某两种药的副作用有什么关联”这类问题,它的答案都无比准确。听起来好像很难做到,但是药厂所问的问题都局限在它所掌握的数据范畴之内,所以它的变量比To C应用小得多。

在这样的背景之下,其实训练数据的数量很小,但是质量很重要。在数据质量提升方面,我们投资过一家公司名为Optimal Dynamics的公司,专注于传统物流供应链行业。它的产品不仅是一个简单的人工智能平台,还具备传感器,可以在物流供应链过程中收集大量数据,并通过人工智能在终端进行处理。

在Infra层面,除了数据质量优化之外,过去的一年我们也投资了一些在算力和能耗层面上进行优化和提升的公司,有些是在Cloud层面,有些是和Edge Computing(边缘计算)相结合,也有在芯片层面上的优化。虽然这些公司都还很早期,商业化进程都很快,包括Nvidia,AMD,高通等芯片巨头公司都在和初创企业合作。

03

硅谷生成式AI的应用机会:

C端应用同质化严重,

B端应用更有壁垒

腾讯科技:之前国内投资人朱啸虎发文表示“ChatGPT对创业公司很不友好”,傅盛回应“国内投资人的思想怎么这么落后,在硅谷现在已经有1万家公司都围绕这个东西做创新。”在硅谷,生成式AI主要有哪些应用层面的创新模式?

Fusion Fund 张璐:比较于C端的机会,硅谷投资人更看重B端的机会。

针对C端市场,硅谷的创业者们面临很大挑战。目前的差异化已经不再只关注谁的生成式AI模型算法更出色,因为模型一旦问世并开源后,任何人都可以使用。相反,数据的独特性和质量才是壁垒和天花板。而C端的数据基本都掌握在大公司手中。在中国,这些公司可能是阿里巴巴、京东等;而在美国,如苹果、Google和Facebook拥有大量高质量的C端用户数据。相比之下,小型初创企业很难与大企业竞争数据质量和获取数据的机会,数据成本也很高。

然而,B端市场情况不同。大量的大数据掌握在大企业手中,但它们却没有自己的人工智能开发能力,或者不想自己在内部开发因为担心潜在监管的风险,它们有动力与初创企业合作,将这些数据分享给它们。此外,基于大企业之间的竞争关系,它们不太可能将数据分享给像苹果或谷歌这样的巨头,而更倾向于与小公司合作。 

腾讯科技:你在B端应用层面的思考过程是怎样的?在应用发展方向上的布局优先级是怎样的?

Fusion Fund张璐:在To B方向,每个行业都会需要行业专属模型,生成式AI应用需要满足三个条件:

第一,基础条件是行业数据质量高且规模巨大;

第二,应用场景要足够多样;

第三,这个行业本身的市场空间巨大,只有在足够大的市场里,用户的付费意愿才足够强。

按照这个逻辑,排名第一的行业一定是医疗,其它行业依次是金融、保险、供应链、化工行业等。

医疗市场占据美国GDP的20%。不仅我一直在强调这一点,在其他会议上,许多大型人工智能公司的首席执行官也表达了相同观点。例如,NVIDIA最新的文章关注数字生物学,微软和谷歌也在关注人工智能在医疗行业的应用,AI医疗绝对是一个最大的趋势之一。

医疗行业本身又有很多分支,它的应用场景非常多样化,我们的逻辑是在医疗行业的每个垂直领域中寻找它的Number One.

对于一家早期的AI医疗企业来说,一方面要关注它的解决方案,另一方面也要看团队是否具备获取优质数据的能力,企业能够拥有高质量专属数据的数据库,这个数据库可以由企业自己建立,也可以通过和别人战略合作获取。此外,还需要拥有专业的行业知识可以在训练行业专属模型时给予高质量反馈进行模型优化本身。

但这些专属数据并不掌握在初创公司手里,而是主要掌握在一些传统大公司手中,他们可能会与第三方初创公司合作将数据分享出去。

腾讯科技:从应用场景上来看,你会把医疗行业分成哪几个应用环节?生成式AI能改变的是哪几个环节?

Fusion Fund张璐:我们主要分四个方向看医疗:

数字化诊断

数字化治疗(Theraputics)

数字化生物学(Biology)

医疗体系的企业级软件(Enterprise AI focus on health care)

它们并不是都需要用到生成式AI,展开来说:

数字化诊断主要和路线图有关系,我们投资了深透医疗(Subtle Medical ),他们通过生成式AI将CT,MRI等医疗影像从低精度升级成高精度人工智能,病人只需要做5分钟的低精度扫描就能获得高质量的图像,而不需要做3小时的高精度扫描,提升诊断效率的同时,也降低诊断成本。但数字化诊断并不需要全部都使用生成式AI技术,它可能只需要有可解释人工智能就够了,如果AI pathology,人工智能读片,其实并不一定需要使用生成式AI。

数字化生物学一方面会用到生成式AI,另一方面会用到AlphaFold的数据库,用来推算蛋白质折叠结构。我们投资了Ruby Bio,就是针对化工行业的合成生物学公司。

医疗体系的企业级软件,我们投资了Huma AI,它主要面向制药行业和生命科学行业,它所训练的数据主要基于药厂内部的大量数据,医药厂商只要输入和药相关的信息,Huma AI都能输出相关的知识。我们也投资了一些针对医生的medical coding with AI,医疗保险等应用。 

腾讯科技:B端的机会很多,但是C端完全放弃了吗?比如类似于像Midjourney这样的C端应用,团队只有11个人,但收入1亿美金,类似的机会也不关注吗?

Fusion Fund张璐:硅谷也有很多机构持续看C端机会,投资人寻找的时间成本更高一些,C端产品基本上都直接调用现有的API,并且同质化也很严重。

腾讯科技:最后,我们探讨一些硅谷新趋势。除了AI,硅谷现在的投资方向是否有其它高度聚焦的新主题?

Fusion Fund 张璐:这波趋势并不是只聚焦人工智能,人工智能是一个新的强力工具,它应该尽可能地被应用到各个领域。然而,并不意味着所有使用人工智能的领域都可以创造巨大的商业价值,所以对于投资来说,也要挑选哪些产业和应用可以更快创造巨大的商业价值,最适合优先应用。

在这个关注层面上,首先是医疗领域的数字化转型。数字化是驱动人工智能作为高效工具的关键。比如,我们公司一直关注医疗领域,其中重要的就是人工智能在医疗领域的应用。

第二个关注点是企业级网络技术和企业级人工智能,即企业级AI和企业级网络,还有数据隐私保护。

最后是传统行业的数字化转型。这涉及到硬件和软件两个方面。软件方面就是人工智能的应用,涉及到许多垂直行业。所以,当评判一个公司是AI公司还是医疗公司时,我认为本质上它还是一家医疗公司,因为人工智能本身只是一个驱动工具。同时数字化转型包括数据收集,数据传输保护,和数据处理三个部分。需要软硬件层同时升级,才可以满足产业需求。

总之,现在的大趋势是各种不同类型的公司都要在不同程度上应用人工智能,或者说围绕人工智能生态系统进行开发。

0 人点赞