引言:近期,朱珑博士受邀在奇绩创坛分享《科技创新:从科学家到创业者》。朱珑博士是依图科技创始人,人工智能科学家,加州大学洛杉矶分校统计学博士,曾在麻省理工学院人工智能实验室、纽约大学Courant研究所担任博士后研究员。
本文要点
- 科技和创业:从企业、远见、战略、市场、产品5个角度出发,科研项目如何转化为创业公司,在商业化层面需要做什么准备。
- AI 新黄金时代:朱珑博士认为,AI 新黄金时代已来临,即将开启物理材料构建智能体的篇章。
科技和创业
Enterprise = Vision | Strategy | Product x Market
第一部分是关于科技和创业。
用一横一纵的图描述企业。
纵轴Vision|Strategy|Product是不同时间跨度关心的事情,分别是远见看十年,战略看五年和产品看三年,从远到近,从模糊的正确到具体的执行。
企业基本上以V|S|P为轴,把长短期目标连接起来。
横轴展现企业以什么组织形式,其重心以产品x市场张成组织结构的底,具体结构取决于什么样的产品阵列以及服务什么样的客户,大体分为ToB、ToC市场。
横轴从右到左是由表及里的拆分,其中比较重要的是财务和人事。财务以数字化指标来指导企业运营,基础指标:收入、利润、现金流和增长率,用来衡量企业运营效率和产品竞争力。人事关心以什么样的组织薪酬结构匹配业务需求,在A轮B轮等不同发展阶段定制不同KPI激励团队达到更好的财务指标。最右侧也是最表层容易被感知的企业运营。最左侧最底层的是创始人的使命、价值观和方法论,支撑远见的达成。
创新路径有很大不确定性,作为CEO,相比于管理层更需要Be comfortable with uncentainty。
Vision is a unique perspective about big things
远见是一个非常独特的看行业变革的视角perspective,本质上只要有不同的角度,就会产生不同的Vision。
但Vision要讨论BigThing是什么。比如英伟达CEO Jensen Huang 30年前对图形卡的展望,隔十年对图形卡和计算卡的演进关系是怎么构想的,对摩尔定律在不同时代与同行有什么独到的见解。
独到的远见非常珍贵,深刻的行业洞察很有帮助,但更多时候还靠企业家的直觉instinct和偏执,很难短期训练形成。远见指导形成差异化的战略。
Strategy = Maximize ROI = Maximize Efficiency
商业领域非常关心战略。战略就是用方法论把模糊的远见具体成产品路径。在早期,战略等同于产品策略,最开始要去找特定niche market,尽量在其中寻求高占有率,极度专注地通过产品获得差异化竞争力,且能够随着时间扩大,而不是衰减。
值得特别注意的一点是,技术往往不是时间的朋友。技术的商业价值不在于第一个的出现和领先,而是在于优势的持续性。
另外可能容易混淆技术的整体社会价值和特定机构的商业价值,比如AI对社会的价值大不大,很大!那特定的公司在AI领域里分到的价值大不大?这是两个命题。技术必须和市场和商业化的过程相结合,才能构建竞争力和壁垒。
战略最重要的是对市场规模预测。Scale is everything。市场最好有规模效应,占有者容易形成对比优势。容易忽略的是节奏。半导体领域有众所周知的摩尔定律,18个月翻一倍。这个定律本身不是在谈一个物理规律, 其实是在谈行业的供需周期或者竞争规律。比如说手机、芯片、服务器、汽车都有各自不同的行业节奏。很多创业团队从最快节奏的互联网领域来。但技术应用到其他行业,像是制药,医疗,企业服务等行业,智能化的改造节奏没有那么快,但多年训练习惯是快节奏,与行业的慢节奏产生错位匹配。所以太快和太慢都会成为问题,节奏是战略中非常重要的一环。
创业要面对很多创新。但没有讨论风险的创新往往是假的。只有管理团队把风险计算清楚,才可能对创新的本质和边界有更好的把握。风险的计算是重要的基本技能,需要培训和练习。快速试错并以非常低成本试错是创新的重要方法。
战略需要具体执行,就需要量化。有一个基础但很重要的量化概念叫投入产出比ROI。美团非常好地把战略等价于在某一时空下最大化ROI。凭借商业直觉衍生出的看似抽象的战略变得可量化,可推导,可比较,可验证。但战略可选择的空间强依赖于企业自身的组织能力,需要有耐心成长组织能力并等待与之匹配的战略窗口。
商业领域另一个解读战略的经典视角:唯一有效的企业战略就是提高经营效率。效率是用利润率加增长率这样的财务数字来量化企业的竞争力,也叫效率公式效率=利润率 增长率。效率指数40%是值得参考的基线准则,比如说追求高增长率,可以的配比是利润率-20% 增长率60%,或者平衡一些20% 20%。总之两项相加作为指数度量企业竞争力,这在财务数字上把企业的宏观战略连接到微观运营。效率公式在数学本质上和ROI相同,例如保持20%的利润率6年约等于ROI=3。利润率20%或ROI=3恰好都是行业巨头业务决策的指导标准。
利润率可以根据产品毛利率减去运营成本计算获得。毛利率是非常重要的度量产品竞争力的指标。虽然不同行业的产品会落在不同的毛利率区间,软件、服务、系统、硬件,芯片等产品形态有些差异,但总的来说60%毛利率是全球市场很好的经验指导值,行业第一的毛利率大概都会在此之上,高毛利率让企业利润率能够在20%以上,例如微软、谷歌、苹果、英伟达、英特尔等。如果是比全球市场小些的市场,指导值相应调低至50%。海康就在此区间,同时也非常出色地做到了高利润率。第二名因为市场占有规模更小成本更高,毛利率与第一名的差距略小于10%,利润率因此也受一定挤压。再往下接近30%就是一个产品公司能够盈利的底线。毛利率下降也反映竞争的加剧。生产制造比较重的行业例如汽车,毛利率会低很多,如何维持好的利润率就非常考验运营效率。
最近科技创业的商业化受到广泛关注。分析一下毛利率就可以理解为什么市场对很多技术企业的担心和质疑,很多产品并没有体现出差异化的竞争力。当然,从另一角度看,技术找到市场规模化的支撑是艰辛的历程,也需要更多的耐心和理性的支持。
Market = SaaS | PaaS | IaaS x Cloud | Edge
创业很重要的一个环节是市场和产品的匹配(product-market-fit)。越是创新的商业模式或产品品类意味着刚开始没有客户。行业格局的分析有助于定位在什么样的上下文讨论。
以大的IT行业格局为例进行拆解,分为横轴和纵轴,横轴左侧是云中心,右侧是边缘端,有代表性的公司的产品形态以及产品所构成的产业链条从上到下为SaaS | PaaS | IaaS,依次从偏软的应用服务到操作系统,到偏硬的服务器、芯片,最后到生产制造。
整个IT行业的几十年的演化,大概就是横轴和纵轴或分裂或整合的过程。合纵连横的历史中,横向的有云和端之争;纵向的有软和硬之争;内部有操作系统之争,有芯片架构路线之争,有计算机控制权之争;还有垂直整合系统和开放平台的模式之争。
总的来说,机会往往出现在Gravity of innovation shifts。从产业格局图分析裂变和整合的规律,预测重大时点和条件,指导市场切入的时机和形式。
Product is an art of tradeoff between performance and cost
给定一个行业市场后,非常重要的就是产品定位和路线。
产品策略图用两个轴展示:横轴是性能即先进性,纵轴是成本。根据产品定价和成本即可计算毛利率,反之亦然。红线是用户能够接受的最低成本,这是一个非常重要商业化的指导线。越过红线的右下区间,就是可盈利区间。最右下的这一条绿线,是科学原理指导下极致成本的底线,也可以称为第一性原理线,类似特斯拉CEO Elon Musk谈到的新能源车,火箭发射等。红线和绿线之间的金线是商业历史大概率会发生的线。金线的右下区间就是世界超一流公司的高毛利率区间。金线上方和红线中间是盈利区,但比60%高毛利率低一点。
三类产品模式A,B,C对应不同产品策略。其中A是最成功的主流模式,表征是极强的产品力支撑着稳健的商业盈利能力,代表有苹果的手机,英伟达的图形计算卡,特斯拉的新能源车。路线就是从A到A’这个过程,用极高的技术实力贴近工程极限做出超高性价比产品,用户能接受,商业上也很赚钱。
B是划时代颠覆式创新者的早期,例如苹果、英伟达、特斯拉,追求极度超前的性能区间而先忽略成本约束,后续目标是走进B‘的区间从用户不能接受到用户接受,再转入高利润的A区间。B模式显然风险极高,原因来自该区间蓝线极其陡峭的研发成本曲线以及不可预见性,需要极高的前瞻性、资源整合能力和偏执狂的毅力。B的极难模式很容易使企业进入生死边缘,最考验创新者的勇气。正因为此,划时代重复着激荡人心的英雄故事。
大部分的产品在哪个区间呢?就是C区间,技术不是最先进的,但整体运营能力很强,达到很不错的盈利能力。C相比A,产品性能因为自身能力策略性的选择落后一些,但因为技术更可预见,该区间蓝线对应的研发风险和成本相比A模式也大大降低。C持续增长的市场占有转换成研发投入也能侵蚀转入A区间。TSMC除了是Fabless模式的远见者,更是靠扎实的运营积累从C向A突破的极佳案例。华为是另一个商业史上极其成功且能把方法论推广通用到多个行业的从C到A跃迁的范例。
根据这样的产品路线图谱,分析各自站位,路线以及动态博弈,推演并制定产品应对策略。
AI新黄金时代
IT时代变迁
1970-1990 小型机时代, 个人无感。
1985-2005 PC时代, 让个人拥有十核算力在桌面 — High frequency&multicore。
1995-2015 互联时代, 让个人拥有无穷数据在云间 — Search。
2000-2020 移动时代, 让个人拥有百核算力在掌间 — Touch Screen&Battery。
2005-2025 云时代, 让个人拥有万核算力在云间 — Distributed Computing。
2015-2035 智能时代, 让个人拥有智能体在身边 — Intelligent Computing。
2025-2050 梦境时代, 让个人拥有真实梦幻 — Simulation Computing。眼前的虚拟世界是过去真实世界的映射。
纵观50年,算力跃迁是信息革命的内在驱动力。当前正处于AI的新黄金时代,将开启物理材料构建智能体的篇章!
十年序曲
Al过去十年大概分三个阶段。
从2012-15年处于起步阶段。以深度学习在对大规模数据上的性能结果被工业界所认可作为起点,AlphaGo成为全社会讨论热点为重要里程碑。
从2016-18年为热点时期。在各行业场景的应用蓬勃发展。
从2019-21年,AI为代表的高科技进入国际核心竞争领域。恰好在同一时期,也出现了对AI行业的质疑,无论技术商业化探索过程的曲折,还是市场合理的挑剔,在国际竞争大背景下,AI技术创业背负了超越一般商业化挑战的艰辛。
创新者困境dilemma往往可以用四象限刻画。右上角是勇敢且执着的创新者;右下角是自以为狮子的猫;左上角是自我怀疑者;左下角是泡沫中自我否定的沮丧心态。技术和市场的发展周期在不同阶段,节奏上和行业内外的预期有巨大分歧时,总会分出这四象限人格,越是热门行业,越有极端的表现。
新黄金时代
AI发展十年,当市场产生疑问时,看看世界前沿在思考什么?借用三位大师的名言描述一下对未来十年的展望。
第一位是数学家David Mumford,1974年的菲尔兹奖得主,曾是美国总统顾问。2020年他写的一篇文章,“Al模型和人类大脑结构惊人的相似”,拥抱以新一代Transformer为主的算法架构。
第二位是计算机架构理论学家David Patterson,图灵奖获得者,RISC开创者,也是Google TPU的设计者。同年,他对AI有一个专门文章 “计算机架构的新黄金时代”。
第三位是极负盛名的工程师Jim Keller,曾是英特尔、苹果、AMD的主流芯片以及特斯拉自动驾驶芯片的架构师。他用职业生涯的切换来证明“这是AI新时代的开启,变革大大超过移动和互联的时代”。
世界最前沿的大师一致相信Transformer能把Al带向新的篇章。两年来各个领域巨大进展也验证了他们的展望。比较热门的OpenAI的GPT-3的结果,大概是由1300亿个参数构成的大模型。GPT-4在此基础上可能再翻200-500倍,有理由想象,生物和化学的奥赛竞赛题Al基本能做了,下一个攻克的难题是数学奥赛竞赛。最近DeepMind关于矩阵数学计算的进展,都是令人振奋的。
人类大脑是二十多瓦的能量消耗,新时代Al的大模型不受这么严格的能量约束,会超越大脑。通过超大规模模型和计算,颠覆智能目前可以达到的边界。可能不会短期一两年之内有举世瞩目的产品,但我们预测,以十年为周期,会是翻天覆地的变化,深刻影响各行业以及各科学领域。包括大家比较熟悉的DeepMind做的蛋白质三维结构预测。还包括物理的混沌系统,数学的偏微分方程等等都会有重大进展,甚至超过深度学习的开创者Geoff Hinton本身的想象。
算力变革核心在于密度
AI新变革的技术核心在于“算力密度”。
在大数据时代,数据是量大,云计算是计算量大,但是密度都不大。
新Al的特点是高密度的运算,超过过去几百倍。
IT行业40年的变迁,就是由算力的密度产生巨大的变化,引导着互联,移动,云以及现在的智能产生巨变。
不算严谨的算力分类CPU、GPU和AI,分别对应单位指令下的计算密度或是单位数据下的计算密度百倍级的频谱划分。
新的基于数据计算的体系结构围绕着算力密度的演变来设计。
学习范式的跃迁
新AI还是一个学习范式paradigm的变迁。
传统AI即机器学习时代以规则驱动,其高级形态是人类专家设计的模型。
新Al的变革就是从这种规则驱动或模型驱动变成了大数据驱动,超大规模的数据喂给算法形成模型。
当前的趋势是进入到基于大模型的大算力驱动。单个模型的训练需要近亿美元的算力成本,极大的拉开模型的规模以及表示能力。
再往后展望,以大算力为基础的大仿真驱动。数据不再局限于物理世界时空约束,而是仿真数据,就是仿真和学习训练交替进行的一个自学习系统,进入全新的无穷的虚拟和真实物理世界边界模糊的境界,极大提升学习效率,催生超级巨无霸的智能体。
交流
Q1: 过去几年Al特别火,从外部的感觉来说,视觉这个赛道很卷,做的好像差不多,都在做智慧城市。在这种竞争情况,我很好奇怎样跟友商竞争?刚才您也说过毛利率低说明了产品的差异化不大,这种情况下,怎样去找市场,打出差异化战略?
A: 虽然很多AI公司毛利率很低没有充分体现技术价值,但也有高的。我们很重视技术差异化价值,并有不错的毛利率表现。假定智慧城市是热门的应用市场,真实的市场里往往有很典型的竞争者,只是不被外界经常比较。按照上图的行业格局图对应的有ICT通讯和计算公司华为,IoT端侧智能公司海康,云公司阿里,再往上才是热门的AI公司、各类行业系统应用公司以及集成商。他们以各自产品矩阵参与竞争,虽然擅长的产品供给不太一样,但或多或少都有AI能力。首要的竞争还是巨头间的竞争。创新势力需要找到合适的定位参与。回到行业格局图,包括有横向的,端侧为主还是云为主的演进路线的竞争,有纵向的,AI、云、基础硬件设施的主导价值竞争。按此分析各自优势,有很多行业史上的“合纵连横”案例供参考。
Q2: 您提到未来会出现超越人类智能的人造智慧体。怎么样在法律、社会,人类认知来接纳这样一个东西,或者说直接立法不允许这方面的工作,您是怎么看这个问题。
A:在顶级学术圈都出现了贫富差距,技术大阶跃设立了一个排他性门槛。假设这个趋势成立,什么样的环境才能应对这个挑战呢?治理的底层有个主导权问题。打个比方,倚天剑屠龙刀应该放在哪里?放在少林安全吗?少林有了倚天剑还能克制不作恶吗?这更需要政治和法律专家来解答。
Q3: 基于芯片制造工艺已经差不多接近物理极限了,摩尔定律受到了挑战。因为一个是量子的碎穿效应,一个是受硅的原子大小限制,这个会怎样影响Al算力的增长,然后怎么克服这个问题?
A:大师Jim Keller在新创业公司做的事情给了很好的解法,不以英伟达GPU的计算卡路线,也不只是享受制程演进的红利,而是基于强互联技术的一种可扩展的计算形态,例如上百万计算核心形成一个超级计算装置。这些架构上的变革对应着算法侧的超大模型的训练是全新的形态。特斯拉的Dojo系统也是很好的实践,最近的进展是令人兴奋的。
Q4: 我们是做量子加密技术的,直观上认为我们防的主要是量子计算机的威胁,但是我们认为可能Al模型更快把现有的密码学体系攻破。Alphafold没出现之前,搞量子计算的认为蛋白质折叠更应该量子计算机的菜,但是Alphafold把它解决得很好了。所以我非常关心从Al的视角来看,后面还有多少路可以走,就是能跟量子计算机能竞争多远。
A:量子计算我不是专家,不敢去比较。但分享不同于技术层面的感悟。新一代AI是一个超级无限大的大模型,完成了一个类似于条件反射的机理,条件反射意味着大脑没有思考,意味着是没有意识的智能体!这个感悟给人非常大的认知震撼。科学家一直有好奇心,研究大脑、智慧和意识。意识是确切的知道看见什么, 感受到什么, 思考着什么。但超级智慧的新物种只是应激性的反应,且在很多领域做出了超越人类智能的反应。在哲学层面上让人shock。基于这个感悟,瞬间理解了最前沿的DeepMind CEO Demis在访谈中提到的“大脑只是客观世界的一种仿真”,原来觉得这是挺玄幻的描述,现在理解起来是如此朴素。大脑是一种几十瓦能量约束下对客观世界的一种仿真。新AI是一个能量约束放宽千倍的另一种仿真。而且在很多领域,大部分人类的经验、直觉和创造开始显得没有价值,对人类意义提出根本的挑战。
Q5: 现在大家会觉得说这个模型变得越来越大之后,会有这种智能的涌现。现在看到的趋势会有Transformer架构一统天下的感觉。对于我们小机构来说,不是一个非常好的现象。可以训练大规模的模型,全世界有几家呢?在这种情况下,国内外最顶级的机构,该怎样发展呢?
A:这是一个现实的挑战,技术人才有集中化的趋势。大部分学术圈和工业界对比大模型的进展,算法模型和数学上的调整在结果层面都不够显著。从商业现实看,小公司不适合在最前沿探索。像DeepMind和OpenAI都没有完成商业化证明,是个非典型的“另类”存在。出路可能也得像他们的创立渊源一样,有中国智慧的Billionaire站出来捐助最前沿的探索。
Q6: AI从业者对Al都是有很多的热情。如果20年之后,人工智能没有走进每个人的生活,我觉得技术是停止进步的。如果您现在是OpenAI的CEO或者是Google的老大,不缺钱不缺算力的情况下,您怎么看10年20年之后,Al和智能的一个状态,跟人的engage会达到什么样的状态。
A:我觉得最简化的智能形态需要Energy Motor Sensor。生命之所以能演化出智能很重要的条件是会”动“,类似植物和动物的区别,不管智能体的智能水平高低,都有与外界的交互和规划能力。特斯拉其实已经给出了智能研究的路线图,先以自动驾驶的汽车为初级智能体形态,然后下一代智能体是直立行走的人行机器人,虽然比汽车自动驾驶更难很多,但相信他们基于最前沿的进展做了充分考虑后的节奏布局,未来五年会有巨大的进展。
— 完 —