首页 文章详情

【Dailyio 年终巨献】万字长文读懂 2020 全球 AI 领域的十大关键词

新智元 | 428 2021-01-04 15:30 0 0 0
UniSMS (合一短信)



  新智元推荐  

来源:Dailyio

作者:赵赛坡



写在前面

2020 年大幕即将落下,这场贯穿一年、横扫全球的疫情深刻改变了这个世界的走向,机器人与云服务需求激增、远程办公普遍化......这些上一年听起来还过于乐观的预测,如今几乎已经深入到各个行业,而另一方面,疫情让各国政府拥有更大的权力,面部识别、数据监控技术成为控制疫情的重要手段,同时也在重塑公众、政府与技术之间的新关系。

这篇长长的年终总结,我将通过十个关键词切入到 2020 年值得关注、跟进的行业事件,从 AI 抗疫到线上办公,从新基建浪潮到面部识别争议,每一个关键词背后都能延伸出一段长长的故事。

这些故事塑造了 2020 全球 IT 技术发展与产业变革的基本态势,而不管是地缘政治下的 AI 与半导体、还是 AI 创业机会与机器学习模型,抑或是失望的自动驾驶,2020 所发生的一切已然成为历史,这既是过去三十年计算软硬件、互联网高速发展后的必然,同时也在疫情造就的种种偶然中续写着新的线索,为接下来十年乃至三十年的发展埋下伏笔。

2020 年即将过去,我们一定会记住它。

AI 抗疫


将先进技术应用到对抗重大疾病的情形并不稀奇,2020 年,在对抗疫情的最前线,人工智能各种算法、各个形状的机器人的确扮演了重要角色。

但围绕 AI 抗疫,远不是「有效」或「无效」这么简单的判断,这些算法与机器人在医疗场景的大规模应用,留给行业诸多思考角度。

首先,至少在这一次,人工智能无法「击败」疫情。年初疫情初现的时候,从加拿大的 BlveDot 到波士顿儿童医院,这些机构都准确地预测到新冠肺炎疫情,而无论是 AI 诊断模型、阿里达摩院的 AI 算法还是百度的 Linearfold 算法,这些一度被认为可以快速击败疫情的 AI 技术现在看起来不过是人类异想天开的口号,站在 2020 年 12 月的时间点,《MIT 科技评论》十个月前的评论可谓最具见地:当下所有 AI 技术应用到新冠肺炎治疗的消息都是炒作,至少这一次疫情中,AI 不会拯救人类。

其二,AI 抗疫不仅是将 AI 应用到医疗领域,更是一场全社会人机协同的实验。当由 AI 算法驱动的诊断系统帮助医生快速诊断疫情的时候,另一些工厂里的协作机器人也在「抗疫最前线」,它们不是传统意义上追求快速、精确的工业机器人,而是与人类员工协同工作,同时还会监测员工之间是否保持社交距离。

其三,AI 抗疫应用的最大收获应该是明确 AI 技术在医疗中的局限性。如果说新冠肺炎是一场没有「预习」的考试,无法通过历史数据的喂养提升算法准确性,那么在一些慢性疾病的治疗过程中,AI 算法表现不佳的原因并不仅仅是技术问题,而是因为现实环境,比如医院网络条件不足,还包括护士操作不当,比如不按要求提取病人数据,所有这些都使得 AI 系统无法发挥真正的作用。更进一步,即便是在一家医院可以取得如实验室一样的成绩,换一家医院或者换一批操作人员,这个诊断系统的精准度还是会下降。

其四,AI 抗疫赋予政府更多获取公众数据的权力,2 月份新华网描述的浙江「大数据联防」场景随后不断在中国其他地方重复上演,各地方的「大数据联防联控」与最高决策者在《求实》杂志上的「命令」遥相呼应:「利用人工智能、大数据等新技术开展流行病学和溯源调查,提高精准度和筛查效率」。


云上的星球


「经此一『疫』,原本需要 3 到 5 年的数字化进程,将在未来 1 年之内加速完成」,阿里云智能总裁张建锋在 6 月的阿里云峰会上如是说道。

张建锋的这个判断也是 2020 年行业数字化的真实写照,全球的疫情催生了巨大的在线工作、教育需求,大量数字工具有了一夜成名的机会,最新一季的财报里,视频会议公司 Zoom 季度营收达到 7.77 亿美元,同比增长 367%,股价更是从 60 美元左右一度上涨到 600 美元,市值超过 1000 亿美元。

与此同时,微软 Teams 仅仅用了四个月就将日活用户数量提高到 4400 万;Facebook、Google相继推出在线协同与视频会议为主打功能的产品。

资本也在快速挤入这个领域,文档协作公司 Notion 更是在疫情最严重的 4 月完成 5000 万美元的融资,估值已经达到 20 亿美元,远高于上一轮融资后的 8 亿美元估值。

在中国,阿里巴巴钉钉与腾讯企业微信之外,字节跳动的飞书、百度的如流[16]成为新的变量,从内部沟通到协同办公,从企业内部管理到企业内外业务协同,疫情让中国办公软件迎来一次全新的爆发机会。


其次,在全球经济向线上迁移的时候,云计算巨头们成为最大赢家。一份来自 BVP 的云计算投资指数显示,2020 年云计算公司的股市表现跑赢了大盘。

云计算公司的营收数字也证实了这一点,AWS 连续三个季度营收突破 100 亿美元,最新一季营收 116 亿美元,微软最新一季度的公有云业务 Azure 与 Google Cloud 都实现了同比 45% 的增长。

在中国,连续增长的阿里云已经成为季度营收 20 亿美元的生意,过去的 2020 年,阿里云强化了钉钉的入口地位,将其与阿里云上的服务全面打通,喊出「云钉一体」的口号。

正如微软 CFO Amy Hood 对路透记者所言,疫情催生的「远程服务持续需求继续推动业绩增长」,无论是如 Zoom 这样的 SaaS 服务公司还是其他垂直行业的客户,云服务都是其维持业务并持续发展的重要技术支撑。总部位于韩国首尔的多云服务提供商 Bespin GLobal 的一组数字显示,Tiktok、Netflix、Slack、Zoom 等公司在云服务上的支出惊人,其中 Netflix 每年的云计算支出为 5 亿美元。

这意味着,全球云计算的增长还将持续下去,Gartner 给出的预测称, 2021 年全球云计算市场将增长 18.4%,达到 3049 亿美元,高于 2020 年的 2575 亿美元。

这更意味着,从 AWS、Azure、阿里云这样的云计算综合服务商,到 Salesforce、Workday 这样专注某领域的公司,依然可以去瓜分一个更大块的蛋糕。

其三,当全球经济的运转依靠云服务商,任何一次宕机都是对全球经济的巨大打击。云服务公司 Cloudflare CEO Matthew Prince 曾自豪地表示,「如果我们将云计算视为公共行业,你很难想象其他任何公共行业机构可以在使用率增长 50% 的情况下不宕机」。

Matthew Prince 指出了云计算的弹性、灵活扩容能力,但云服务并不意味着不宕机。今年北美地区感恩节期间,AWS 的美国东部数据中心出现故障,引发一系列连锁反应,大量使用 AWS 服务的软件公司(比如 1Password)、互联网公司(比如 Flickr)、电商平台以及媒体机构(比如《华尔街日报》)受到巨大影响,或是无法激活服务或是无法访问网页,由于此次故障发生在北美购物季的黑五前夕,对于亚马逊电商网站、使用 AWS 服务的电商平台以及众多支付平台来说,这都是一个噩梦。

过去十几年,以 AWS 为代表的云计算公司重新构建了一个绝对「中心化」的计算资源池,通过极其复杂的架构、流程,为各行各业提供计算资源服务(也就是通常所说的云计算),这个资源池的任何波动,也在深刻影响全球经济的发展,2017 年 AWS 一次长达 4 个小时的故障,让包括 Slack、Netflix 在内的众多业务瘫痪。

更重要的一点,计算资源「中心化」的趋势还在加速,来自卡内基梅隆大学的一份报告显示,仅以全球前 10 万个网站的 DNS 解析服务为例,Cloudflare、AWS 与 Godaddy 三家公司份额就达到 40%,这意味着,上述任何一家公司出现故障,都将对全球数字经济造成巨大影响。


面部识别


面部识别领域的争论从来没有停止,在过去的 2020 年,从公众到媒体再到政府机构,整个中国都开始严肃谈论面部识别。

李开复的一句「口误」道出了中国面部识别技术早期的诸多潜规则,而站在技术层面去看,面部识别本质上是一种基于计算机视觉的身份识别服务,与指纹识别无异,这是其技术层面的「纯真性」;更进一步,与其他身份识别服务类似,面部识别有着众多应用场景,你可以想象任何一个关于身份识别的应用里,都可以加入面部识别算法,这是其应用层面的普适性。

而随着「中国人脸第一案」一审宣判与包括天津在内的众多地方政府出台相关法规,2021 年围绕中国面部识别的讨论还会持续。

作为机器学习的重要应用之一,面部识别算法天然就有数据偏见,在美国,面部识别算法对于深肤色以及女性的偏见数不胜数,在中国,面部识别的数据也会和其他身份数据,比如身份证、户籍绑定在一起,构成一种「立体的偏见」。

负责 OpenAI 公共政策的 Jack Clark在一篇写给「2025 年世界」的文章[28]里警告,机器学习在抗疫过程里的应用,特别是在监控领域的应用,将强化政府的监控权力,这其中,面部识别技术又是监控的利器。

这也构成了观察科技公司如何平衡出售面部识别技术与「帮助政府监控」的切入口。过去的 2020 年,IBM 已经公开表示将退出面部识别市场,不再研发与销售相关软件与服务;亚马逊宣布停止向警察部门销售面部识别产品 Rekognition 一年;几乎同时,微软表示,在全国性监管法律出台前,不会向警察部门出售面部识别技术,此前,微软已宣布不再投资面部识别创业公司。

面部识别的「反抗」也从未停止。法律层面,英国法院的一项判决[33]指出,英格兰与威尔士警方使用面部识别技术「违反人权」;美国华盛顿州通过的一项法律[34]意义重大,它是当下美国各州最详细也是最严格的面部识别监管法律,微软在这项法律制定过程中扮演了重要角色。

而来自芝加哥大学的研究者们开发了一个名为「Fawkes」的工具,通过改变用户上传面部图像的某些像素(人类不可见),从而实现不被面部识别系统识别的目的,根据媒体给出的结论,其「误导率」可以达到 80%。


新基建与 BAT


「新基建」是中国企业的狂欢,也是中国企业的政治任务。李彦宏表示百度会在国家的「新基建」战略中继续扮演好平台型公司角色;张建锋称,将把阿里巴巴 20 年建设的技术能力带给全社会,帮助政府和企业建设面向未来的新型基础设施;汤道生坦言,数字化新基建,解决了数据的连接、交互和处理。5G、云、大数据和人工智能,将给产业升级带来更大的空间。

口号之外,上述三家公司也拿出了「真金白银」。阿里巴巴将在 3 年投入 2000 亿元,实现数据中心和服务器规模翻 3 倍;腾讯未来 5 年投入 5000 亿元,用于 AI、云计算、区块链等技术研发以及各地工业互联网基地建设等;百度未来十年加大云服务、芯片投入,预计到 2030 年,百度智能云服务器台数超过 500 万台。

抛开这些口号与数字之后,围绕科技巨头的「新基建」,还有若干个值得关注的方面,其一,新数据中心分布与规模。从云计算到边缘计算再到量子计算以及生物计算,数据中心始终是这些计算形式的物理载体,同时数据中心又是一个重投入、高成本的领域,因此观察 BAT 等公司的数据中心建设以及规模大小,将成为判断其是否真正投入「新基建」的重要标准。

其二,AI 芯片。阿里云去年发布基于 RISC-V 的含光 800 推理芯片,百度发布基于 FPGA 的昆仑芯片,华为此前也推出基于 ARM 架构(华为官方称为「达芬奇架构」)的昇腾系列芯片,这些不同架构的 AI 芯片,一方面展示了中国 AI 芯片的研发实力,更是当下 AI 芯片领域多样性的集中体现,到底什么才是 AI 芯片的真正样子,或许各家还有不同的看法,这也是未来 3 到 5 年的重要看点。

其三,国内云计算的厮杀将持续激烈。2020 年腾讯云首次入围[40] Gartner 魔力象限,成为中国第二家云计算公司,借助国内「新基建」的政策红利,从阿里、腾讯到华为以及百度,无论是阿里云的三年 2000 亿元投资还是腾讯云的五年 5000 亿投资,无不是聚焦国内,7 月的阿里巴巴财报分析师会议上,阿里巴巴 CEO 张勇强调了中国云计算市场的潜力:「中国目前的云业务规模只有 150 至 200 亿美元,美国要大 8 倍,中国市场仍有很大发展空间」。

这也为未来中国云计算市场的中盘厮杀吹响了号角,而阿里云也与腾讯云在武汉进行了一番「较量」。

量子计算


2020 年 10 月,最高决策层集体学习量子计算引发诸多关注。两个月后,随着中国成功构建76 个光子的量子计算原型机「九章」,关于量子计算的讨论进入到一个新的阶段。

首先,必须承认「九章」的重要意义,包括 Sceince、Nature 对知名科学期刊都对其做了大篇幅报道。

该项目由中科大潘建伟、陆朝阳团队与中科院上海等多个研究机构合作共同完成。在计算玻色采样问题中,九章花费了 200 秒处理完 5000 万个样本,如果以现在的超级计算机计算能力来计算,处理这些样本需要 6 亿年,从而实现了量子计算的优越性。

其次,量子计算本质上是一种计算形态,也是一种不同于传统或经典的计算形态,借助量子比特的特性,可以满足更多场景的计算需求,比如经典的大数分解算法,只能通过量子计算的形式才能完成。

从这个角度理解,量子计算体现了人类对于更多形态计算与更大算力计算的追求,此前业界也将量子计算机可以解决经典计算机无法解决的问题的时刻称之为「量子优越性(量子霸权)」,今年的「九章」与去年的 Google,都是从不同维度展示了量子计算的潜在力。

其三,必须看到,整个量子计算还处在非常早期的阶段,一方面,需要长期的资金投入,这也不难为何国内外量子计算的玩家们主要是科技巨头,诸如 IBM、微软、Google、阿里巴巴、华为等,而此次最高决策层所透露的信息,也将刺激更多的公司、研究机构加入量子计算的研究中,接下来的投融资趋势变化很值得关注。

另一方面,过去一年多来,很多公司已开始探索依托量子计算的产品落地。2019 年,AWS 推出量子计算云服务,但这项服务目前更像是一个「平台/集市」,其向开发者、企业提供的是第三方量子计算公司的产品。

2020 年,Google 将量子计算与机器学习结合起来,推出 TensorFlow Quantum;微软目前也有自己的量子计算云平台 Azure Quantum,并拥有量子编程语言Q#、开源的量子开发工具包等。

百度在 2019 年的时候发布了云上量子脉冲系统「量脉」,今年又在其深度学习开源框架飞桨中集成了量子计算开发工具「量桨」。

上述这些产品所展示的,依然是一副技术发展的前期模样,由于缺乏真正的落地应用,更多还是利用量子模拟探索各种可能性,并通过一系列的论文吸引更多人才和客户的注意,进而形成品牌效应。最近的一个案例,IBM 在量子计算领域有一份野心勃勃的计划,9 月的时候,IBM 发布了一幅份路线图提及,该公司相信在 2023 年年底,可以构建 1000 量子比特的量子硬件。

但如果向前看,整个领域还有诸多难题,需要相当长的一段时间才能实现真正的突破,更需要企业、学术机构以及政府的通力合作——一如第一代经典计算机的研发过程一样。此前,美国联邦政府已经宣布将在未来 5 年投资 6.25 亿美元用于量子计算基础研究,中国未来将发布怎样的量子计算支持计划,很值得关注。

地缘政治下的 AI


相比于疫情,人类不同群体之间的利益冲突,显然更具破坏性。

香港国安法正式施行后,2020 年中美互联网公司在香港运营模式也在发生变化。微软[53]、Google、Facebook、Twitter 相继宣布不再回应来自香港当局的数据访问请求。与此同时,短视频应用 TikTok 也宣布退出[55]香港市场。

在人工智能领域,中美欧(盟)之间进入到一个新的博弈阶段,这其中,「限制技术出口」成为关键词。

随着第十三届全国人民代表大会常务委员会第二十二次会议通过《出口管制法》,人大常委会法工委经济法室主任王瑞贺说了这样一番话:「除传统的军民两用物项、军品、核外,还参考对外贸易分类标准,将其他与维护国家安全和利益、履行防扩散等国际义务相关的『货物、技术、服务等』均纳入管制物项」。

结合此前中国商务部与科技部联合发布的新版《中国禁止出口限制出口技术目录》,已覆盖语音、图像、人机交互等几乎主要的人工智能技术领域,这也意味着,如果按照这样的规定,中国各色人工智能企业以及各种标榜人工智能的产品,必须考虑如何进入「内循环」的发展阶段。

在欧洲,欧盟委员会也计划推出一项技术出口管制清单,旨在限制各成员国对于包括间谍软件、面部识别这类「两用型」技术的出口。

当下对中国人工智能发展状况的解读,往往被放在中美技术对抗的大环境下,很多分析充满了冷战思维,因此需要首先破除对于中国人工智能产业之上的「神秘色彩」,比如海外经常提及的中国 2017 年开始部署 AI 国家战略就是一个误读,2017 年发布的「新一代人工智能发展规划的通知」,更像是一个对此前各地方政府相关工作的认可,并从国家政策层面予以更多的支持。

其次,对于中国 AI 实力的描述,一定要放在特定的场景或条件下讨论,比如,如果讨论学术论文,那么需要看到中国 AI 学术论文数量增长并成为世界第一背后的论文质量,任何把一个宏大命题简单化的做法都是不理智的,更何况很多时候「人工智能」像是一个「麻袋」,里面装满了各式各样的技术。

还有一些美国媒体热衷于把国家间的 AI 竞争描述为「AI 军备竞赛」,且不说「军备竞赛」的说法是否合适,有一个显而易见的问题:如何衡量国家的 AI 能力优劣?

知名智库 Tortoise 通过一份全球 AI 国家指数给出了可能的理解角度,从实践、创新与投资三个方面梳理了全球主要国家的 AI 能力,总体上看,美国、中国、英国、加拿大、以色列位列前五,如下图:

半导体之大变局


2020 年的半导体领域迎来诸多新变化,地缘政治催生的中国半导体「自给自足」趋势与产业「分久必合」的背景遥相呼应,与此同时,机器学习的巨大算力需求,也在刺激专属芯片的快速发展。

就在刚刚过去的这个周末,美国商务部将中芯国际列入贸易实体清单,这也为 2020 年中美半导体技术封锁与反制画上了一个休止符,整个 2020 年,中国各地注册成为半导体的公司数量激增,下图是 FT 根据企查查的数据整理而成。

与此同时,伴随着中国首个芯片大学南京集成电路大学成立与集成电路或纳入「十四五」国家专项规划同时呈现的,还有一大批上一次「半导体热潮」留下的烂尾项目,无论是位于武汉市东西湖的弘芯还是位于陕西西咸新区的坤同半导体,过去几年大量低水平重复建设的项目,所谓产业发展变成了投资变现,而无论是技术研发、知识产权还是人才培养,过去几年的发展几乎可以忽略不计。

与过往的半导体热潮不同,此次中国半导体行业发展的每一个细节,都被放在了中美技术对抗的聚光灯下,被全球各个媒体/智库分析解读,或也是各地政府重要的「政治任务」。在这样的背景下,一些客观存在的事实逐渐失真,比如中国大陆半导体产业的行业位置,德勤的一份报告给出的以下一组数字:

而亚洲地区前十大半导体公司,只有两家中国大陆公司入围,这两家公司也是大家熟悉的(华为)海思和中芯国际。

其次,根据多个数据源的统计,未来十年亚洲地区的半导体产业,特别是中国,将迎来巨大发展。

与地缘政治影响下的半导体发展态势相呼应,2020 年的全球产业格局,进入到一个「分久必合」的新阶段,过去这一年,已经有四起超过 100 亿美元的并购:
  • 7 月,Analog Devices 209 亿美元收购 Maxim;
  • 9 月,英伟达 400 亿美元收购[69] ARM;
  • 10 月,AMD 350 亿元收购 Xilinx,Marvell 即将以约 100 亿美元收购模拟芯片及光学芯片厂商 Inphi;

事实上,早在今年 9 月,半导体领域的并购金额已经成为过去七年里第二高的年份,现在计算一下,2020 年已经第一了。

这些动辄百亿美元的并购,也将半导体行业推入赢家通吃的新阶段,由于研发费用的不断上涨以及快速变化的市场趋势,这个领域传统意义上的增长基本停滞,并购成为巨头们全新的增长方式,包括英伟达、AMD 在内的巨头通过收购扩大自身产品线,快速构建更具覆盖性的产品组合,满足不同客户的需求。

具体到英伟达收购 ARM 的案例里,还有一个非常奇特的景象。ARM 的特殊性——几乎所有的英伟达竞争对手都需要 ARM——使得即便是英伟达的竞争对手,站在行业发展的角度,也「真心希望」英伟达可以尽快完成收购并实现更好的产品整合而在公司竞争的角度去看,整个半导体行业都不想看到这笔交易可以成功,这必然将造成英伟达一家独大的行业地位,进一步挤压其他竞争对手的生存空间

但也需要注意一点,随着地缘政治越发影响到科技行业,半导体领域的并购显然已经被纳入到国家竞争的重要环节,2016 年,高通宣布以 440 亿美元收购荷兰公司恩智浦,但中国监管部门并没有批准该交易,最终也使得这笔巨额收购不了了之,而在 2020 这个特殊年份,英伟达、AMD、Marvell 的收购能否成功,明后两年才会见分晓。

理解半导体产业变局的另一个维度是 AI 芯片的崛起。

过去几年人工智能的高速发展,催生了巨大的算力需求。结合 OpenAI 此前的报告,业界最领先的 AI 模型,对于算力的需求几乎每 3.4 个月翻一倍,作为对比,摩尔定律「规定」的 CPU 算力增长速度为每两年增长一倍。

这意味着,如果要训练高质量的机器学习模型,无论是采购英伟达 GPU 还是租用云服务商的 GPU/TPU 计算实例,都需要花费大量的金钱,这对很多科研院所以及学校来说都是一个天文数字。

在最近发布的一份报告里,MIT 的研究者们指出,如果无法在算力上实现新的突破,那么当下包括自动驾驶、翻译、计算机视觉等技术的落地将受到重要影响。

为 AI 计算提供专属芯片无疑是潜在的解决方案,如何理解通过专属 AI 芯片来处理 AI 需求,兴瀚资本创始人杨歌说过这么一番话:

目前人工智能芯片和边缘计算的基础还不是非常成熟,在不成熟的基础上做软件、场景、算法或应用,就相当于在不成熟的地基上搭建空中楼阁。这就像是最早在移动梦网上开发游戏和软件的公司,因为移动梦网的底层不行,最后这些公司都会死掉,会被移动互联网所取代。

目前的情况是,所谓 AI 芯片并没有专属定义,既有 GPU,也有 IPU,还有 TPU、FPGA 等等,全球范围内,从巨头到创业公司,都在挤入这个领域。这其中,英伟达又是最具代表性的公司,过去的 2020 年,英伟达发布基于 7 纳米工艺、采用全新安培架构的 A100 系列 GPU,持续引领数据中心的 AI 模型训练与部署。

英伟达在 GPU 产品的研发速度也在创造一个新的定律,《华尔街日报[76]》称之为「黄仁勋定律」(黄是英伟达创始人)。如果你知道此前「摩尔定律」定义了过去 50 多年的计算能力发展轨迹,那么也应该理解这个定律的潜在价值,特别是在当下算力成为困扰 AI (主要是深度学习)发展障碍的大背景下,英伟达对于算力的探索对于整个行业意义重大。

与此同时,英伟达的大客户们——AWS、阿里巴巴、百度——也在加速自研 AI 芯片的进程。本月初的 re:Invent 大会上,AWS 发布面向机器学习训练场景的自研芯片 Trainium,官方表示其性能可以提升 30%,同时能将成本节约 45%,这个对比对象就是英伟达;而在上周,百度 CTO 王海峰也透露,该公司自主研发的云端 AI 通用芯片百度昆仑1,已实现量产和应用部署,同时下一代芯片也将在 2021 年上半年实现量产。

无论国内还是国外,AI 芯片的竞争还处在非常早期的阶段,在中国,阿里巴巴、腾讯已经虎视眈眈,国家战略与各地政策的推动,使得各色 AI 芯片创业公司不断「亮相」,比如睿思芯科、知存科技等,这些公司的主要资本推手里,不乏地方政府的影子,接下来的研发、部署与应用,还有诸多看点。

「越大越好」的机器学习模型


OpenAI 今年发布的超大语言模型 GPT-3 引发众多关注。根据其论文透露的信息,这个模型拥有 1750 亿参数,超过此前微软图灵-NLG的 170 亿参数的规模,成为目前最大规模的语言模型。

或许规模并不是一切,但当如此大规模的模型被应用到某些场景的时候,开始出现了一些新的变化。

一位开发者将「图灵测试」应用到 GPT-3 的模型里,其中有个细节让我印象深刻,开发者设计了一组美国建国前的总统是谁的问题,如下图所示:


这明显是一个不可能有答案的问题,但 GPT-3 还是给出了一组答案,这些美国「总统」,又是当时对于美国政治产生重要影响的人物,换句话说,这些人的确可能成为美国总统。


另一个开发者则将 GPT-3 应用到写作场景里,如下图所示,人类写了几行话之后,剩下的就交给了 GPT-3 来生成。


还有一个围绕医疗场景构建问答的尝试,结果其实也在意料之中,很多测试结果非常正确,但一些测试结果「非常错误」,这在医疗领域是无法容忍的结果,同时测试者也无从知晓为何会有这样错误的答案。

但所有围绕 GPT-3 的狂欢都无法忽略一点:GPT-3 与真正意义的智能无关

一方面,这又是一个堆积硬件与参数的胜利,其研究架构本质上没有脱离上一代 GPT-2 的架构(相关对比);另一方面,与其他模型相比,GPT-3 的潜在问题与挑战一点也不少(比如数据偏见),但不管是 OpenAI 还是一些开发者,都有意无意将这些问题忽略掉,这才是最大的问题。

GPT-3 的第二个争议则是为微软开辟了独家渠道。

在 2020 年 9 月的一项合作协议[88]里,微软成为除 Open AI 之外唯一一家可以获取 GPT-3 源代码的科技公司,正如《MIT 科技评论》一篇文章所言,Open AI 原本可以为人类谋福祉,但现在,它只会让全球最有钱的一家公司获益。

微软与 Open AI 的合作始于 2019 年 7 月,微软当时宣布 10 亿美元投资这家公司,我在当时的会员通讯里分析过微软的动机:

微软很缺一个对标 DeepMind(Google 旗下)的机构。坦率来说,微软的基础研究能力一点也不弱,其 AI 基础研究的机构和部分也是业内公认的「黄埔军校」。但微软的这些机构,包括微软研究院、微软亚洲研究院的研究成果基本局限在行业内的宣传,与 DeepMind 围棋 AI 横扫全球公共讨论有着巨大的差距,而 OpenAI 在这个领域拥有丰富的经验,此前他们对于 GPT-2 模型的舆论宣传,可谓相当到位。

相对于去年的 GPT-2,今年 GPT-3 的影响力更大,这也让微软去年的这份赌注增值不少,从而也给今年的「独家授权」做了做好的注脚。

但另一方面,微软获得独家授权的事实让所谓「AI 民主化」的宣传彻底成为一个口号。

GPT-3 这样一个超大规模语言模型的复杂度、所消耗的资金,远非一般公司、研究机构所能承担,在此前的模式里,尽管 Open AI 没有公开源代码,但开发者、小公司、研究机构依然可以将 Open AI 作为一家中立机构,通过调取 API 的形式做一些研究和开发,这是典型的「AI 民主化」实践,如今,当微软成为 GPT-3 背后的巨头,这个超大语言模型的中立性已经不复存在,在一个既当运动员又当裁判员的赛场上,微软要和不同领域的开发者、研究者一起「竞技」。

作为 Open AI 前创始人,伊隆·马斯克在社交媒体的这句话或许是一个预言:(这个合作)就是开放的对立面,Open AI 已经成为微软的俘虏。

GPT-3 带给行业的第三个影响,是不断验证「模型越大性能越好」的行业规律。在由两位英国投资人 Ian Hogarth、Nathan Benaich 制作的 AI 行业报告「State of AI[92]」里,「big-model world」已然成为行业方向:

Google 今年也有两个超大规模机器学习模型,「Multilingual T5」是一个超大规模跨语言的文本 transformer 模型,这个模型在一个支持 101 种语言的数据集上进行预训练,目前拥有 130 亿参数,在多个测试基准种有较好的表现;「Conformer[94]」则是一个超大规模语音模型,该模型在语音测试的单词错误率环节仅有 1.4% 错误率,整个模型的参数高达 10 亿个,研究者使用 3 万多个小时的音频数据进行预训练,整个预训练过程持续 4 天,借助 512 个 Google Cloud 的 TPU V3 超强算力完成。

上述这些模型的确展示出一种趋势:通过超大规模的参数以及巨大的算力,有望在语音、文本与图像领域实现新的技术突破。

从模型最后的表现来看,「越大越好」的结论的确成立,但也带来一系列更大的问题:这些模型既是「烧钱机器」也是「能源消耗机器」,如下图所示。

更进一步,超大规模的模型与巨大算力的需求,凸显出机器学习领域开始被「安迪比尔规律」左右,一如当年 PC 时代的英特尔处理器与微软操作系统之间的互动一样,机器学习的硬件突破,特别是计算能力的突破,很快就被更大规模的模型所消耗,从而推动计算硬件进入下一个发展周期。

但显而易见的分裂也在这个领域出现:一方面学术领域热衷超大规模机器学习模型的研发,另一方面,工业领域的机器学习应用,却在不断探索模型缩小、剪切的可能性,所谓「Too big to deploy」就是这个道理。

AI 的「秋天」


在经历了一轮又一轮的巨额融资后,2020 年的 AI 创业公司们进入到一个实实在在的生意场。站在一个生意的角度去看,AI 创业公司需要应对三大挑战:云服务成本、人类的位置与成本以及 AI 领域的「长尾效应」。

这其中,云服务成本最值得警惕。云服务的确可以帮助 AI 创业公司快速完成机器学习模型的搭建与部署。

但也隐藏了众多「套路」,比如,整个机器学习模型训练所需的计算、存储、网络资源非常高,这也是一个巨大成本,FT此前的一篇报道称,创业公司在云上的花费,为 AWS、微软贡献了巨额收入。与此同时,云服务的隐形成本还包括机器学习模型在云服务商不同区域的迁移,以及在不同云服务商之间的迁移等等。

更重要的一点还在于,困扰整个 AI 发展的算力问题,短期来看几乎只能靠钱来解决,摩尔定律已经失效,而 OpenAI 指出的巨大算力需求与英伟达单个 GPU 实际算力提升之间形成了鲜明的反差。

或许会有人说,分布式计算就是为了解决这个难题而出现的,不过正如投资公司 a16z分析师所言,这个方案解决的是速度,而不是成本。创业公司对于分布式计算的迷恋,无异于「财务自杀」。

另一个不能忽视的成本就是人力成本。过去几年时间里,媒体热衷于报道哪家公司年薪百万招募机器学习博士,但很少听到哪家 AI 公司为获得人类标注数据所付出的成本,a16z 给出的数字显示,这部分成本占据了企业营收的 10%--15%。最新的一个佐证是,在被誉为中国 AI 明星创业公司旷视科技的招股说明书里,「数据标注」人员占公司全员的比例为 17%。

这也可以解释为何数据标注已然成为一个巨大的产业,利用中国天然的劳动力优势,中国数据标注产业的发展势头也非常凶猛。

第三个潜在挑战,AI 创业领域的长尾效应会「杀死」创业公司。机器学习/深度学习与软件工程一样,都是需要迭代与实验,但与软件工程不同,整个人工智能更侧重实验,也就是说,需要不断测试模型在新数据上表现,然后不断重复。如果创业者花大量时间去调整模型的参数,很容易进入到长尾分布的「尾」,即便你的模型足够好用,但因为其客户群体过小/需求过于分散,也无法支撑其未来的业务发展。

投资公司 a16z为此提出了几个建议,比如通过整合数据管道降低数据成本,利用构建自己的基础设施平台减少对于云服务的需求,这两个方面可以为 AI 创业公司节约大量资金,剩下的就是进一步压缩机器学习模型,并在不断训练中提升模型精度。

如果说 AI 创业公司的价值会通过所谓估值来体现,那么在更大的层面,作为行业观察者,或者作为普通读者,又该如何衡量一家 AI 创业公司的价值呢?我个人提出了三个判断角度:
  • 关注这些产品背后的具体技术,到底是机器学习?深度学习?还是监督(非监督)学习?越具体的技术越能体现其价值;

  • 一家 AI 创业公司的竞争优势在于技术是否领先以及对于行业的认识,前者看论文,后者侧重场景;

  • 在 2C 与 2B 中选择 2B,一个案例,「AI 换脸」作为 2C 产品,其价值以及估值局限在社交产品领域,而在后端提供「AI 换脸」技术的 2B 创业公司,比如商汤,则可以称之为「图像领域的 AWS」(技术基础设施提供商),价值与估值显然不同。

尽管在 2020 年已经有大量 AI 公司完成或正在完成 IPO,但在另一个维度去看,被收购或许也是 AI 创业公司的最好归宿,Bloomberg发现,科技巨头一直没有放松对于 AI 创业公司的收割,而创业公司与投资人也乐于这么做。

Bloomberg 援引 CB Inishgts 的一组数据显示,仅在 2019 年,就有 231 家创业公司被收购,而在 2014 年,这个数字仅为 42 家。

过去的 2020 年,苹果继续在 AI 领域买买买。公开资料显示,苹果在 2020 年先后收购了机器学习创业公司 Inductiv、计算机视觉公司 Vilynx,前者可以有效提升机器学习模型的数据「纯净度」,后者主要提供计算机视觉与内容识别技术,或为苹果正在秘密研发的「苹果搜索」增加更多技术支撑。

五年多的时间里,苹果已经在 AI 领域收购了多家明星创业公司:

  • 2015 年,收购图像 AI 创业公司 Perceptioin;
  • 2016 年,收购机器学习(偏预测分析与推荐引擎)创业公司 Turi 以及印度创业公司 Tuplejump;
  • 2017 年,收购德国的眼球追踪创业公司 SensoMotoric;
  • 2019 年,收购内容发现创业公司 Laserlike;

根据苹果一贯以来的收购策略,当一家创业公司被收购后,苹果会将其关闭,所有技术和人员整合到苹果现有部门里,所有技术也都将以产品化的形式展现出来,这也是苹果特有的机器学习战略。

从 AI 创业公司面临的挑战到中国多家 AI 创业公司 IPO 后的表现,当下很多 AI 创业公司更像是一个服务公司而不是软件公司,换句话说,「你可以代替某些服务公司,但无法代替服务」。

这意味着,当 AI 创业公司以服务公司做对标的时候,AI 创业公司的估值与增长空间已经被限定,至少在硅谷,软件/技术公司的估值为其营收的 10-20 倍,而服务类公司只是 2 倍。

这也抛出了另一个问题:是不是即将迎来又一个「AI 冬天」?我的结论与今年 6 月出版的《经济学人》判断一致,这个时期更像是「秋天」,无论资本市场还是国内外的巨头公司,正在更理性地看待 AI 技术与产品,同时也在评估其对于未来行业发展的影响。

所有这一切都在展现一个事实:AI 创业公司的热潮已经过去了。


失望的自动驾驶


2020 年的自动驾驶继续延续着前几年「小步快走」的节奏,在全球疫情的持续影响下,这个行业正发生一系列深刻变化。

其一,资本集中。Alphabet 旗下的 Waymo 可以在 60 天内获得两笔[106]共计 30 亿美元的融资,除了彰显出资本市场对于 Waymo 的持续看好,更凸显了资本向头部公司倾斜的趋势,市场对于自动驾驶、AI 等技术的部署难度已经有了更清晰的认知,从而也促使他们减少对于创业公司的巨额投入,转而支持已经成为巨头的所谓「创业公司」。

与 Waymo 以及再获软银融资的滴滴自动驾驶业务形成鲜明对比的,还有自动驾驶卡车创业公司 Starsky Robitics 关闭的消息。

其二,并购重组加速。亚马逊正式收购Zoox ,收购后的 Zoox 继续保持独立运营,这笔传闻12 亿美元的收购,展现了亚马逊对于自动驾驶的野心。

Uber 也在年底将旗下的自动驾驶业务出售给另一家自动驾驶公司 Aurora,交易细节显示,Uber 不仅将旗下 1200 名员工「转移」到 Aurora,还会向该公司投资 4 亿美元,同时两家公司建立战略合作伙伴关系。

尽管 Uber CEO Dara Khosrowshahi 表示,未来几年将让 Aurora 自动驾驶车辆进入 Uber 平台,不过这个表态有太多自我安慰的意味,持续的烧钱投入与无法短期突破的技术,成为摆在 Uber 以及整个自动驾驶行业的难题。

其三,车厂与自动驾驶供应商结盟。福特与英特尔旗下 Mobileye 合作、大众旗下的卡车公司 Navistar 与自动驾驶公司图森合作、克莱斯勒与 Waymo 合作、戴姆勒与芯片巨头英伟达合作,所有这些「车企+技术公司」的合作形成一个个利益体,比如当 Waymo 与克莱斯勒签署一份排他性协议的时候,原来与克莱斯勒合作的 Aurora 也失去了一个大客户。

其四,自动驾驶车辆上路。当 Waymo 等多家自动驾驶公司扎堆凤凰城的时候,一大批中国的公司也在中国各地开启了自动驾驶出租车业务。

6 月, 滴滴在上海开放自动驾驶试乘体验,到 10 月的时候,百度 Apollo Go 已先后在长沙、沧州、北京试点自动驾驶出租业务。

从媒体的评测来看,目前的这些自动驾驶出租车更像是「一辆特定区域内的区间摆渡车」。但需要看到的是,自动驾驶的现状远不能满足用户与市场的期许,而包括百度在内的公司有意无意地释放出类似「自动驾驶出行即将改变彻底世界」的营销口号,势必进一步扩大自动驾驶理想与用户现实体验之间的鸿沟,这对整个行业的健康持续发展并不是一件好事。

更重要的一点,无论是 Waymo 还是百度、滴滴,其商业模式不过是自动驾驶发展路线的一种,就在社交媒体不久前广泛讨论 Waymo 将如何影响自动驾驶发展的时候,伊隆·马斯克发推说道:

Waymo is impressive, but a highly specialized solution. The Tesla approach is a general solution. The latest build is capable of zero intervention drives. Will release limited beta in a few weeks.

2021 年的自动驾驶或许还将伴随着失望与惊喜的情绪,但在众多「寻找中国特斯拉」的资本助推下,新能源汽车或未来汽车、自动驾驶之间的结合,还会持续推动行业进入到一个新阶段。

尾巴:没有预测


到这里,我用 13000 多字回顾了一段属于 2020 年的历史,在此前的任何一个年末,或许可以从有章可循的技术发展与可追踪线索的产业变化里预测接下来的一年,但经历过这一年后,任何看似理性的预测都显得极其愚蠢。

尽管 AI、云等技术的确深刻影响行业变革与经济发展,但疫情、地缘政治为所有的生意投下了巨大的不确定阴影,所谓的「新常态」,也是在诸多不确定性中寻觅一点点确定的事情,至少目前来看,唯一可以确定预测的事情就是:整个世界再也无法回到疫情之前的样子。

一百年前的 1920 年,一战与「西班牙流感」冲击了整个世界,这一年当选美国总统的 Warren Harding创造了一个词「Normalcy」,他希望人们忘记战争与疫情的痛苦,回到「常态」,后面的故事里,1920 年代的世界,就像脱缰的野马,它没有回到任何一个过往「常态」,而是进入到另一个艺术、工业发展的「黄金时代」。

那么 2020 年代呢?

附:文中参考链接较多,如有需要,请点击阅读原文查看




 
推荐阅读:
开源项目在GitHub上贡献33.5W个Star!腾讯的十年「云」答卷,请收好!
「2020中国AI算力报告」重磅出炉:中国怎么解决GPT-3的算力难题?




good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter