曾推出阿尔法狗的DeepMind,为什么没能做出ChatGPT?

在几乎所有人都将目光瞄向发布了ChatGPT、GPT-4的OpenAI时,网络上关于DeepMind的讨论却相对较少,那么这家可以与OpenAI互为人工智能领域的“镜像”的公司,经历了怎么样的发展历程?一起来看看本文的分析。

今年1月,一则裁员消息悄悄发布——谷歌旗下人工智能公司DeepMind将关闭位于加拿大埃德蒙顿市的办事处,并解雇英国办事处部分从事运营工作的员工。 DeepMind的裁员消息几乎没有在互联网上激起任何水花,那时候全世界AI从业者的目光,都被另一家人工智能公司OpenAI发布的ChatGPT吸引走了。

是人工智能的一对镜像

两者有太多的相似点——他们最初都定位为非营利组织,却双双困于造血难题而投向科技巨头(前者投奔谷歌,后者投奔微软);他们的天使投资人都包含埃隆·马斯克;都推出过震惊世界、足以载入史册的AI产品(前者是AlphaGo,后者是ChatGPT);也都怀抱着通向通用人工智能(AGI)的梦想与野心。 论资历,DeepMind比OpenAI成名更早。在OpenAI刚刚成立的第二年(2016年),DeepMind就已经凭借围棋机器人AlphaGo一炮走红;2020年,DeepMind更是凭借人工智能预测蛋白质工具AlphaFold,攻克了困扰生物学界50年的难题。

尽管人们管理着良好的电话营销数据库,但他们始 目标电话号码或电话营销数据 终意识到记录需要不时更新和“清理”。这可确保不会联系到错误的受众(例如,通过错误的号码或过时的联系人联系到错误的受众)。在这种情况下,更新数据库会影响呼叫成功率和最佳销售机会。

ChatGPT出现前,人们都倾向于认为DeepMind才是更优秀的、也更接近AGI的公司。实际上,AGI这一名词,就是DeepMind创始人德米斯·哈萨比斯(Demis Hassabis)在十三年前首次提出的。 但是,OpenAI在今天抢走了舞台上所有的聚光灯。从ChatGPT到上周刚刚发布的GPT-4,OpenAI一跃成为全世界最受关注的AI创业公司,没有之一。 从过往的AI成果来看,DeepMind似乎才是更应该最先推出ChatGPT的公司。

但是,在OpenAI埋头研发GPT系列预训练模型的时候

DeepMind正忙着与谷歌“闹独立”。2015年,也就是在被谷歌收购的第二年起,DeepMind就开始酝酿一场分裂计划“Mario”,并一直持续到2021年。 这场分家戏或许耗费了太多精力。如果不出意外,DeepMind的命运可能就在今年1月的裁员中,继续坠落低谷。 就在这时,ChatGPT横空出世。微软与OpenAI联手在全球发起了一场AI大模型革命,从搜索引擎到办公软件,向谷歌发起冲锋。 谷歌被迫反击,仓皇推出聊天机器人Bard,但只因犯了一个ChatGPT也会犯的事实性错误,便一夜带走了千亿美元市值。

谷歌似乎此时才意识到自己手中还有DeepMind这张牌。2月底,谷歌宣布将旗下专注语言大模型的“蓝移团队”(Blueshift Team)正式并入DeepMind,旨在共同提升LLM能力。蓝移团队隶属于谷歌研究,和谷歌大脑实验室同等级。消息一出,DeepMind的科学家们在推特列队欢迎。 被遗忘的DeepMind,正在回到大模型的舞台中央。 今天,OpenAI的巨大成功掩盖了DeepMind昔日的光辉,但也恰恰因为OpenAI,DeepMind才有机会重拾辉煌。而这背后,微软与谷歌才是这场权力游戏的操盘手。 一、一桩各怀心思的收购案 2016年5月,新官上任仅数月的谷歌CEO桑达尔·皮查伊(Sundar Pichai),在谷歌I/O开发者大会上发出了谷歌的AI宣言:谷歌将成为一家“人工智能优先”(AI-first)的公司。

目标电话号码或电话营销数据

在此之前,“谷歌”这个名字已经成为搜索的代名词——21世纪头十年的技术狂欢,是属于搜索引擎的。 从1999年一家名不见经传的创业团队,到击败微软、雅虎以及一众搜索引擎公司,谷歌在十年内登顶搜索引擎的霸主宝座,并逐渐拉开一幅收购版图。截至2020年,谷歌已经收购了超230家公司,几乎覆盖了信息技术所涉及的一切。 2011年,谷歌的第20号员工,被无数程序员奉为“神”的杰夫·迪恩(Jeff Dean),成为将谷歌带向AI世界的关键人物。

天,迪恩和吴恩达在一个活动偶遇

吴恩达告诉迪恩:“最近正建立‘神经网络’的实验……而Google X(秘密实验室)正在做的‘Project Marvin ’已经取得了一些惊人成果。”彼时,第三次人工智能浪潮已经在硅谷悄然而至,“深度学习”正是此次浪潮的主题词。之后,Google X便联合斯坦福大学 如何在Messenger中建立沟通,让沟通变得便捷 顺势推出了聚焦深度学习的项目“谷歌大脑(Google Brain)”。随后,迪恩带领谷歌大脑稳步前进,连续推出两代深度学习软件系统DistBelief和TenserFlow。 2014年,谷歌用一贯的收购方式寻找AI盟友——斥资6.25亿美元收购英国人工智能公司DeepMind。 那时的DeepMind刚成立4年,还是家名不见经传的小公司,人数不足100人。

但这家小小的公司背后,酝酿着一个名叫“AGI(通用人工智能)”的大梦想。 虽然直到今天,仍然少有人能清晰定义出到底什么是“AGI”,只是模糊地相信,AGI一定会掀起一场触及人类灵魂的革命。DeepMind创始人、CEO德米斯·哈萨比斯就是AGI最坚定的信仰者。 哈萨比斯深知AGI为人类社会带来无限想象的背后,有着难以预测的未知阴暗面——没人知道AGI到来后会是正义还是邪恶,人类又是否能真正掌握AGI的控制权? 在哈萨比斯看来,把这种不确定性降到最低最有效方法,就是让DeepMind保持独立,远离利益漩涡。但一个残酷的现实是,探索AGI投入巨大,且变现模式未知,这让DeepMind几乎走到破产边缘。 DeepMind濒临破产之际,谷歌和Facebook两大巨头双双投来橄榄枝。被大公司收购无疑能快速解决资金问题,却很可能会威胁到DeepMind的独立性。但哈萨比斯别无选择,活下去才是第一要义。 当时,Facebook有卷积神经网络之父杨立昆(Yann LeCun)坐镇,给了DeepMind更高的报价。

但面对DeepMind划出的一条条道德红线

Facebook打起了退堂鼓,谷歌则表现得十分包容。Facebook最终“输”在了格局上,错失DeepMind。 在正式收购的前一年,DeepMind要求谷歌签署了一份《道德与安全审查协议》。“审查协议”写明,DeepMind的AGI核心技术的控制权将交给道德委员会(Ethics Board),DeepMind的三名创始人均为委员会成员。 收购DeepMind后,谷歌大脑的不少员工并不理解公司的妥协。谷歌大脑更多是聚焦谷歌地图、语音搜索开发的实用派,DeepMind的AGI梦想在他们看来 销售线索 极其不切实际;更重要的是,没人知道DeepMind接下来还要烧多少钱,会烧多久? 其实,DeepMind内部也有一些员工反对谷歌的到来。他们认为,“自己是学者,在与谷歌打交道时,会与后者臃肿的官僚机构之间发生文化冲突”。

不过,被收购后,DeepMind还是尽力表现诚意。他们用算法计算出了一种方法,能够有效冷却谷歌数据中心的250万台计算机服务器。2016年,DeepMind表示他们已经将谷歌的能源支出削减了40%。 但在部分谷歌员工看来,这不过是一种言过其实的吹嘘,“他们只想拥有些公关资本,这样他们就可以在谷歌母公司Alphabet中宣称做出了贡献,并以此获得增值筹码”。 这些质疑并不冤枉,双方的合作中,谷歌确实是付出更多的一方。

2017年,DeepMind向Alphabet公司收取了5400万英镑相关费用。而DeepMind在2017年的亏损达2.82亿英镑,其中有2亿英镑用来支付员工薪水。 不过,虽然有诸多争议,DeepMind还是帮助谷歌赚足了眼球。 2016年3月,一场对弈载入史册——由DeepMind推出的围棋机器人AlphaGo,最终以4:1战胜了被誉为“不败少年”的韩国天才围棋手李世石。达闼机器人创始人、CEO黄晓庆感叹道:“AlphaGo的诞生是AI领域一次原子弹级别的爆发。” 中国围棋天才少年柯洁也曾高度评价AlphaGo:“感觉就像一个有血有肉的人在下棋一样,该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出出自程序之手。” AlphaGo的横空出世成为全世界的头条新闻,也让蛰伏6年的DeepMind终于破茧成蝶,但DeepMind掀起的AI革命才刚刚开始。 二、一个生物学界苦寻50年的答案 就在DeepMind团队带领AlphaGo从首尔凯旋第二天,便启动了一个名为AlphaFold的新项目。如果说AlphaGo证明了人工智能切实存在,那么AlphaFold的出现,才是真正印证了DeepMind的愿景——解决智能,然后用智能解决一切问题。 AlphaFold始于一个假设。

1972年,美国科学家Christian Anfinsen在发表诺贝尔化学奖获奖演讲时提出了一个著名假设

蛋白质的3D折叠结构,完全取决于它的氨基酸序列。 曾推出阿尔法狗的DeepMind,为什么没能做出ChatGPT?|甲子光年 蛋白质是几乎所有药物的主要靶点,了解蛋白质结构,是解决某些疾病的关键步骤。但蛋白质折叠预测难于登天,自然界中的蛋白质能在几毫秒内自发折叠,不确定性极高。这个问题足足困扰了学界50多年,无数专家学者试图证明该假设,弄清楚氨基酸序列和蛋白质3D结构之间的关系,但都走进了死胡同。 上世纪90年代,剑桥大学一位研究分子生物学的朋友告诉哈萨比斯,蛋白质折叠问题是人类最需要解决的问题之一。

当时,哈萨比斯正在做Theme Park(主题公园)等AI游戏,他隐约想到:等AI发展到一定阶段,说不定就可以用来研究蛋白质折叠问题。 直到2008年,一款叫Foldit的游戏让哈萨比斯看到了希望。 Foldit是一款由华盛顿大学等机构联合开发的蛋白质折叠游戏,玩得好的玩家能够运用自己的直觉和图形处理能力,找到正确的蛋白质折叠方式。一些由Foldit玩家破解出的重要蛋白质结构甚至还被发表到《Nature》杂志上。 曾推出阿尔法狗的DeepMind,为什么没能做出ChatGPT?|甲子光年 Foldit让哈萨比斯意识到,人工构建AI系统,让它具备能与某个领域资深专家相媲美的直觉,是完全可行的。于是,DeepMind在研发AlphaGo时首先借鉴了Foldit的思路,让AI模拟数位围棋大师的思维方式。AlphaGo成功了,他们又把类似的方法用在了预测蛋白质折叠问题上。 当时,CASP(一项全球范围的蛋白质结构预测竞赛)是让AlphaFold一鸣惊人的重要契机。 CASP自1994年开始,每两年举办一次。参赛选手需要从零开始预测一些新发现的、还未发表的蛋白质结构,这样能很好地避免机器学习可能出现的数据过度拟合等问题,DeepMind希望能对标CASP来评价AI的蛋白质结构预测能力。 2018 年,DeepMind带着AlphaFold参加了第13届CASP竞赛,首次把尖端机器学习技术运用到了结构预测领域,一举夺冠,而且预测准确率比往年冠军队伍高出近50%。

此次夺冠后,AlphaFold的开发者约翰·江珀(John Jumper)开始带领团队考虑继续优化AlphaFold,以进一步提高准确率,但他们很快发现在原有模型上调优的准确率已经达到天花板。这时,哈萨比斯叫停了他们的优化,让他们果断放弃原来的版本,在对蛋白质有更多生物和物理知识的基础上,重新搭建一套系统。 两年后,DeepMind带着从0开始的AlphaFold2再战第14届CASP竞赛,比赛上,AlphaFold2展现出了惊人的准确率——预测结果达到了原子精度,这是物理上的最高精度,中位数误差不到仅0.96埃米(约为 1 个原子的长度)。 就连AlphaFold的开发团队都惊叹于AlphaFold2的预测结果,竟能如此完美地契合真实的蛋白质结构。CASP的主办方告诉DeepMind,这已经可以和实验室方法媲美,甚至可以供科研人员所用。

“那一刻,我知道我们改变了科学史”

江珀说。 哈萨比斯也非常看重AlphaFold,他曾在演讲中表示:“AlphaFold就是我们的第一个大规模AI用例,它唤醒了科学界,让他们意识到AI可以做些什么。” CASP结束后,DeepMind加快步伐,让AlphaFold在生物医药领域迅速释放价值。 2020年圣诞节前后,约翰·江珀团队预测了人体中所有的蛋白质结构,共2万种。2021年7月,DeepMind将这项成果及软件代码发表在了Nature上。根据生物医学研究目录PubMed的数据,2020年只有4篇论文参考了AlphaFold,这一数字在2021年增长到92篇,2022年增长到546篇,2023年将会有超过1000篇论文。 此外,目前已经有一些生物技术公司再使用AlphaFold2开发药物。 初创公司Insilico Medicine将他们的人工智能系统与AlphaFold一起使用,该公司CEO亚历克斯·扎沃龙科夫(Alex Zhavoronkov)表示,他的团队从找到药物靶点到设计药物并在实验室进行测试,只花了大约50天,不到100万美元,他认为这是药物开发一个记录。扎沃龙科夫的办公室还放着哈萨比斯的照片,在他看来,“AlphaFold是一个绝妙的发现,但它是一个巨大的乐高拼图中的一部分,你需要拥有这个拼图才能成功地将药物投放市场。” AlphaGo和AlphaFold让DeepMind赚足眼球。

不过,人们在谈起DeepMind时,始终还会加一个前缀——Google’s。 三、一场持续6年的分裂计划 一个DeepMind无从躲避的现实是——AlphaGo和AlphaFold的一鸣惊人,是谷歌用钱堆出来的。 在钱的问题上,谷歌给了DeepMind极大的包容。 公开数据显示,2016~2019年DeepMind共计亏损13.55亿英镑(约合18.38亿美元)。其中,2019年,Google Ireland还免除了DeepMind偿还公司间贷款和所有应计利息,共计11亿英镑(约合15亿美元)。加上这些,DeepMind亏损高达40亿美元,这让华尔街对谷歌意见颇大。 直到2020年,Deepmind实现收购6年来的首次盈利。

DeepMind在英国政府机构Companies House上的账目显示,2020年同比增长率超过300%,达到8.26亿英镑的高收入。 DeepMind并没有解释2020年收入大增的原因,但从DeepMind向政府披露的财务状况来看,其绝大部分收入订单都来自谷歌母公司Alphabet。自被收购以来,DeepMind一直向谷歌、YouTube出售软件,为谷歌数据中心做节能优化、提高安卓寿命电池设备,并与谷歌地图合作,以提高地图里“到达预测时间”的精确度,优化谷歌语音虚拟助手——和AlphaGo、AlphaFold相比,这些事一点也不“sexy”。 尽管如此,在Alphabet2020年第二季度财报电话会上,谷歌CEO桑达尔 · 皮查伊表示:“对我来说,最重要的是我们在公司层面达到了SOTA(最前沿的),并处于领先地位。我对谷歌和 DeepMind 的工程与研发团队的工作节奏非常满意。

但从谷歌的实际行动上看

却是另一种画风——谷歌一次又一次逼近DeepMind此前设下的道德红线,并逐渐收紧对DeepMind的控制权。 2017年7月,距离谷歌总部两英里的五角大楼硅谷前哨基地,13名美国军方人员和谷歌技术高管正在进行一次秘密会谈。 会后,谷歌和五角大楼达成合作,谷歌将帮助五角大楼“利用机器学习来改进无人机打击的精度”,合作被命名为“Maven”计划,将为谷歌母公司Alphabet带来数百万美金收入。 这个数目并不算大。

但对谷歌而言,这次合作更深层次的意义在于,未来有可能和五角大楼在云服务及其他技术领域形成长期稳定的合作,这将为谷歌带来一笔难以撼动的稳定收入。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注