北京时间 6 月 19 日消息,在人工智能 (AI) 争夺战中,马克 扎克伯格 (Mark Zuckerberg) 起了个大早,却赶了个晚集。现在,他正在做一件自己并不喜欢的事情:追赶。
早在十年前,这位脸书创始人就看到了 AI 的前景,并砸下重金来推动自家 AI 的开发。他聘请了 AI 早期远见者之一、有“AI 教父”之称的杨立昆 (Yann LeCun) 来领导这项业务。然而现在,就在 OpenAI 的 ChatGPT 进入消费者市场几个月后,Meta 却在相同的技术上落后了。
十年的先发优势
(资料图)
2013 年,脸书 (现在更名为 Meta) 开始投资 AI。扎克伯格和当时的首席技术官迈克 施罗普夫 (Mike Schroepfer) 曾亲自出面,寻求聘请一位 AI 领域的领军人物,以领导公司的一个新研究部门,推进 AI 的开发。他们找到的这个副手是纽约大学教授杨立昆,后者在 AI 领域取得了享有盛誉的突破性成果。
杨立昆深入扎根于学术和基础研究,力主创造一种能够反映其优先事项的文化:雇佣科学家而不是工程师,强调学术成果,例如研究论文,而不是为公司的最终用户开发产品。知情人士称,多年来,这一战略使得 Meta 的基础 AI 研究实验室对顶尖人才极具吸引力,但也挑战了该公司将其技术成果进行商业化的能力。
在研究方向和资源分配上,Meta 鼓励一种分散的、自下而上的方法。知情人士说,研究人员各自推动自己的议程,在不同的方向上追求独立的项目,而不是在全公司范围内制定一个统一的战略。Meta 将硬件资源拆分成多个小块,分配到各个项目上。一些研究人员得到的计算机芯片超过他们需要的数量,他们会将这些芯片用于不必要的任务,以避免放弃它们。
与此同时,Meta 在为其数据中心配备 AI 开发所需的最强大计算机芯片方面进展缓慢。即使公司获得了更多的这种芯片,它也没有一个好的机制把它们送到工程师和研究人员手中。一些人说,有时会有数千件令人垂涎的昂贵硬件闲置在那里。
Meta 正在对其数据中心进行全面改进,这可能造成了一些运转不畅。根据 Meta 的一篇博客文章,截至 5 月份,Meta 最新 AI 超级计算机拥有 1.6 万个这样的芯片。
内部争斗
知情人士称,随着大语言模型在 2020 年开始展现出越来越强的能力,Meta AI 研究部门内部的紧张局势也在加剧。两个阵营产生了分歧:一方敦促公司认真投资大模型这个行业新方向,而包括杨立昆在内的人则认为这些大模型是短暂的狂热,缺乏科学价值。一些人透露,杨立昆在公司内部和公开场合都强烈反对大语言模型,认为他们不会让 AI 更接近人类的智力水平,这使得持反对意见的研究人员很难获得大模型开发所需的支持和大量资源。
结果,一些 Meta 研究人员只能使用更少的资源继续推进大模型开发。他们在 2022 年使用大约 1000 个芯片开发了一个名为“开放式预训练模型”(OPT) 的大语言模型,并在 2023 年使用大约 2000 个芯片开发出了 Meta 的旗舰模型 LLaMA。相比之下,按照行业标准,开发这种大模型需要 5000 到 1 万个芯片。最初,Meta 允许有限的外部研究人员访问 LLaMA,但随后它被泄露到网上,引发了一阵创新热潮。Meta 高管们认为,这是 Meta 志在分享其 AI 技术的一个主要例子。
自那以后,Meta 失去了许多 AI 研究人员,这些人在去年从事了上述和其他关键的生成式 AI 项目。许多人感到筋疲力尽,或者对于 Meta 跟上竞争对手的步伐缺乏信心。据领英资料和知情人士透露,在为 LLaMA 撰写研究论文的 14 位作者中,有 6 位已经离职或宣布将离职。在为 OPT 撰写论文的 19 位共同作者中,也有 8 位离开了。
在 OpenAI 去年 11 月发布 ChatGPT 之后,Meta 员工的离职开始加速。一些人受到了 AI 创业热潮的诱惑离职,这股热潮推动了包括谷歌在内的硅谷公司的全面人事变动。领英的数据显示,截至今年 3 月,领英上提到 GPT 的招聘岗位数量同比增长了 79%。
Meta 的一位发言人表示,该公司一直在继续招聘和引进新的 AI 人才。
重新追赶
在 ChatGPT 发布后,扎克伯格、Meta 首席产品官克里斯 考克斯 (Chris Cox)、首席技术官安德鲁 博斯沃思 (Andrew Bosworth) 一起负责公司所有与 AI 相关的工作。这三位高管现在每周花数个小时研究 AI,参加会议并批准 AI 项目。
此前,Meta 花费数年时间优先考虑学术发现,并免费分享它们,但无法利用上这些研究成果的商业潜力。现在,它正在迅速地将资源重新集中在开发可用的 AI 产品和功能上,包括自己的聊天机器人。
Meta 新成立了生成式 AI 部门,专注于构建可用的产品和工具,而不是科学研究。该部门收到了超过 2000 份内部申请,并迅速集结了来自不同团队的数百名员工。知情人士表示,硬件资源已从 AI 研究部门转移,正被用于训练新的生成式 AI 模型。
扎克伯格在今年 3 月表示,“推进 AI 并将其融入我们的每一款产品”是该公司最大的单笔投资。在今年 5 月举行的 Meta 年度股东大会上,扎克伯格表示,公司也希望将 AI 扩展到虚拟世界。
Meta 发言人表示,在本月早些时候与员工举行的一次市政厅会议上,扎克伯格宣布了该公司目前正在开发的一系列生成式 AI 产品,包括 Messenger 和 WhatsApp 的 AI 代理,用户可以根据文本提示生成并在聊天中分享的 AI 贴纸,以及一项照片生成功能。照片生成功能允许 Instagram 用户使用文本提示修改自己的照片,然后在 Instagram Stories 中分享。
但是,Meta 仍然面临广泛挑战。知情人士透露,在经过政府和媒体对其用户隐私做法进行了 7 年的严格审查之后,该公司对风险的容忍度越来越低,这在如何以及何时推出 AI 产品方面造成了摩擦。
否认落后
今年 5 月,美国白宫举行 AI 领袖峰会,称这是一场为“处于 AI 创新前沿的公司”举行的会议。但是,扎克伯格没有受邀。
Meta AI 研究副总裁乔勒 皮诺 (Joelle Pineau) 在一份声明中表示,公司在 AI 开发方面并没有落后,并为此前对 AI 学术研究和结构的聚焦进行了辩护,称这为 Meta 走向成功打下基础。
皮诺称,Meta 的 AI 研究部门“是全球 AI 研究人员和开放科学的领先目的地之一,仅在过去一年中,其研究成果就显著增加”。她表示:“在我们把一类新的生成式 AI 体验带给我们的应用家族之际,我们的研究突破为此奠定了坚实的基础。我们为 Meta 的 AI 研究人员过去和现在所做的贡献感到自豪,他们帮助塑造了先进和一流 AI 技术的未来。”凤凰网科技《AI 前哨》对此将持续关注。