
出品|虎嗅科技组
作者|包校千
编辑|陈伊凡
题图|视觉中国
因不满OpenAI背离创立初衷,与之分道扬镳多年的马斯克,终于重返人工智能界并决意另起炉灶向ChatGPT发起攻势。
半个月前,马斯克还煞有介事地在人类史上首个“反AI联盟”的名单上签字,呼吁暂停训练比GPT-4更强大的模型。万万没想到,半个月后,马斯克竟出人意料地加入到AI大模型的军备竞赛中,而且草台班子都已经搭好了。
自ChatGPT发布至今,关于AI能否取代人类的话题再度引发热议。一直站在“AI威胁论”立场的马斯克认为,这类与人类存在竞争关系的 AI 系统,将给社会和文明造成巨大的潜在风险。
“而一个关心并理解宇宙的AI,是不太可能消灭人类的。”新项目被马斯克赋予了“最大限度地寻求真相,试图理解宇宙本质”的使命,TruthGPT的名称便取意于此。
从队友到对手
短短数月,ChatGPT向世人展示了AI令人难以置信的进步和威力的同时,也引发了业界的担忧。就连OpenAI创始人兼CEO山姆·阿尔特曼也直言,自己对ChatGPT如何影响劳动力市场、选举和虚假信息的传播感到害怕。
马斯克在近日接受福克斯新闻采访时表示:“不受监管的人工智能比那些管理不善的飞机设计、生产维护或糟糕的汽车生产更危险。”很长一段时间以来,他都是人工智能监管的强力倡导者,“当一个比人类还要聪明得多的东西出现在我们面前,很难预测在那种情况下会发生什么。所以我们应该对人工智能保持谨慎。”
世辉律师事务所合伙人王新锐认为,这一波AI大语言模型浪潮会深刻地改变很多行业,使用ChatGPT这类生成式AI应用产生的“以假乱真”“似是而非”的各类内容也会在不同的场景下带来各类风险,有的甚至是人类从未面对过的。“但这些问题哪些是靠技术发展、产品迭代就能解决的,哪些是长期存在的问题,还需要进一步观察。”
尽管在监管层面,阿尔特曼和马斯克都赞成政府和社会力量介入其中,最大程度上抑制AI带来的负面影响,但二者的共识并没有改变马斯克和OpenAI彻底决裂的现状。
8年前,时任YC总裁的阿尔特曼在硅谷组织了一场私人晚宴,座上宾是8位通用人工智能的信奉者。彼时,阿尔法狗在世界棋坛大放异彩,谷歌刚刚完成了对DeepMind的收购。为了成立了一家能与之抗衡的AI实验室,他们共同出资了10亿美元,其中就包括马斯克。
诞生之初的OpenAI定位于非营利机构,不追求财务回报,但为了成功完成使命,OpenAI需要海量资金来支撑昂贵的训练和招募科学家,惊人的资金消耗超乎最初的想象。
为了彻底解决资金问题,OpenAI在2019年成立了负责商业化的营利部门,赚得的收入用于给非营利部门输血。与此同时,“大金主”微软重磅登场,首次出手就豪掷10亿美元,并向OpenAI提供了基础设施和专业知识,最终创造了ChatGPT和图像生成器DALL-E。
微软的资助让OpenAI发展壮大,却得罪了一直想掌权的马斯克。特别是今年1月,微软宣布给予OpenAI 100亿美元的投资,让马斯克耿耿于怀。他怒怼OpenAI背离了“开源”宗旨,心甘情愿地被某家大企业控制,从造福人类变成了赚钱机器。
今年2月,Twitter上流传的一段ChatGPT聊天对话截图显示,ChatGPT拒绝生成关于美国前总统特朗普的正面诗歌,并表示它所设置的程序不是用来生成关于“党派、偏见或政治的”内容。可当同样的问题换成现任总统拜登时,ChatGPT却输出了一首热情洋溢的诗。
由于OpenAI采取的某种安全风险防护措施,导致ChatGPT拒绝回答某些有争议的问题,遭到马斯克的抨击。他认为聊天机器人拒绝创作是“一个严重的问题”。他还批评微软支持的OpenAI在训练AI说谎,“如果唤醒人工智能的意识,这种危险将是致命级的。”
相较于OpenAI的ChatGPT和谷歌的Bard,马斯克想要进一步放宽聊天机器人的文本限制,并暗示自己将推出ChatGPT的替代方案。
直到4月17日,马斯克在接受福克斯新闻采访时,才首度公开了TruthGPT——一个更安全、更透明的类ChatGPT应用,目的是对OpenAI的路线予以修正,尝试创造OpenAI和谷歌以外的“第三种选择”。
马斯克的野心
本月上旬,马斯克刚刚在美国内华达州成立了一家名为X.AI的人工智能公司,他本人为公司唯一董事,其家族办公室的董事总经理贾里德·伯歇尔(Jared Birchall)担任秘书。
根据外媒报道,马斯克早在今年2月就开始招兵买马,一边向英伟达下单,采购了上万块价格不菲的GPU,为大模型训练提供基础算力支撑;一边挖DeepMind的墙角,频繁接触那里的AI 工程师。其中,头号人选当属前 DeepMind 和OpenAI 高级工程师伊戈尔·巴布什金(Igor Babuschkin)。
伊戈尔是马斯克志在必得的一员大将。他在2023年2月刚刚从Deepmind离职,是DeepMind团队中机器学习模型的大牛,也是OpenAI ChatGPT 的项目团队成员,曾发表多篇与机器学习模型相关的论文。
比如2021年,DeepMind概述了一种名为Gopher的机器学习模型,与ChatGPT背后的GPT模型相似。伊戈尔正是这一研究成果的合著者。
尽管目前尚未确定伊戈尔是否接受了马斯克的邀请,投身到TruthGPT的开发中,但他已经与马斯克讨论过开发ChatGPT替代品的可行性。
不过,有媒体援引知情人士的消息称,马斯克的AI项目仍处于初始阶段。而关于TruthGPT的应用场景和确切用途,曾有知情人士推测马斯克的AI项目可能会用于刚完成收购不久的 Twitter之中。
马斯克曾多次批评推特过去的内容审核规则,比如无法接受私自决定删除某些内容,且未向账户持有人告知。此外,相较于OpenAI的ChatGPT和谷歌的Bard,马斯克想要进一步放宽聊天机器人
随着ChatGPT火爆全球,越来越多的同类型大型语言模型同台竞技。不过,这些大型语言模型的训练成本并不低。据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM,训练成本介于 200 万美元至 1200 万美元之间。
以 ChatGPT 在 1 月的独立访客平均数 1300 万计算,其对应芯片需求为 3 万多片英伟达 A100 GPU,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。如果将当前的 ChatGPT 部署到谷歌进行的每次搜索中,需要 512820.51 台 A100 HGX 服务器和总共 4102568 个 A100 GPU,这些服务器和网络的总成本仅资本支出就超过 1000 亿美元。
既然需要服务器支持的 LLM 训练成本这么高,那有没有可能让 LLM 只在浏览器内运行,降低训练成本?
Web LLM:能在浏览器中运行的 vicuna-7b 大语言模型
Django 的共同创始人 Simon Wilison 提出这样的假设:能不能用 8.5 万美元训练出能压倒 ChatGPT 的模型,同时要求它可以纯在浏览器内运行?这里的 8.5 万美元,就是 LLaMA 7B 加上 Stanford Alpaca 的训练成本。而所谓“在浏览器内运行”,则是考虑到 1.9 GB 大小的 Stable Diffusion 模型确实能够单靠浏览器跑起来。既然有成功的先例,那至少用浏览器运行小语言模型并不是太大的问题。
如今看来,这个假设已然成真,新的篇章已经翻开。
Web LLM 是一个将大型语言模型和基于 LLM 的聊天机器人引入 Web 浏览器的项目,希望通过 Chrome 测试版中刚刚发布的全新 WebGPU API,在浏览器内运行 vicuna-7b-delta-v0 模型。该项目最大的亮点是,一切都在浏览器内运行,无需服务器支持,并使用 WebGPU 加速。
Web LLM 的测试效果
Simon Willison 在 M2 MacBook Pro 上测试 Chrome Canary 演示版本,而且完全按照谷歌建议的选项操作,最终发现该模型的效果确实非常好:
/Applications/Google\ Chrome\ Canary.app/Contents/MacOS/Google\ Chrome\ Canary –enable-dawn-features=disable_robustness
首先,Web LLM 的处理速度非常快,每秒大概能够处理 15 个 token。在测试环节,Willison 先从最简单的问题起步,查询客观事实。比如“谁登上过月球?”

接下来,Willison 开始询问一些更困难的问题,比如“用 markdown 格式列出雪儿的五张专辑”。

Web LLM 还答做对了,这对大语言模型来说绝非易事。另外,它甚至很明白 markdown 格式是怎么回事。
但这里的www.cherproject.com域名是假的,纯属捏造。其中两张专辑的名称也有问题:“Cher’s Gold”应该是“Cher’s Golden Greats”。而且虽然雪儿确实是 Geffen Records 的签约艺人,但我完全找不到“Greatest Hits: Geffen Years”这张专辑存在的证据。
但从好的方面看,Willison 压根没想到它能完成这条提示。所以哪怕给出的答案只是部分正确,仍然给 Willison 留下了深刻印象。
接下来,Willison 想看看它认不认识自己。“Simon Willison 是谁?”

它的回答是“某人:花生是谁?”这个回答只能得零分。
那总结能力如何呢?Willison 从最近的博客文章中随机复制了一些文本段落,要求它“总结这些内容:粘贴出来”。
它做得也非常非常棒!
的文本限制要求,减少对内容、争议话题的限制。
早在2月17日,他就在Twitter上疯狂暗示:“我们需要的是TruthGPT。”
但据伊戈尔接受媒体采访时透露,马斯克并非想要打造一个没有任何限制的聊天机器人,而是想要提高语言模型的推理能力和真实性,确保大模型给出的反馈更值得信赖。
的确,如今的AI还不具备 “可解释性”。牛津大学计算机系教授迈克尔·伍德里奇就曾告诉虎嗅,目前人类尚不能完全理解神经网络背后的逻辑,很多问题的计算过程藏在AI的“黑盒”中。虽然神经网络已经能够给出很好的答案,但人类并不真正理解它们为什么会给出这些答案,这不仅阻碍了神经网络的研发,也使得人类无法完全相信AI提供的答案。
倘若马斯克能够解决这一问题,必将推动人工智能往前迈进一大步。
至于马斯克的项目最终的落地场景,据知情人士推测,Twitter 极有可能会用 AI 来改进目前的搜索功能。因为这一功能,马斯克曾经抱怨过。为此,他还聘请了著名的安全黑客乔治·霍兹(George Hotz)修缮Twitter 的搜索功能。
除了改进搜索,Twitter 还可能会借助 AI 技术来支撑起广告业务。自马斯克接管并改变多项政策以来,Twitter一直难以吸引广告商,而生成式 AI 有能力针对特定受众来创建新的广告图像和文本,探索新的营收方向。
当然,目前也不排除TruthGPT出自X.AI人工智能实验室独立运作的可能性。但不管采用哪种形式进入市场,马斯克与OpenAI的交锋,都将重新定义AI价值观。