手机版 欢迎访问伴佳68(www.banjia68.com)网站
“别忘了,光是特斯拉自己就有一台全球第七强的超级电脑,那么马斯克的新公司「X.AI」,到底要带人类到达什么样的光景?
马斯克曾与其他业界大佬共同发出暂停GPT-4 以上的大型语言人工智能模型的开发声明,但随后却成立了新的AI公司,并采购了上万张NVIDIA 最新的AI加速卡,开始发展自己的GPT 人工智能模型。这让人们感到困惑,不知道马斯克在想什么。甚至被业界质疑是不是想要拖慢OpenAI 的发展脚步好让自己可以取而代之?
基本上,马斯克发展的AI 都是为了服务人类的创意,并取代重复的人类工作,但随着ChatGPT 的推出,创意和逻辑这块很快就被AI 取代了一大部分,马斯克在这时创立X.AI, 并且要推出「真实」的GPT 模型,也让人怀疑,马斯克这是在打脸自己?然而事情并不是那么单纯…
当然,马斯克与OpenAI 之间的恩怨已经有很多人谈过,他们之间的是非对错其实也很难三言两语就解释清楚,因此我们这次就来了解马斯克在AI 这条路上做了什么,以及以后他藉由X.AI 来做什么,然后来尝试解答马斯克创立X.AI 公司的目的。
先从马斯克的AI 发展历程稍微回顾一下,马斯克最早投入AI 议题是从自动驾驶技术开始,早在2014 年时,特斯拉开始在其Model S 上引入最早的一代Autopilot 技术,随后也推广至Model X 车种,当时这个系统虽然号称自动驾驶,但实际上汽车无法自行决定路线、方向,也无法判断路况,只能进行简单的车道置中以及变换车道,虽好于目前的L2 驾驶辅助,但仍远远谈不上自动驾驶。
当然,自动驾驶被误解其实也是中文翻译的问题,比如说飞机上的AutoPilot 其实也是翻译成自动驾驶,但实际上,飞机的自动驾驶也只是在固定的高度维持飞行,而不是可以从起飞、航线变换到降落都可以交给飞机。不过当时的汽车产业界对其所谓自动驾驶的定义非常苛求,认为以特斯拉当时的AutoPilot 功能,根本称不上自动,特斯拉也因此饱受责难。
加上当时选用的硬件是基于Mobileye 的ASIC 方案,性能非常弱,即便后续更新软件,也没办法满足消费者的需求。
因此,马斯克后来在2016 年结束语Mobileye 的合作,转而与NVIDIA 进行合作。众所周知,NVIDIA 在2010 年左右开始发展其CUDA 与GPGPU 生态,并借此推动人工智能的发展,随后也以Tegra 方案为基础推出自动驾驶方案。
NVIDIA 的自动驾驶方案的确强大许多,但仍远不及马斯克心中的想像,加上后续的中国电动车企业小鹏爆发用AutoPilot 原始码并与NVIDIA 进行合作的争议之后,特斯拉随即结束与NVIDIA 的合作关系,并转而自行研发真正的自动驾驶平台。
而马斯克也重新定义自动驾驶的英文名称,将其称为FSD(Full Self Drive),不在名称上走擦边球,马斯克信心满满,觉得在2020 年就能推出全功能的FSD 正式版,但截至目前为止,FSD 仍处在测试版阶段,目前最新版本是Beta 11.4。
FSD Beta 彻底翻转以往自驾车逻辑,采用新空间占量概念(Occupancy Network),不再以连续单张图片为基础,而是以物体体积的影片为基础运算,克服许多自驾技术困难,无需光达、雷达和高精地图,以纯视觉就能做到极接近人类驾驶的程度。虽然还有些小瑕疵,但在业界也已经是表现最好的自动驾驶系统。
那么FSD 是如何被打造出来的?我们可以分为两个部分来看,一个是汽车上的推理核心,负责现场驾驶行为的判断与执行,另一个是云端的训练工作,负责从个别的特斯拉汽车收集驾驶资讯,并以之训练精进FSD 的驾驶模型。
汽车上的推理芯片由特斯拉自行研发,命名为Hardware x.0,目前版号已经到4.0,由三星代工生产,基于Exynos 手机芯片架构改造。总运算性能达到490TOPS,超越NVIDIA 最新自动驾驶平台Driver Orin 的254TOPS。
而云端的部分也有不小的变革。原本特斯拉是采用NVIDIA 的GPU 来打造自有的超级电脑,并以之训练自动驾驶模型,该超级电脑使用了7360 颗NVIDIA 的A100 运算芯片,在2022 年底可以排上全球第七强超级电脑。
透过此超级电脑,特斯拉已经可以做到道路物件的标记完全自动化,并且能够更快的基于特斯拉回传的驾驶资讯训练改进驾驶模型。然后马斯克也就辞退了之前为特斯拉工作的800 名标记师。
不过NVIDIA 的方案显然还是无法满足特斯拉,同样是在2022 年,特斯拉在AI Day 上公布了Dojo 计划,包含Dojo 视觉训练芯片以及超级电脑丛集ExaPod,预计在2023 年上线 EFLOP 的恐怖怪物级超级电脑,性能是现有基于GPU 架构超级电脑的4 倍以上。
除了特斯拉电动车以外,用来造车的超级工厂也同样高度AI 化,尤其大型产线机器人,几乎都已经全面自动化,这些机器人可以执行复杂的操作,甚至在有需要时可以自动变换工具来执行不同的组装任务,因此,特斯拉的产能不断获得提升,成本也不断下降。
特斯拉表示,超级工厂虽然还有数千名员工,但整合AI 机器人之后,工作流程可以由软件定义、训练、最佳化,极大的改善了制造流程。
而超级工厂下一步,则是要引进在2022 年发表的特斯拉Optimus 人形机器人,透过这个机器人,可以大量取代需要使用到人工的重复性工作。该机器人基本上就是一个人形化的特斯拉汽车,其处理器、电池还有许多电机技术,都是来自特斯拉。
充电一次就可以工作一整天。马斯克表示,最快在2023 年内进行量产,并引进超级工厂。马斯克表示,就如同特斯拉的自动驾驶系统是要用来代替人类执行重复且无聊的驾驶工作, Optimus 也是要用来代替人类进行日常购物、清扫、搬运等重复性工作。
既然特斯拉已经有能力发展自己的超级电脑芯片与超级电脑丛集,那为何马斯克的新AI 公司仍采购近万颗NVIDIA 最新的H100 芯片来建立资料中心?答案其实很简单,那就是特斯拉自有的Dojo 芯片主要是针对视觉处理工作而设计,软件框架较为固定,没有办法像NVIDIA 在提供高弹性的同时,也具备高性能。
同时,X.AI 公司要发展的是类似OpenAI 的ChatGPT,这类大型自然语言模型的训练工作还是NVIDIA 的强项。完整版H100 芯片能达到60TFLOPS 的FP32 运算能力,D1 则仅为22TFLOPS,不过D1 支援特斯拉自订的CFP8 浮点格式,比较擅长用于自家的驾驶模型训练工作。
而如果根据新闻讯息,X.AI 采购了一万张H100 演算卡,那么初期X.AI 的运算能力是超越算出GPT4 的OpenAI 所使用的上万张A100,因为就纯粹性能,H100 是A100 的4 倍以上。
也就是说,如果马斯克要训练出一个GPT4 等级的AI 模型,那么理论上性能是绰绰有余的。
不过OpenAI 背后还有微软这个大金主存在,OpenAI 除了自身拥有内建上万张A100 的超级电脑以外,还有微软Azure 具备的运算力,包含超过一万张基于A100 加速卡的超级电脑丛集,专门服务ChatGPT,以及已经采购的超过7000 张的H100,将会用来建立新的演算力来服务GPT4 或未来的GPT5,OpenAI 负责训练,而微软这边则是主要提供让ChatGPT 可以连接到微软旗下应用的庞大推理能力,当然,微软也有可能出借部分运算能力给OpenAI 以供其训练模型之用。
那么回过头来看,马斯克的X.AI 想要服务的是哪些客户?想要达到的是哪些目的?从过去马斯克的作法来看,他一直利用AI 来取代偏劳力类型的人类工作,但是ChatGPT 是要取代人类的部分思想与思考能力,让人脑专注于创意以及设定工作目标,专业知识与工作流程则是由ChatGPT 来代劳,所以马斯克也要学OpenAI +微软,开始要抢某些白领工作了?
不过马斯克强调,他的模型将会专注于真相的传达,不要有偏见,也不要有限制。然而没有限制的AI 听起来似乎更危险?完全中立似乎也是另外一种偏见?
对此,由马斯克所招募,担任X.AI 核心技术研发与管理的前DeepMind 与OpenAI 研发工程师伊戈尔·巴布什金(Igor Babuschkin)表示,他们更重视语言模型的推理能力与线 都会在某些程度上虚构答案,而且这些模型还无法解释为什么要给出特定的答案,因为逻辑都藏在AI 模型的黑盒子中。
如果X.AI 所研发的模型能够具备更好的逻辑推论与分辨事实的能力,那是不是也要将人类目前所能担任的指示、监督与核实AI 所产生的内容的工作也剥夺走,未来的AI 将可以全自动根据其观察到的现况设定目标、解决问题,不需要人类插手,而且也不用怕会像GPT3.5/4 一样会自欺欺人,造成潜在的灾难?
那不是比ChatGPT 更危险吗?对此,马斯克其实还留有一手,他认为,如果打不过AI,那么就加入它,让大脑透过NeuraLink 连接电脑/ AI,一起协同工作,透过强化人类大脑,来让AI无法取代,或者,让大脑本身变成AI的一部份。
Neuralink 目前还在实验阶段,但是进展相当快速,根据实验结果,已经能够让猴子进行超越人类反应的电脑操作。不过Neuralink 目前还有不少包括伦理上的争议,以及技术上的困难,要普及恐怕有点困难,但等到大型语言模型普及,甚至可以完全自主的AI 模型出现,届时人类可能也没有太多选择了?
banjia68.com 版权所有 | 备案号:鲁ICP备2021038504号-2