2024-01-04 06:35 点击次数:196
北京时刻 12 月 14 日凌晨,OpenAI CEO Sam Altman 在 X(Twitter)上发布了一则推文,厚爱宣告再行怒放 ChatGPT Plus 新用户订阅。按照 Altman 的说法,中枢原因是 OpenAI 照旧找到了更多的 GPUkaiyun开云官方网站,原文是:we found more gpus.
就在 1 个月前,亦然 Altman 秘书暂停 ChatGPT Plus 新用户订阅(20 好意思元/月,约合东谈主民币 141 元/月),情理是「开导日后使用量的激增超出了咱们的承受武艺,咱们但愿确保每个东谈主齐有邃密的体验。」
即使关于风头正盛的 OpenAI 来说,这也不是一件易事。
要知谈,顶级 GPU,或然是算力早就成为了科技公司的一种政策资源,以致是劝诱顶级究诘东谈主员的「利器」。公开报谈指出,算作大家 H100 GPU 储备第二多的公司,Meta 照旧将多量 H100 算作劝诱顶级 AI 东谈主才的招聘策略。
难怪 Altman 新推文底下有网友再次热爱谈:「GPU 是新的石油。」
图/ X(Twitter)
但算力依然受限,中枢是大模子窥伺、推理齐严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。
说到底,照旧算力不够用,「供给」赶不上「需求」。这不仅是 OpenAI 一家公司,亦然扫数 AI 行业所濒临的危急。但刻下 OpenAI 再行怒放了 ChatGPT Plus 订阅,又是否意味着行业照旧走出了算力枯竭的危急?
并不竟然。
原正本本,OpenAI 齐莫得明确指出所谓「找到」,是指从「算力之王」英伟达购买到了更多的英伟达 GPU,照旧从「幕后大佬」微软那边拿到的支撑,又或是从「最强备胎」AMD 买到最新一批的 AI 芯片 Instinct MI300X。
但至少不错细则,算力商场正在资格一轮洗牌。
英伟达的敌手们
一周前,谷歌 DeepMind CEO Demis Hassabis 代表 Gemini 团队厚爱推出了全新一代多模态大模子 Gemini,领有「视觉」和「听觉」,还有盛大的学习和推理武艺。其中,Gemini Ultra 奏凯对标公认最盛大的 GPT-4 模子,行业揣测参数超万亿。
更耐东谈主寻味的是,在一众基于英伟达高端 GPU 窥伺出的大模子中,Gemini 是唯独一个整个基于自研 AI 芯片—— TPU 窥伺出的万亿参数大模子。
TPU v5p 集群,图/谷歌
从单片性能来看,无论是 TPU v5e、v4 照旧最新发布的 v5p 其实齐远不是英伟达 H200、H100 的敌手。以谷歌最新的 TPU v5p 为例,INT8 下的峰值算力仅为 918 TFLOPs,远低于上一代英伟达 H100 的 1979 TFLOPs。
但就像半导体究诘机构 Semianalys 首席分析师 Dylan Patel 指出的,「对东谈主工智能基础步调来说,系统武艺比微架构更进军。」平时来讲等于,芯片集群的算力比单块芯片的算力更进军。
在大模子窥伺、推理的大规模策动之中,单块芯片策动完成后需要进行通讯,但受制于通讯恶果本色时常无法作念到沿途传输,这就意味着部分算力被摧毁了。行业抢购英伟达 GPU 除了因为最熟识的 CUDA 生态,在于单块更强 GPU 提供的恶果擢升,更在于英伟达 NVLink、NVSwitch 等通讯时间不错收场芯片集群的算力最大。
图/英伟达
而谷歌自研 TPU 一运行的意见等于用在大家数据中心,不成能不喜爱多芯片互连时间。事实上,谷歌也莫得公布窥伺 Gemini 使用的 TPU 数量,而是强调节用了不单一个集群,以致不单一个数据中心。
不仅如斯,谷歌还声称,包括 Salesforce 和 Lightrick 等客户照旧在使用谷歌云的 TPU v5p 超等策动机来窥伺大模子。
谷歌除外,微软在 11 月举办的 Ignite 大会发布了自研 AI 芯片——Maia,亚马逊也于同月举办的 re:Invent 大会上推出自研 AI 芯片——AWS Trainium2。不外,刻下亚马逊、微软齐还莫得推出基于自研 AI 芯片窥伺的大模子,更多照旧用于大模子的推理,但也有 AI 独角兽 Anthropic 秘书了基于 Trainium2 构建模子的接洽。
图/亚马逊
不同于云策动三巨头的竞争,英伟达老敌手、芯片巨头 AMD 则在本月初的 Advancing AI 发布会上,厚爱推出了高端 GPU Instinct MI300X(以下简称 MI300X),谷歌、亚马逊、微软、OpenAI、甲骨文、Meta、戴尔、惠普、联念念等公司纷繁为其站台。
生态上,AMD ROCm 固然比较英伟达 CUDA 生态还有不小的差距,但 AMD 也借助扫数行业加注「备胎」的风向紧赶慢赶,而况 AMD CEO 苏姿丰本年早些时候就默示,她不坚信在 AI 芯片商场发展如斯之快的情况下还会有什么「护城河」一说。
与此同期,微软、Meta 也齐同意购买 MI300X 用于 AI 策动需求,甲骨文以致提前先采购了一批。另据供应链传奇,微软为此还提前一步砍掉了英伟达的部分订单。
王权莫得不朽
家喻户晓,GPU 领先的意见等于为游戏和视频进行图像渲染。但前英伟达首席科学家戴维·柯克(David Kirk)一直有个梦念念——将主要管事于图像渲染的 GPU 算力「通用化」,使之转机为通用算力中心。
2006 年,戴维·柯克劝服了英伟达首创东谈主兼 CEO 黄仁勋推出了 CUDA(Compute Unified Device Architecture,融共策动架构)。
CUDA 的今天从来不是一蹴而就的,而是老黄蚁合十多年坚毅的干涉才收场的。从游戏、科学究诘到区块链、挖矿,再到元寰宇以及今天的生成式 AI,老黄握住为 CUDA 和 GPU 算力寻找策动的出口和往时,包括在 2016 向刚刚设置的 OpenAI 捐出英伟达的第一台 AI 超等策动机——DGX-1。
黄仁勋,图/英伟达
正如多年前老黄给俄勒冈州立大学毕业生的传话:「当有东谈主负重致远时,他们就能作念你作念不到的事情。负重致远,不留后手。」
而好多东谈主并不知谈,早在前年 ChatGPT 推出之前,英伟达的数据中心收入就朝上了游戏业务,在 ChatGPT 引爆大家科技行业之后,数据中心业务更是如同开挂般抓续增长,整个压过了来自游戏玩家的收入。
但王权莫得不朽。
大模子的兴起创造了海量的算力需求,英伟达的高端 GPU 简直成为了大家科技公司的首选指标。但起先,英伟达一家公司难以得意大家商场(以中好意思为主)关于 AI 算力的需求;其次,无论从风险按捺照旧资本角度有计划,大公司在恒久来看齐不会采用「把鸡蛋放在一个篮子」。
临了,算力商场从来不缺竞争者,也并非赢家通吃,至少苏妈就以为,「这个商场将会有多个赢家。」
苏姿丰,图/ AMD
事实上除了英伟达,另一家芯片巨头博通亦然大模子海潮的幕后赢家。更遑论,还有以谷歌为代表的云策动巨头,正在试图垂直整合,收场从底层芯片到窥伺框架的自研。
同期就像前文所述,英伟达一家公司难以得意大家抓续增长又握住变化的算力需求,而 AMD、谷歌、微软、亚马逊以及更多公司的加入,将会绝对蜕变算力的供给,提供更盛大、更低廉的算力,才可能果真让大模子成为「社会基础步调」。
老黄会乐见这么的变化吗?很难讲,但至少在送出那台扶植给 OpenAI 的超等策动机时,他还在上头写了一句话:
「为了策动和东谈主类的往时,我向你们献上宇宙上第一台 DGX-1。」
图/英伟达
Powered by 开云真人(中国)官方网站 @2013-2022 RSS地图 HTML地图
鄂ICP备2020021473号-1