超微推出具192GB記憶體的純GPU之AI晶片MI - 工程師

William avatar
By William
at 2023-06-21T08:41

Table of Contents

超微推出具192GB記憶體的純GPU之AI晶片MI300X,搶奪AI市場

https://bit.ly/464WD15

超微(AMD)為了追趕輝達,於2023年6月13日正式向外介紹一款純高性能GPU的AI晶片
MI300X。

前不久,超微推出結合CPU和GPU雙架構的Instinct MI 300進軍AI訓練晶片,這款晶片在
規格和性能直接對準了輝達的Grace Hopper。不過,為了直接瞄準大型語言模型市場,專
為需要所有記憶體容量來運行最大模型的客戶而設計的MI300X不再是混合使用CPU和GPU,
而是用兩顆CDNA 3 GPU小晶片取代了MI300A的三顆CPU小晶片,從而形成了12顆小晶片設
計,包含:8顆GPU小晶片和另外4顆IO記憶體小晶片。

除了純GPU性能之外,超微的MI300X亦提高記憶體容量,讓當前這一代AI大型語言模型(
LLM)能獲得192GB記憶體。由於AI客戶正在以最快的速度搶購GPU和其他加速器,同時需
要更多記憶體來運行更大的模型。因此,超微提供一個使用8個HBM3記憶體通道的192GB
GPU將成為當前市場上的一個相當大的優勢。

其實,AI晶片可以分為雲端、終端和邊緣。根據任務劃分又可以分為訓練晶片和推理晶片
。雲端就是在數據中心進行模型訓練,晶片需要支撐大量的數據運算,終端和邊緣對運算
要求稍弱一些,但卻要求快速回應和低功耗。如今輝達H100晶片霸佔了訓練晶片這一領域
,超微似乎想利用MI300X來爭取更多客戶的支持。

除了192GB MI300X公布之外,超微還簡要宣布了他們所謂的AMD Infinity架構平台。 這
是一種允許最多8顆超微的高階GPU互連在一起以處理更大的工作負載的8-way MI300X設計


就如輝達的8-way HGX和英特爾的Ponte Vecchio的x8 UBB那樣,8-way處理器配置目前是
高階伺服器的最佳選擇的架構。

另外值得注意的是,AI開發人員歷來偏愛輝達晶片的一個原因是它有一個名為 CUDA的開
發完善的軟體包,使他們能夠利用晶片的核心硬體功能。超微也推出擁有自己的AI晶片軟
體,稱為ROCm。其希望建構一個強大的軟體堆疊方面取得了真正的巨大進步,讓該軟體堆
疊可與模型、庫、框架和工具的開放生態系統一起使用。

超微認為數據中心之AI加速器市場將從2023年的300億美元左右,以超過50% 的年複合成
長率增長到2027年的1500億美元以上。

雖然超微沒有透露MI300X的價格,但此舉可能會給輝達的GPU帶來價格壓力,畢竟,H100
的價格高達30,000美元或更多,如果超微能夠在性能提升的同時,又給市場更合理的價格
,這有助於降低生成式AI應用程式的高成本,也可為其帶來可觀的市場佔有率。

--

All Comments

Mary avatar
By Mary
at 2023-06-25T03:50
MI250跑pytorch training 跟A100已經互有勝負了
Annie avatar
By Annie
at 2023-06-24T01:06
MI300看來值得一戰R
Anthony avatar
By Anthony
at 2023-06-27T20:16
8顆HBM3 好猛
Catherine avatar
By Catherine
at 2023-06-24T01:06
不能跑Cuda就pass
John avatar
By John
at 2023-06-27T20:16
Cuda才是核心阿 你AMD要推啥跟Cuda打
Yedda avatar
By Yedda
at 2023-06-24T01:06
cuda都多久了 誰會自己找麻煩用新語言
Hedda avatar
By Hedda
at 2023-06-27T20:16
支援cuda再發新聞好嗎?
Tom avatar
By Tom
at 2023-06-24T01:06
不是早就能兼容了嗎...
Hardy avatar
By Hardy
at 2023-06-27T20:16
99AMD
Edward Lewis avatar
By Edward Lewis
at 2023-06-24T01:06
是透過HIP讓AMD能跑 而不是直接搬過去 完整性有差
Enid avatar
By Enid
at 2023-06-27T20:16
API不兼容的你還要自己重K 光這點就不好推了
Delia avatar
By Delia
at 2023-06-24T01:06
友x光電還想捨棄CUDA自己寫呢 :) 我直接說不接
Ida avatar
By Ida
at 2023-06-27T20:16
CUDA? OPENCL 不好?
Puput avatar
By Puput
at 2023-06-24T01:06
OpenCL沒有像CUDA那樣能對自家GPU最佳化吧 而且open
cl 出來之前 很多科學家程式師都已經習慣CUDA很多年
Edwina avatar
By Edwina
at 2023-06-27T20:16
看不懂 能跑貪食蛇嗎
Charlie avatar
By Charlie
at 2023-06-24T01:06
可怕,以前我用Trident SuperVGA才1MB顯存
Kelly avatar
By Kelly
at 2023-06-27T20:16
A只能喝湯
Hamiltion avatar
By Hamiltion
at 2023-06-24T01:06
大VRAM才是王道

Re: [心得] 在日本工作受不了,想回

Damian avatar
By Damian
at 2023-06-21T00:18
本串看下來覺得有些人邏輯鬼才 做純軟的說人家不如去竹科 阿就不是做軟韌的去竹科幹嘛 當貧民? 我今天做cloud寫golang能去跟人擠豬屎屋還是去板上看不起的系統廠嗎 台灣CS畢業做純軟就是出國 除非你刷進一線外商窄門 回到正題 比稅率還是得比加上扶養之前 像新加坡移民了也可 ...

調查:Meta員工年薪中位數破900萬

Enid avatar
By Enid
at 2023-06-20T23:36
大裁員還是讓人羨慕!調查:Meta員工年薪中位數破900萬 https://3c.ltn.com.tw/news/53791 儘管歷經了大裁員,Meta、Alphabet支付給員工的薪酬還是高得讓人羨慕! 根據《華爾街日報》的一項報告,2022年 Meta (原Facebook)、Alphabet (G ...

(抽AppleWatch,藍芽喇叭等獎品)大數據分析

Frederic avatar
By Frederic
at 2023-06-20T21:47
大家好,我是中正資管所的碩二學生,目前正在進行畢業論文的研究,有份問卷關於探討 「企業員工在進行數據分析相關工作時,其執行的任務與大數據分析系統之間的配適度, 對於員工的績效與使用滿意度影響如何」。 想麻煩各位前輩幫忙填寫此學術問卷,若您符合本研究填答對象,誠摯地邀請您填寫,填 答時間約5分鐘,謝謝您! 研 ...

台積電熊本廠 恐怖交通排名全日本最差

Tracy avatar
By Tracy
at 2023-06-20T21:27
https://ec.ltn.com.tw/article/breakingnews/4339588 台積電熊本廠 恐怖交通排名全日本最差 2023/06/20 16:10 https://img.ltn.com.tw/Upload/business/page/800/2023/06/20/phpEzg ...

供電政策會不會因為科技業改變

Linda avatar
By Linda
at 2023-06-20T19:29
台灣缺電大家都知道。 台積電的董事長劉德音在美國發表2023台灣白皮書的時候,講了一句:「政府說2025年不 缺電,我們只能相信。」當初看到這句話的時候我真的是哭笑不得。任何對台灣能源政策 有一點研究的人都會知道未來在「能源轉型」的過程當中會有一段時間有蠻大的缺口。 然後台灣又是科技業的大國重鎮,啊科技業 ...