早前藍點網提到英偉達推出專用加速卡NVIDIA H100,該加速卡是前代加速卡A100性能的3倍價格也是3倍。
趁著AI熱潮黃仁勳顯然再次抓住熱點:英偉達今天宣布推出針對LLM大型語言模型的專用加速卡H100 NVL。
推出這個新SKU是因為英偉達注意到LLM運行時,超大量的數據會迅速填充顯存,普通版本已經跟不上使用。
所以NVIDIA H100 NVL是迄今為止顯存容量最大的版本,顯存為188GB HBM3 顯存,單卡顯存容量94GB。

專門為LLM設計的新版本:
英偉達在新聞稿中表示 NVIDIA H100 加速卡已經全麵投產,很快英偉達和合作夥伴將向全球企業推出新卡。
H100加速卡在LLM上提供快9倍的AI訓練以及快30倍的AI推理 , 為全球AI企業發揮創造力提供強大動力基礎。
不過今天還有個重點就是H100 NVL版 , 這是英偉達專門麵向大型語言模型推出的新SKU主要就是超大顯存。
H100 NVL實際上是2張H100合並後的結果 , 主要通過PCIe板進行橋接,每張卡顯存為94GB合計為188GB。
連插槽都是2個PCIe 5.0的因此普通主板都插不上,估計要購買 H100 NVL 的話也得順帶購買配套專用主板。
具體價格方麵目前還不清楚,此前傳聞H100售價 32000 美元約合人民幣22萬元,H100 NVL也必然會翻倍。
以下是H100三種SKU參數對比:
| NVIDIA H100 Accelerator Specification Comparison | |||||
| H100 NVL | H100 PCIe | H100 SXM | |||
| FP32 CUDA Cores | 2 x 16896? | 14592 | 16896 | ||
| Tensor Cores | 2 x 528? | 456 | 528 | ||
| Boost Clock | 1.98GHz? | 1.75GHz | 1.98GHz | ||
| Memory Clock | ~5.1Gbps HBM3 | 3.2Gbps HBM2e | 5.23Gbps HBM3 | ||
| Memory Bus Width | 6144-bit | 5120-bit | 5120-bit | ||
| Memory Bandwidth | 2 x 3.9TB/sec | 2TB/sec | 3.35TB/sec | ||
| VRAM | 2 x 94GB (188GB) | 80GB | 80GB | ||
| FP32 Vector | 2 x 67 TFLOPS? | 51 TFLOPS | 67 TFLOPS | ||
| FP64 Vector | 2 x 34 TFLOPS? | 26 TFLOPS | 34 TFLOPS | ||
| INT8 Tensor | 2 x 1980 TOPS | 1513 TOPS | 1980 TOPS | ||
| FP16 Tensor | 2 x 990 TFLOPS | 756 TFLOPS | 990 TFLOPS | ||
| TF32 Tensor | 2 x 495 TFLOPS | 378 TFLOPS | 495 TFLOPS | ||
| FP64 Tensor | 2 x 67 TFLOPS? | 51 TFLOPS | 67 TFLOPS | ||
| Interconnect | NVLink 4 18 Links (900GB/sec) | NVLink 4 (600GB/sec) | NVLink 4 18 Links (900GB/sec) | ||
| GPU | 2 x GH100 (814mm2) | GH100 (814mm2) | GH100 (814mm2) | ||
| Transistor Count | 2 x 80B | 80B | 80B | ||
| TDP | 700W | 350W | 700-800W | ||
| Manufacturing Process | TSMC 4N | TSMC 4N | TSMC 4N | ||
| Interface | 2 x PCIe 5.0 (Quad Slot) | PCIe 5.0 (Dual Slot) | SXM5 | ||
| Architecture | Hopper | Hopper | Hopper | ||
(责任编辑:娛樂)
膏藥貼太久的害處如果膏藥一貼3天,或者兩貼之間不清洗,不留一點兒間隔,膏藥中的成分就可能經過汗孔侵入皮膚深處,誘發過敏,引起接觸性皮炎,俗名膏藥風。...[详细]
提示:試試鍵盤←→可以實現快速翻頁。...[详细]
蘋果將在歐盟地區調整蘋果稅,蘋果原本設置了30%和15%兩檔抽成比例。...[详细]
通過主機內存緩衝(HMB)技術,即使采用無緩存設計,固態硬盤也可以實現性能優化,用戶將體驗到明顯更快的遊戲加載速度和對大文件的更快訪問速度。...[详细]
AMD帶來24.1.1版本顯卡驅動帶來AFMF和多項新功能支持AMD現已兌現此前的承諾,於今天正式發布了AMDSoftwareAdrenalinEdition24.1.1驅動程序,增加了對新款Rade...[详细]
如初期火災撲救失敗,應及時關閉車廂門,防止火勢蔓延贏取逃生時間。...[详细]
知道自己的臉型,找到適合腮紅的方式,讓腮紅成為大家修飾麵容,提升氣質最好的伴侶。...[详细]
FindN2新增多頁麵分屏、跨屏分享、分屏截圖功能,讓信息的呈現、截取、分享更加高效。...[详细]
遊戲玩法很多所以不固定思路...[详细]
聖誕眉妝也可以是簡單的,就用綠色的配飾用來點綴,就會看起來很清爽和舒服的感覺的,也會讓人比較容易接受,很好看的樣子。...[详细]