不是網(wǎng)線,這年頭用在電視上的顯卡先被 Micro LED 技術 ,還能做成網(wǎng)線,還沒用來傳數(shù)據(jù)了?跑滿
是這樣的,前陣子托尼在網(wǎng)上刷到這樣一條新聞,數(shù)據(jù)說微軟正在研究通過 Micro LED 光互聯(lián)技術(MOSAIC),中心來解決算力中心的卡脖數(shù)據(jù)傳輸,被 “卡脖子” 的網(wǎng)線問題。
emmm,顯卡先被雖然聽起來很抽象,還沒但是跑滿負責數(shù)據(jù)處理的算力中心,反過來被數(shù)據(jù)傳輸卡了脖子,數(shù)據(jù)竟然是中心因為算力中心的網(wǎng)線 “不夠用了”。??ú薄>W(wǎng)線
你可能好奇了,我這會兒上某東搜條超六類的萬兆(10Gbps)網(wǎng)線也就十幾塊錢,咋能不夠用呢?
但其實它們跟數(shù)據(jù)中心用的網(wǎng)線,在連接速率上,差了可不止一個數(shù)量級 ——
我們家里的網(wǎng)線,通常能承載的最大速率就是 1000 Mbps - 2500 Mbps,也就是 1 Gbps - 2.5 Gbps。這兩年部分地區(qū)在推廣 “萬兆網(wǎng)絡”,匹配了 10 Gbps 的網(wǎng)線,但這幾乎就是民用網(wǎng)線速率的上限了。
而數(shù)據(jù)中心的端口交換速率,100 Gbps 早就已經(jīng)是主流,AI 算力中心的交換機,更是要做到 400 Gbps 起步。
其實就是因為 AI 大模型越來越大,在做訓練和推理的時候,服務器之間和 GPU 之間,都得交換大量數(shù)據(jù),對帶寬的需求也就跟著變大了。
要傳遞這么多的數(shù)據(jù),數(shù)據(jù)中心現(xiàn)在用的銅纜和光纖,還真就 “不夠用了”。。。
先說銅纜,這種材料的特性就是傳輸速率和有效距離只能顧一頭。為了達到數(shù)據(jù)中心要求的高速率,高速銅纜的長度一般就只有 1-2m。這也就是為啥機柜內部一個個 GPU 之間,往往是用銅纜來連接。
隨著傳輸速率增加,銅纜有效距離逐漸縮短(a)、光纖功耗逐漸增加(b)
而光纖雖然跑得又快又遠,可以跨機柜連接。但它涉及到復雜的 “光電轉換”,相關的電路非常費電,而且對溫度敏感,又容易老化,在機房這種極其高溫的環(huán)境下,非常容易出故障。
微軟的論文里就提到,如果全用光纖互聯(lián),那么英偉達的 GB200 NVL72 機柜,功耗會原地暴漲 17%;超大規(guī)模的 GPU 集群,會每 6-12 小時就發(fā)生一次鏈路故障。。。
所以在綜合考慮之后,英偉達 GB200 NVL72 最終采用了銅纜連接方案。但這樣一來,里面的 72 個 GPU 只能被塞在單個機架里,導致整個機柜的供電和散熱壓力非常大。
而且維護起來也很麻煩。畢竟集成度做到這么高,一旦某個 GPU 或者傳輸鏈路上的哪個部分出點什么問題,真要修起來,整個機柜的運行都會受影響。
通過這個例子你也能發(fā)現(xiàn),傳統(tǒng)的銅纜和光纖通信,已經(jīng)不能同時滿足數(shù)據(jù)中心高帶寬、低功耗和長距離的連接需求了。
而 MicroLED 光通信的出現(xiàn),就是為了解決這個問題。
微軟提出的 MOSAIC,本質上是用 MicroLED 像素做光源。你可以把發(fā)光的 MicroLED 像素陣列,想象成一個個摞起來的顯示器 ——
因為 MicroLED 像素可以獨立發(fā)光,每個像素就是一條傳輸數(shù)據(jù)的光通道。
所以發(fā)射端控制像素的亮滅,讓亮表示 1、滅表示 0。接收端再記錄每個像素的亮度變化,就能把接收到的長串 0/1,還原成原始的數(shù)據(jù),也就能通過光信號來傳遞信息。
聽上去跟傳統(tǒng)光纖的通信原理差不多,但不同于光纖的 “窄帶寬、高速率”,MOSAIC 的傳輸模式屬于 “寬而慢” ——
咱們先來聊聊 “慢” 的事情。
MOSAIC 就規(guī)定,不需要像傳統(tǒng)光纖通信那樣,把單通道卷到 50 Gb/s、甚至 100 Gb/s 的超高速率,每個 MicroLED 像素可以摸摸魚,只跑 2 Gb/s 的 “低速率” 。
用這么慢的速率,還能實現(xiàn)高速傳輸,靠的是 MOSAIC 的另一個特性 “寬”。
以往要做到 800Gbps 帶寬,需要靠 8 個 100Gbps 的高速通道,而 MOSAIC 雖然單個通道降到了 2Gbps,但把 MicroLED 陣列做成 400 個像素點,就可以實現(xiàn) 800Gbps 的帶寬。
但可千萬不要以為,MicroLED 光通信的模塊體積和功耗,也會跟著 “失控 ”——
之所以 MOSAIC 敢用規(guī)模換速度,一方面是因為 MicroLED 像素本身只有幾微米到幾十微米,即使做成 400 個像素點的陣列,核心發(fā)光的芯片體積也不足 1 mm?。而傳統(tǒng) 800Gbps 級別的光模塊,核心的 光源/調制器體積,會達到 十幾 mm? 甚至幾十 mm? 的量級。
相當于把一粒小米和一粒大米放在桌面上比大小。
Micro LED 在同樣的像素間距下,像素尺寸更小、排列更密集
即使把 MicroLED 的連接速率,拓展到 1.6 Tbps,甚至 3.2 Tbps,也就是目前數(shù)據(jù)中心主流傳輸速率的 4 倍,整個 MicroLED 光模塊的體積,也不會比傳統(tǒng)光纖的光模塊更大。。。
另外一方面,MOSAIC 的傳輸線纜也比較硬核,直接把醫(yī)療內窺鏡里用的 “多芯成像光纖” 搬進了機房。簡單來說,MicroLED 光通道的增加,并不會讓線纜變得更占地方。
因為這種光纖的內部包含成千上萬個細小的纖芯,數(shù)量上完全可以覆蓋 MicroLED 幾百個光通道的連接需求。
MicroLED 多纖成像光纖,可承載數(shù)百個光通道
還是拿 800Gbps 的帶寬舉例,傳統(tǒng)的光纖方案,需要把 16 根單模光纖( 8 根發(fā)射 + 8 根接收 ),封裝到一起。而 “多芯成像光纖” 相當于用一根線纜就能搞定高帶寬。
而且,這類多芯成像光纖可以做到 50m 的有效傳輸距離,也已經(jīng)遠超銅纜連接的極限了。
再加上,MicroLED 結構簡單,所以控制像素亮滅的電流開關也能做得簡單,省去了不少傳統(tǒng)光模塊的高功耗電路。
根據(jù)微軟的數(shù)據(jù),實現(xiàn)相同的帶寬,MOSAIC 的功耗,相比傳統(tǒng)的光纖互聯(lián),最多可以降低 68%,故障率更是可以降到原來的 1/100。。。
可以說,有了這個技術,往后再搭建機柜或者服務器,就不需要在“粗重的銅纜”,和 “高功耗的光纖模塊” 中間糾結,而是多了一條在功耗、距離和帶寬之間更平衡的第三種方案。
數(shù)據(jù)中心常用的連接方案:交換機之間采用光纖連接,機柜內部采用銅纜連接
只不過,目前 MicroLED 光通信還停留在技術驗證階段,臺積電、Avicena、兆馳等廠商也還在做原型機和產(chǎn)業(yè)布局,真正的大規(guī)模商用還沒有落地。
不過托尼倒是很看好這個技術的發(fā)展前景,畢竟 MicroLED 光通信,可是實打實地會降低功耗,而國外的電力緊缺一直是個大問題。
還有更重要的一點,就是咱們開頭提到的,現(xiàn)在算力中心越來越被通信效率 “卡脖子” 的問題?;蛘邠Q個角度來說,通信效率的革命,會反過來彌補算力的劣勢。
就比如現(xiàn)在華為的 384 超節(jié)點,里面單個昇騰 AI 處理器的性能并沒有那么強,但通過 384 顆 NPU 互相串聯(lián)成算力集群,就能夠讓整臺機器的性能,對標英偉達的 GB200 NVL72。
那么我想,能不能靠新的光通信協(xié)議 “彎道超車”,把數(shù)據(jù)傳輸做得更快、更省電、更可靠,可能會是 AI 競賽和算力 “游戲” 的下半場。。。







