不是網(wǎng)線,這年頭用在電視上的顯卡先被 Micro LED 技術(shù) ,還能做成網(wǎng)線,還沒(méi)用來(lái)傳數(shù)據(jù)了?跑滿
是這樣的,前陣子托尼在網(wǎng)上刷到這樣一條新聞,數(shù)據(jù)說(shuō)微軟正在研究通過(guò) Micro LED 光互聯(lián)技術(shù)(MOSAIC),中心來(lái)解決算力中心的卡脖數(shù)據(jù)傳輸,被 “卡脖子” 的網(wǎng)線問(wèn)題。
emmm,顯卡先被雖然聽(tīng)起來(lái)很抽象,還沒(méi)但是跑滿負(fù)責(zé)數(shù)據(jù)處理的算力中心,反過(guò)來(lái)被數(shù)據(jù)傳輸卡了脖子,數(shù)據(jù)竟然是中心因?yàn)樗懔χ行牡木W(wǎng)線 “不夠用了”。。卡脖。網(wǎng)線
你可能好奇了,我這會(huì)兒上某東搜條超六類的萬(wàn)兆(10Gbps)網(wǎng)線也就十幾塊錢,咋能不夠用呢?
但其實(shí)它們跟數(shù)據(jù)中心用的網(wǎng)線,在連接速率上,差了可不止一個(gè)數(shù)量級(jí) ——
我們家里的網(wǎng)線,通常能承載的最大速率就是 1000 Mbps - 2500 Mbps,也就是 1 Gbps - 2.5 Gbps。這兩年部分地區(qū)在推廣 “萬(wàn)兆網(wǎng)絡(luò)”,匹配了 10 Gbps 的網(wǎng)線,但這幾乎就是民用網(wǎng)線速率的上限了。
而數(shù)據(jù)中心的端口交換速率,100 Gbps 早就已經(jīng)是主流,AI 算力中心的交換機(jī),更是要做到 400 Gbps 起步。
其實(shí)就是因?yàn)?AI 大模型越來(lái)越大,在做訓(xùn)練和推理的時(shí)候,服務(wù)器之間和 GPU 之間,都得交換大量數(shù)據(jù),對(duì)帶寬的需求也就跟著變大了。
要傳遞這么多的數(shù)據(jù),數(shù)據(jù)中心現(xiàn)在用的銅纜和光纖,還真就 “不夠用了”。。。
先說(shuō)銅纜,這種材料的特性就是傳輸速率和有效距離只能顧一頭。為了達(dá)到數(shù)據(jù)中心要求的高速率,高速銅纜的長(zhǎng)度一般就只有 1-2m。這也就是為啥機(jī)柜內(nèi)部一個(gè)個(gè) GPU 之間,往往是用銅纜來(lái)連接。
隨著傳輸速率增加,銅纜有效距離逐漸縮短(a)、光纖功耗逐漸增加(b)
而光纖雖然跑得又快又遠(yuǎn),可以跨機(jī)柜連接。但它涉及到復(fù)雜的 “光電轉(zhuǎn)換”,相關(guān)的電路非常費(fèi)電,而且對(duì)溫度敏感,又容易老化,在機(jī)房這種極其高溫的環(huán)境下,非常容易出故障。
微軟的論文里就提到,如果全用光纖互聯(lián),那么英偉達(dá)的 GB200 NVL72 機(jī)柜,功耗會(huì)原地暴漲 17%;超大規(guī)模的 GPU 集群,會(huì)每 6-12 小時(shí)就發(fā)生一次鏈路故障。。。
所以在綜合考慮之后,英偉達(dá) GB200 NVL72 最終采用了銅纜連接方案。但這樣一來(lái),里面的 72 個(gè) GPU 只能被塞在單個(gè)機(jī)架里,導(dǎo)致整個(gè)機(jī)柜的供電和散熱壓力非常大。
而且維護(hù)起來(lái)也很麻煩。畢竟集成度做到這么高,一旦某個(gè) GPU 或者傳輸鏈路上的哪個(gè)部分出點(diǎn)什么問(wèn)題,真要修起來(lái),整個(gè)機(jī)柜的運(yùn)行都會(huì)受影響。
通過(guò)這個(gè)例子你也能發(fā)現(xiàn),傳統(tǒng)的銅纜和光纖通信,已經(jīng)不能同時(shí)滿足數(shù)據(jù)中心高帶寬、低功耗和長(zhǎng)距離的連接需求了。
而 MicroLED 光通信的出現(xiàn),就是為了解決這個(gè)問(wèn)題。
微軟提出的 MOSAIC,本質(zhì)上是用 MicroLED 像素做光源。你可以把發(fā)光的 MicroLED 像素陣列,想象成一個(gè)個(gè)摞起來(lái)的顯示器 ——
因?yàn)?MicroLED 像素可以獨(dú)立發(fā)光,每個(gè)像素就是一條傳輸數(shù)據(jù)的光通道。
所以發(fā)射端控制像素的亮滅,讓亮表示 1、滅表示 0。接收端再記錄每個(gè)像素的亮度變化,就能把接收到的長(zhǎng)串 0/1,還原成原始的數(shù)據(jù),也就能通過(guò)光信號(hào)來(lái)傳遞信息。
聽(tīng)上去跟傳統(tǒng)光纖的通信原理差不多,但不同于光纖的 “窄帶寬、高速率”,MOSAIC 的傳輸模式屬于 “寬而慢” ——
咱們先來(lái)聊聊 “慢” 的事情。
MOSAIC 就規(guī)定,不需要像傳統(tǒng)光纖通信那樣,把單通道卷到 50 Gb/s、甚至 100 Gb/s 的超高速率,每個(gè) MicroLED 像素可以摸摸魚(yú),只跑 2 Gb/s 的 “低速率” 。
用這么慢的速率,還能實(shí)現(xiàn)高速傳輸,靠的是 MOSAIC 的另一個(gè)特性 “寬”。
以往要做到 800Gbps 帶寬,需要靠 8 個(gè) 100Gbps 的高速通道,而 MOSAIC 雖然單個(gè)通道降到了 2Gbps,但把 MicroLED 陣列做成 400 個(gè)像素點(diǎn),就可以實(shí)現(xiàn) 800Gbps 的帶寬。
但可千萬(wàn)不要以為,MicroLED 光通信的模塊體積和功耗,也會(huì)跟著 “失控 ”——
之所以 MOSAIC 敢用規(guī)模換速度,一方面是因?yàn)?MicroLED 像素本身只有幾微米到幾十微米,即使做成 400 個(gè)像素點(diǎn)的陣列,核心發(fā)光的芯片體積也不足 1 mm?。而傳統(tǒng) 800Gbps 級(jí)別的光模塊,核心的 光源/調(diào)制器體積,會(huì)達(dá)到 十幾 mm? 甚至幾十 mm? 的量級(jí)。
相當(dāng)于把一粒小米和一粒大米放在桌面上比大小。
Micro LED 在同樣的像素間距下,像素尺寸更小、排列更密集
即使把 MicroLED 的連接速率,拓展到 1.6 Tbps,甚至 3.2 Tbps,也就是目前數(shù)據(jù)中心主流傳輸速率的 4 倍,整個(gè) MicroLED 光模塊的體積,也不會(huì)比傳統(tǒng)光纖的光模塊更大。。。
另外一方面,MOSAIC 的傳輸線纜也比較硬核,直接把醫(yī)療內(nèi)窺鏡里用的 “多芯成像光纖” 搬進(jìn)了機(jī)房。簡(jiǎn)單來(lái)說(shuō),MicroLED 光通道的增加,并不會(huì)讓線纜變得更占地方。
因?yàn)檫@種光纖的內(nèi)部包含成千上萬(wàn)個(gè)細(xì)小的纖芯,數(shù)量上完全可以覆蓋 MicroLED 幾百個(gè)光通道的連接需求。
MicroLED 多纖成像光纖,可承載數(shù)百個(gè)光通道
還是拿 800Gbps 的帶寬舉例,傳統(tǒng)的光纖方案,需要把 16 根單模光纖( 8 根發(fā)射 + 8 根接收 ),封裝到一起。而 “多芯成像光纖” 相當(dāng)于用一根線纜就能搞定高帶寬。
而且,這類多芯成像光纖可以做到 50m 的有效傳輸距離,也已經(jīng)遠(yuǎn)超銅纜連接的極限了。
再加上,MicroLED 結(jié)構(gòu)簡(jiǎn)單,所以控制像素亮滅的電流開(kāi)關(guān)也能做得簡(jiǎn)單,省去了不少傳統(tǒng)光模塊的高功耗電路。
根據(jù)微軟的數(shù)據(jù),實(shí)現(xiàn)相同的帶寬,MOSAIC 的功耗,相比傳統(tǒng)的光纖互聯(lián),最多可以降低 68%,故障率更是可以降到原來(lái)的 1/100。。。
可以說(shuō),有了這個(gè)技術(shù),往后再搭建機(jī)柜或者服務(wù)器,就不需要在“粗重的銅纜”,和 “高功耗的光纖模塊” 中間糾結(jié),而是多了一條在功耗、距離和帶寬之間更平衡的第三種方案。
數(shù)據(jù)中心常用的連接方案:交換機(jī)之間采用光纖連接,機(jī)柜內(nèi)部采用銅纜連接
只不過(guò),目前 MicroLED 光通信還停留在技術(shù)驗(yàn)證階段,臺(tái)積電、Avicena、兆馳等廠商也還在做原型機(jī)和產(chǎn)業(yè)布局,真正的大規(guī)模商用還沒(méi)有落地。
不過(guò)托尼倒是很看好這個(gè)技術(shù)的發(fā)展前景,畢竟 MicroLED 光通信,可是實(shí)打?qū)嵉貢?huì)降低功耗,而國(guó)外的電力緊缺一直是個(gè)大問(wèn)題。
還有更重要的一點(diǎn),就是咱們開(kāi)頭提到的,現(xiàn)在算力中心越來(lái)越被通信效率 “卡脖子” 的問(wèn)題。或者換個(gè)角度來(lái)說(shuō),通信效率的革命,會(huì)反過(guò)來(lái)彌補(bǔ)算力的劣勢(shì)。
就比如現(xiàn)在華為的 384 超節(jié)點(diǎn),里面單個(gè)昇騰 AI 處理器的性能并沒(méi)有那么強(qiáng),但通過(guò) 384 顆 NPU 互相串聯(lián)成算力集群,就能夠讓整臺(tái)機(jī)器的性能,對(duì)標(biāo)英偉達(dá)的 GB200 NVL72。
那么我想,能不能靠新的光通信協(xié)議 “彎道超車”,把數(shù)據(jù)傳輸做得更快、更省電、更可靠,可能會(huì)是 AI 競(jìng)賽和算力 “游戲” 的下半場(chǎng)。。。







