12月7日消息,護(hù)城河年日前NVIDIA正式推出了CUDA 13.1,最大正式官方將其定位為“自2006年CUDA平臺(tái)誕生以來(lái)最大、更新最全面的發(fā)布升級(jí)”。
此次更新的護(hù)城河年核心亮點(diǎn),是最大正式引入了革命性的CUDA Tile編程模型,標(biāo)志著GPU編程范式邁入一個(gè)新的更新、更高抽象的發(fā)布階段。
傳統(tǒng)的護(hù)城河年GPU編程基于SIMT (單指令多線程) 模式,開(kāi)發(fā)者需要關(guān)注線程、最大正式內(nèi)存和同步等底層細(xì)節(jié)。更新
而CUDA Tile是發(fā)布一種基于tile(瓦片、數(shù)據(jù)塊)的護(hù)城河年模型,開(kāi)發(fā)者現(xiàn)在可以專注于將數(shù)據(jù)組織成塊,最大正式并對(duì)這些數(shù)據(jù)塊執(zhí)行計(jì)算,更新而底層的線程調(diào)度、內(nèi)存布局以及硬件資源映射等復(fù)雜工作,將由編譯器和運(yùn)行時(shí)自動(dòng)處理。
為支持Tile編程,CUDA 13.1引入了虛擬指令集(Tile IR),并配套發(fā)布了cuTile工具,允許開(kāi)發(fā)者使用Python來(lái)編寫(xiě)基于Tile的GPU Kernel。
這極大地降低了GPU編程的門(mén)檻,使得不熟悉傳統(tǒng)CUDA C/C++或底層SIMT模型的數(shù)據(jù)科學(xué)家和研究者也能編寫(xiě)GPU加速代碼。
Tile編程并非取代SIMT,而是提供了一個(gè)并存的可選路徑,開(kāi)發(fā)者可根據(jù)具體應(yīng)用場(chǎng)景,靈活選擇最合適的編程模型。
CUDA 13.1的意義,不僅在于新增功能或優(yōu)化性能,更在于為構(gòu)建新一代高層、跨架構(gòu)的GPU計(jì)算庫(kù)和框架奠定了基礎(chǔ),通過(guò)引入Tile IR和高層抽象,NVIDIA在硬件和軟件之間增加了一個(gè)更厚的中間層。
過(guò)去,競(jìng)爭(zhēng)對(duì)手(如AMD的ROCm、Intel的OneAPI)主要依賴兼容層進(jìn)行CUDA代碼轉(zhuǎn)譯,但對(duì)于CUDA Tile這種更高抽象的新模式,單純的代碼轉(zhuǎn)譯已遠(yuǎn)不足夠。
競(jìng)爭(zhēng)對(duì)手必須構(gòu)建同樣智能的編譯器來(lái)處理Tile IR,這無(wú)疑增加了技術(shù)對(duì)齊的難度,客觀上進(jìn)一步提升了CUDA生態(tài)系統(tǒng)的粘性和用戶鎖定度。


相關(guān)文章




精彩導(dǎo)讀
熱門(mén)資訊
關(guān)注我們