12月7日消息,護城河年日前NVIDIA正式推出了CUDA 13.1,最大正式官方將其定位為“自2006年CUDA平臺誕生以來最大、更新最全面的發(fā)布升級”。
此次更新的護城河年核心亮點,是最大正式引入了革命性的CUDA Tile編程模型,標志著GPU編程范式邁入一個新的更新、更高抽象的發(fā)布階段。
傳統(tǒng)的護城河年GPU編程基于SIMT (單指令多線程) 模式,開發(fā)者需要關(guān)注線程、最大正式內(nèi)存和同步等底層細節(jié)。更新
而CUDA Tile是發(fā)布一種基于tile(瓦片、數(shù)據(jù)塊)的護城河年模型,開發(fā)者現(xiàn)在可以專注于將數(shù)據(jù)組織成塊,最大正式并對這些數(shù)據(jù)塊執(zhí)行計算,更新而底層的線程調(diào)度、內(nèi)存布局以及硬件資源映射等復雜工作,將由編譯器和運行時自動處理。
為支持Tile編程,CUDA 13.1引入了虛擬指令集(Tile IR),并配套發(fā)布了cuTile工具,允許開發(fā)者使用Python來編寫基于Tile的GPU Kernel。
這極大地降低了GPU編程的門檻,使得不熟悉傳統(tǒng)CUDA C/C++或底層SIMT模型的數(shù)據(jù)科學家和研究者也能編寫GPU加速代碼。
Tile編程并非取代SIMT,而是提供了一個并存的可選路徑,開發(fā)者可根據(jù)具體應用場景,靈活選擇最合適的編程模型。
CUDA 13.1的意義,不僅在于新增功能或優(yōu)化性能,更在于為構(gòu)建新一代高層、跨架構(gòu)的GPU計算庫和框架奠定了基礎(chǔ),通過引入Tile IR和高層抽象,NVIDIA在硬件和軟件之間增加了一個更厚的中間層。
過去,競爭對手(如AMD的ROCm、Intel的OneAPI)主要依賴兼容層進行CUDA代碼轉(zhuǎn)譯,但對于CUDA Tile這種更高抽象的新模式,單純的代碼轉(zhuǎn)譯已遠不足夠。
競爭對手必須構(gòu)建同樣智能的編譯器來處理Tile IR,這無疑增加了技術(shù)對齊的難度,客觀上進一步提升了CUDA生態(tài)系統(tǒng)的粘性和用戶鎖定度。


相關(guān)文章




精彩導讀
熱門資訊
關(guān)注我們