12月7日消息,護城河年日前NVIDIA正式推出了CUDA 13.1,最大正式官方將其定位為“自2006年CUDA平臺誕生以來最大、更新最全面的發布升級”。
此次更新的護城河年核心亮點,是最大正式引入了革命性的CUDA Tile編程模型,標志著GPU編程范式邁入一個新的更新、更高抽象的發布階段。
傳統的護城河年GPU編程基于SIMT (單指令多線程) 模式,開發者需要關注線程、最大正式內存和同步等底層細節。更新
而CUDA Tile是發布一種基于tile(瓦片、數據塊)的護城河年模型,開發者現在可以專注于將數據組織成塊,最大正式并對這些數據塊執行計算,更新而底層的線程調度、內存布局以及硬件資源映射等復雜工作,將由編譯器和運行時自動處理。
為支持Tile編程,CUDA 13.1引入了虛擬指令集(Tile IR),并配套發布了cuTile工具,允許開發者使用Python來編寫基于Tile的GPU Kernel。
這極大地降低了GPU編程的門檻,使得不熟悉傳統CUDA C/C++或底層SIMT模型的數據科學家和研究者也能編寫GPU加速代碼。
Tile編程并非取代SIMT,而是提供了一個并存的可選路徑,開發者可根據具體應用場景,靈活選擇最合適的編程模型。
CUDA 13.1的意義,不僅在于新增功能或優化性能,更在于為構建新一代高層、跨架構的GPU計算庫和框架奠定了基礎,通過引入Tile IR和高層抽象,NVIDIA在硬件和軟件之間增加了一個更厚的中間層。
過去,競爭對手(如AMD的ROCm、Intel的OneAPI)主要依賴兼容層進行CUDA代碼轉譯,但對于CUDA Tile這種更高抽象的新模式,單純的代碼轉譯已遠不足夠。
競爭對手必須構建同樣智能的編譯器來處理Tile IR,這無疑增加了技術對齊的難度,客觀上進一步提升了CUDA生態系統的粘性和用戶鎖定度。


相關文章



精彩導讀
熱門資訊
關注我們