首發(fā)“花港”新架構(gòu)!摩爾線程華山GPU芯片發(fā)布:部分性能超越英偉達Blackwell
作者:娛樂 來源:時尚 瀏覽: 【大 中 小】 發(fā)布時間:2025-12-21 12:55:49 評論數(shù):
12月20日消息,花港摩爾線程華山GPU芯片正式發(fā)布,首發(fā)山首發(fā)采用“花港”新架構(gòu)。新架芯片性
定位AI訓(xùn)推一體、構(gòu)摩超智融合,爾線同時配套發(fā)布超十萬卡級AI工廠技術(shù)與新一代高性能張量計算系統(tǒng)。程華超
華山以“花港”架構(gòu)為基礎(chǔ),發(fā)布聚焦AI訓(xùn)練與推理場景的部分一體化能力,在系統(tǒng)級支撐技術(shù)方面,英偉配備超十萬卡級AI工廠技術(shù)。花港
新一代Scale-up系統(tǒng):搭載MTLink 4.0+多種類以太協(xié)議,首發(fā)山片間互聯(lián)速度達134.5Gb/s,新架芯片性支持擴展至1024 GPUs規(guī)模,構(gòu)摩適配多種Scale-up,爾線支持SHARP技術(shù);
RAS 2.0:新增SRAM奇偶校驗及ECC能力,程華超強化錯誤檢測、上報與隔離功能,同時全面提升debuggability能力;
ACE2.0新一代異步通信引擎:通過架構(gòu)優(yōu)化實現(xiàn)更高效的通信調(diào)度,支撐大規(guī)模集群的協(xié)同運算。
采用新一代高性能張量計算系統(tǒng),全精度MMA:支持TF32/FP16等;實現(xiàn)端到端加速的混合低精度計算,適配大語言模型等AI場景需求。
性能指標方面,“華山”GPU在浮點算力、訪存帶寬、訪存容量、高速互聯(lián)帶寬等性能上大幅超過英偉達hopper,部分性能媲美甚至超越英偉達Blackwell架構(gòu)產(chǎn)品,進一步強化了在AI大模型訓(xùn)推場景的技術(shù)競爭力。
