當(dāng)前位置：當(dāng)前位置：首頁 > 探索 > 摩爾線程新一代架構(gòu)支持十萬卡集群！性能超NVIDIA正文

摩爾線程新一代架構(gòu)支持十萬卡集群！性能超NVIDIA

作者:休閑　來源:百科　瀏覽:　【大 中 小】　發(fā)布時(shí)間:2025-12-21 12:21:32 評論數(shù):

12月20日消息，線程新代性在今天的架構(gòu)集群首屆MUSA開發(fā)者大會(huì)上，摩爾線程正式發(fā)布了新一代GPU架構(gòu)“花港”，支持并帶來了首款基于“花港”的線程新代性云端AI加速GPU“華山”。

“華山”芯片可應(yīng)用于超十萬卡級的架構(gòu)集群AI工廠，其搭載新一代Scale-up系統(tǒng)，支持兼容MTLink 4.0和多種以太協(xié)議，線程新代性適配多種Scale-up switch，架構(gòu)集群支持SHARP，支持片間互聯(lián)速率可達(dá)1314GB/s。線程新代性

據(jù)介紹，架構(gòu)集群KUAE萬卡群浮點(diǎn)運(yùn)算能力可達(dá)10 Exa - FLOPS，支持精度模型效果優(yōu)于國際主流，線程新代性大模型MFU可達(dá)60%。架構(gòu)集群

此外，支持集群有效訓(xùn)練時(shí)長達(dá)到90%，零中斷技術(shù)理論可達(dá)99%，萬卡集群訓(xùn)練線性度達(dá)到了95%，性價(jià)比更是達(dá)到HXX（H20）的1.5倍。

根據(jù)官方數(shù)據(jù)，在DeepSeek R1全量模型分布式推理性能方面，MTT S5000的PD分離-分布式集群， DeepSeek Prefill Only性能單卡吞吐達(dá)到H20的2.5倍，DeepSeek Decode單卡吞吐達(dá)到1.3倍。