摩爾線程新一代架構(gòu)支持十萬卡集群!性能超NVIDIA
作者:休閑 來源:百科 瀏覽: 【大 中 小】 發(fā)布時(shí)間:2025-12-21 12:21:32 評論數(shù):
12月20日消息,線程新代性在今天的架構(gòu)集群首屆MUSA開發(fā)者大會(huì)上,摩爾線程正式發(fā)布了新一代GPU架構(gòu)“花港”,支持并帶來了首款基于“花港”的線程新代性云端AI加速GPU“華山”。
“華山”芯片可應(yīng)用于超十萬卡級的架構(gòu)集群AI工廠,其搭載新一代Scale-up系統(tǒng),支持兼容MTLink 4.0和多種以太協(xié)議,線程新代性適配多種Scale-up switch,架構(gòu)集群支持SHARP,支持片間互聯(lián)速率可達(dá)1314GB/s。線程新代性
據(jù)介紹,架構(gòu)集群KUAE萬卡群浮點(diǎn)運(yùn)算能力可達(dá)10 Exa - FLOPS,支持精度模型效果優(yōu)于國際主流,線程新代性大模型MFU可達(dá)60%。架構(gòu)集群
此外,支持集群有效訓(xùn)練時(shí)長達(dá)到90%,零中斷技術(shù)理論可達(dá)99%,萬卡集群訓(xùn)練線性度達(dá)到了95%,性價(jià)比更是達(dá)到HXX(H20)的1.5倍。
根據(jù)官方數(shù)據(jù),在DeepSeek R1全量模型分布式推理性能方面,MTT S5000的PD分離-分布式集群, DeepSeek Prefill Only性能單卡吞吐達(dá)到H20的2.5倍,DeepSeek Decode單卡吞吐達(dá)到1.3倍。
