新浪科技訊 12月4日晚間消息,亞馬在亞馬遜云科技2025re:Invent全球大會上,遜云芯片亞馬遜云科技首席執(zhí)行官Matt Garman宣布推出全新的科技P6E GB300系列,并正式發(fā)布基于研芯片Trainium3和基于該芯片的推出Trn3 UltraServers服務(wù)器。
他介紹,自研“這些產(chǎn)品(P6E GB300)采用英偉達最新的亞馬GB300 NVL72系統(tǒng),我們持續(xù)為最苛刻的遜云芯片AI工作負載提供頂級算力。我們在硬件、科技軟件與運營層面的推出全棧嚴謹性,為全球最大的自研企業(yè)提供最佳的可靠性和性能。其中包括英偉達自己——他們的亞馬大規(guī)模GenAI集群Project Ceiba就運行在亞馬遜云科技上;以及像OpenAI這樣的大型機構(gòu)也在積極使用亞馬遜云科技。這些大型企業(yè)如今都在使用擁有數(shù)十萬顆芯片的遜云芯片EC2 UltraServers集群,目前使用的科技是GB200系列,很快就會用到GB300系列。推出”
此外,自研Matt Garman還宣布推出Amazon AI Factories。“通過這一發(fā)布,我們讓客戶能夠在自己的數(shù)據(jù)中心內(nèi)部署專屬的亞馬遜云科技AI基礎(chǔ)設(shè)施,供其獨享。實際上,AI Factory就像一個‘亞馬遜云科技私有區(qū)域’,讓客戶利用已有的數(shù)據(jù)中心空間與電力能力,同時仍然能夠訪問亞馬遜云科技領(lǐng)先的AI基礎(chǔ)設(shè)施與服務(wù),包括最新的訓(xùn)練集群、Nvidia GPU,以及Amazon SageMaker和Amazon Bedrock等服務(wù)。”
他介紹,AI Factories是為每個客戶獨立運行的,幫助他們保持物理與邏輯隔離,同時繼續(xù)享有來自亞馬遜云科技的安全性與可靠性,也能滿足嚴格的合規(guī)與數(shù)據(jù)主權(quán)要求。
亞馬遜云科技還宣布推出自研AI芯片Amazon Trainium。Matt Garman介紹,Trainium 2目前實際上是全世界最佳的推理系統(tǒng)之一。他表示,“事實上,我們在數(shù)據(jù)中心部署Trainium2的速度,比我們過去部署任何芯片的速度都快好幾倍。是的,這是我們迄今部署速度最快的AI芯片,我們現(xiàn)在的銷售速度幾乎和產(chǎn)能齊平。僅訓(xùn)練芯片這一部分,今天已是一個數(shù)十億美元規(guī)模的業(yè)務(wù),并且仍在快速增長。”
此外,亞馬遜云科技在去年官宣布的新一代芯片 Trainium 3,也有了新進展,目前Trainium 3 UltraServers 正式可用。“我很高興地宣布,我們已經(jīng)在全力研發(fā)Trainium4,并且已經(jīng)進入深度設(shè)計階段,對目前看到的結(jié)果十分期待。與Trainium3相比,Trainium4將在所有維度實現(xiàn)巨大躍升:FP4計算性能提升6倍、內(nèi)存帶寬提升4倍、高帶寬內(nèi)存容量提升2倍,以支持全球最大規(guī)模模型的訓(xùn)練需求。”
海量資訊、精準解讀,盡在新浪財經(jīng)APP 責(zé)任編輯:何俊熹


相關(guān)文章




精彩導(dǎo)讀
熱門資訊
關(guān)注我們