發布時間:2025-11-29 15:33:58 來源:企業錄(www.qy6.com)-公司信息發布,網上買賣交易門戶 作者:綜合
11月26日消息,新加向中據媒體報道,坡國新加坡國家人工智能計劃(AISG)正迎來一次關鍵的家AI計戰略轉向。在其最新的劃倒東南亞語言大模型項目中,AISG放棄了Meta的模型模型,轉而采用阿里巴巴的棄用千問通義千問(Qwen)開源架構。這一選擇不僅反映了技術路線上的轉投重新考量,也標志著中國開源AI模型在全球影響力擴展中的阿里重要一步。
11月25日,新加向中AISG發布了基于Qwen架構的坡國“Qwen-SEA-LION-v4”模型,該模型迅速登頂一項衡量東南亞語言能力的家AI計開源榜單。此舉旨在解決長期困擾該地區的劃倒語言適配難題——以Meta的Llama系列為代表的西方開源模型,在處理印尼語、模型泰語、棄用千問馬來語等區域性語言時表現欠佳,轉投嚴重制約了本地化AI應用的開發效率。
盡管Llama在開源模型中性能領先,但其“英語中心主義”的底層設計難以根本改變,在處理泰語、緬甸語等非拉丁語系文字時效率極低。AISG逐漸認識到,依賴硅谷的開源模型并非東南亞國家的最優解,必須尋找真正具備多語言理解能力、尤其是亞洲語言語境的基礎模型。
在這一背景下,AISG最終將目光投向了中國,選擇以阿里的Qwen3-32B作為新一代Sea-Lion模型的基座。
與西方模型不同,Qwen3在預訓練階段就使用了高達36萬億個token的數據,覆蓋全球119種語言和方言。這種“原生多語言能力”使其不僅“認識”印尼語、馬來語等文字,更能從底層理解其語法結構,大幅降低了AISG后續訓練的技術門檻。
為更好地適配東南亞語言獨特的書寫習慣,Qwen-Sea-Lion-v4摒棄了西方模型常用的“句子分詞器”,轉而采用更先進的字節對編碼(BPE)分詞器。該技術能更精準地切分泰語、緬甸語等無空格語言中的字符,顯著提升翻譯準確度與推理速度。
除技術優勢外,商業落地的現實考量也是阿里勝出的關鍵。東南亞地區擁有大量中小企業,難以承擔昂貴的H100 GPU集群。而經過優化的Qwen-Sea-Lion-v4可在配備32GB內存的消費級筆記本電腦上流暢運行,使普通開發者也能在本地部署這一國家級模型。這種“工業級能力、消費級門檻”的特性,精準契合了該地區算力資源稀缺的痛點。
此次合作并非單向技術輸出,而是一次深度的雙向融合。根據協議,阿里提供了強大的通用推理底座,AISG則貢獻了其經過清洗的1000億個東南亞語言token。這些數據完全規避版權風險,且東南亞內容濃度高達13%,是Llama2的26倍。
在Sea-Helm評估榜單中,搭載阿里技術核心的Sea-Lion v4迅速登頂同量級開源模型榜首,驗證了這一戰略合作的技術價值與區域適配性。
相關文章
隨便看看