發(fā)布時(shí)間:2025-11-29 04:58:29 來源:企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶 作者:時(shí)尚
在近日公布的中國國際權(quán)威醫(yī)學(xué)多模態(tài)推理評(píng)測集MedXpertQA的MM子集榜單中,由中國企業(yè)緣啟智慧(北京)科技有限公司自主研發(fā)的閃耀醫(yī)療AI智能體MentX一舉斬獲中國區(qū)第一名,全球第二,國際國區(qū)力壓GPT-4o、權(quán)威全球GPT-5-mini等國際主流大模型,醫(yī)學(xué)醫(yī)學(xué)展現(xiàn)出“斷崖式”領(lǐng)先優(yōu)勢。評(píng)測
此次MedXpertQA評(píng)測為全球公開、多第中第標(biāo)準(zhǔn)化的模態(tài)多模態(tài)醫(yī)學(xué)推理挑戰(zhàn),涵蓋復(fù)雜臨床場景下的推理影像識(shí)別、病歷理解與診斷推理能力評(píng)估,中國吸引了來自中美歐多地的閃耀主流AI模型參與,被譽(yù)為“醫(yī)療AI領(lǐng)域的國際國區(qū)奧林匹克”。在這一國際化舞臺(tái)上,權(quán)威全球MentX不僅躋身全球前列,醫(yī)學(xué)醫(yī)學(xué)更以顯著優(yōu)勢成為中國唯一進(jìn)入第一梯隊(duì)的評(píng)測醫(yī)療智能體。
數(shù)據(jù)顯示,MentX在“多模態(tài)推理”(Reasoning)和“醫(yī)學(xué)理解”(Understanding)兩項(xiàng)核心指標(biāo)上分別取得69.38分和72.36分的優(yōu)異成績,綜合得分70.19%,僅次于頂尖模型GPT-5(72.18%),但大幅領(lǐng)先于GPT-4o(42.8%)、GPT-5-mini(60.94%)及人類預(yù)執(zhí)業(yè)專家水平(45.53%),實(shí)現(xiàn)了對(duì)國際主流模型的全面超越。
尤為值得關(guān)注的是,排名領(lǐng)先的GPT-5系列模型訓(xùn)練數(shù)據(jù)主要基于歐美人群的醫(yī)療記錄,相比之下,MentX從研發(fā)之初即聚焦中國臨床實(shí)踐,依托國家衛(wèi)健委臨床醫(yī)學(xué)指南和醫(yī)學(xué)共識(shí),深度融合國人的病理特征、診療習(xí)慣,在電子病歷、醫(yī)學(xué)影像與實(shí)驗(yàn)室檢查等多源信息融合方面更具本土適應(yīng)性。
“這意味著,MentX不僅在技術(shù)指標(biāo)上趕超國際先進(jìn)水平,更在臨床實(shí)用性上更懂‘中國病、中國人’。”一位業(yè)內(nèi)專家向記者表示,“對(duì)于中國醫(yī)生和患者而言,一個(gè)基于本土臨床實(shí)踐、符合中國醫(yī)療流程的AI系統(tǒng),其輔助診斷的準(zhǔn)確性和可解釋性更具現(xiàn)實(shí)價(jià)值。”
據(jù)緣啟智慧方面介紹,MentX采用鏈?zhǔn)剿季S(Chain-of-Thought)推理架構(gòu),能夠模擬醫(yī)生循證診療過程,輸出清晰的診斷邏輯鏈,其強(qiáng)大的多模態(tài)融合能力可對(duì)B超、CT、MRI等影像與文本病歷進(jìn)行精準(zhǔn)解讀,甚至能準(zhǔn)確識(shí)別患者的咳嗽聲、皮膚的照片,實(shí)現(xiàn)全科、多模態(tài)醫(yī)學(xué)循證,像真正的醫(yī)生一樣“望聞問切”,顯著提升臨床決策效率。
業(yè)內(nèi)人士指出,MentX在國際評(píng)測中脫穎而出,標(biāo)志著中國醫(yī)療AI已從“跟跑”邁向“并跑”甚至局部“領(lǐng)跑”階段。隨著政策支持與技術(shù)迭代加速,國產(chǎn)醫(yī)療AI有望在基層醫(yī)療、慢病管理、智慧醫(yī)院等場景中加速落地。
緣啟智慧表示,未來將持續(xù)優(yōu)化MentX在真實(shí)世界環(huán)境中的泛化能力與安全性,推動(dòng)AI全科診斷系統(tǒng)在全國各級(jí)醫(yī)療機(jī)構(gòu)普及應(yīng)用,助力“健康中國”戰(zhàn)略縱深推進(jìn)。
相關(guān)文章
隨便看看