發布時間:2025-11-29 05:02:30 來源:企業錄(www.qy6.com)-公司信息發布,網上買賣交易門戶 作者:娛樂
11月27日消息,全網都在等DeepSeek發布V4大模型,然而好事多磨,這個模型一直沒有問世,但DeepSeek也沒閑著,時不時來個驚喜,今晚突然低調發布了DeepSeekMath-V2模型。
DeepSeekMath-V2是一款可自我驗證的數學推理訓練框架,基于 DeepSeek?V3.2?Exp?Base訓練而來,通過LLM驗證器自動審查生成的數學證明,并利用高難度樣本持續優化性能。
目前該模型代碼與權重已開源,發布于Hugging Face及GitHub平臺。
這款模型強在哪里?先說結果,在IMO 2025和CMO 2024中均達到金牌水平,Putnam 2024獲118/120分。
如果對比當前頂級的大模型,比如Claude Sonnet4、GPT-5、Gemini 2.5 Pro等,Basic測試中得分被DeepSeekMath-V2的99分遠遠甩開,Adveanced中也只比Gemini DeepThink的65.7分略低,這個模型也是谷歌特調的,也達到到了IMO金牌水平。
考慮到DeepSeekMath-V2的開源、免費等特性,可以說它是當前最強的數學模型了。
不過DeepSeek官方的說法倒是很謙虛,表示盡管仍有許多工作需要完成,這些結果表明,自我可驗證的數學推理是一個可行的研究方向,可能有助于開發更強大的數學AI系統。
如果聯系到DeepSeek最近幾款特殊模型的表現,顯然他們在V4發布之前積累了相當多的新技術新想法,在OCR、數學等方面表現驚艷,這么一想V4如果是全能型的多模態大模型,那就更值得期待了。
相關文章