從語音識別到大模型:科大訊飛如何實(shí)現(xiàn)AI技術(shù)的“無縫銜接”
近日,無縫銜接《人民日報(bào)》專訪科大訊飛董事長劉慶峰,從語圍繞人工智能產(chǎn)業(yè)發(fā)展進(jìn)行深度對話。音識當(dāng)被問及「一家做智能語音識別的大模大訊公司與人工智能的關(guān)系是什么」
時,劉慶峰給出了堅(jiān)定的型科回答:「大模型也叫大語言模型,我們做的飛何大模型研發(fā)是智能語音技術(shù)的延續(xù)。2017 年,實(shí)現(xiàn)我們設(shè)立了認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室,技術(shù)有很好的無縫銜接研究基礎(chǔ),所以我們并不是從語一個沒有技術(shù)積累的『后來者』。」
這番話背后,音識是大模大訊科大訊飛作為人工智能國家隊(duì)長達(dá)二十余年的技術(shù)深耕與戰(zhàn)略布局。
從「聽見」到「理解」:核心技術(shù)突破的型科里程碑
1999 年成立至今,科大訊飛始終將核心源頭技術(shù)自主創(chuàng)新放在戰(zhàn)略高度,飛何每年將營業(yè)收入的實(shí)現(xiàn) 20% 左右用于研發(fā),創(chuàng)立了人工智能發(fā)展史上的一系列里程碑:2008 年首次讓機(jī)器的語音合成超過普通人說話水平;2015 年首次讓機(jī)器的語音識別超過人類速記員水平;2017 年「智醫(yī)助理機(jī)器人」首次通過國家執(zhí)業(yè)醫(yī)師資格考試綜合筆試測試;2024 年,公司作為第一完成單位的「多語種智能語音關(guān)鍵技術(shù)及產(chǎn)業(yè)化」項(xiàng)目榮獲國家科學(xué)技術(shù)進(jìn)步獎一等獎。
正是這種「頂天立地」的發(fā)展理念——關(guān)鍵源頭技術(shù)做到全球領(lǐng)先,技術(shù)大規(guī)模產(chǎn)業(yè)化形成自我造血——讓科大訊飛從語音識別領(lǐng)域自然延伸至認(rèn)知智能和大模型賽道。
全國重點(diǎn)實(shí)驗(yàn)室:大模型研發(fā)的堅(jiān)實(shí)根基
劉慶峰在專訪中特別提到的認(rèn)知智能國家重點(diǎn)實(shí)驗(yàn)室,正是科大訊飛大模型研發(fā)的核心支撐。作為推動中國人工智能技術(shù)自主創(chuàng)新的重要力量,科大訊飛承建了中國唯一的認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室和語音及語言信息處理國家工程研究中心,同時是中國語音產(chǎn)業(yè)聯(lián)盟理事長單位、中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟理事長單位。
依托全國重點(diǎn)實(shí)驗(yàn)室的技術(shù)和應(yīng)用積累,以及成建制的研發(fā)團(tuán)隊(duì),2023 年 5 月 6 日,科大訊飛正式發(fā)布訊飛星火大模型,具備文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等七大核心能力。
全國產(chǎn)算力:鑄就全棧自主可控的底座
「如果不利用國產(chǎn)算力進(jìn)行大模型訓(xùn)練,就始終存在無法突破的重大短板,缺乏長期發(fā)展的安全保障。」劉慶峰在專訪中強(qiáng)調(diào)。
科大訊飛用實(shí)際行動踐行這一理念。2023 年 10 月,科大訊飛與華為聯(lián)合發(fā)布了國內(nèi)首個全國產(chǎn)算力平臺「飛星一號」;2024 年 10 月,基于全國首個國產(chǎn)萬卡算力集群訓(xùn)練的訊飛星火 4.0 Turbo 正式發(fā)布,七項(xiàng)核心能力在中文領(lǐng)域全面超過 GPT-4 Turbo;2025 年,公司發(fā)布業(yè)內(nèi)首個基于全國產(chǎn)算力訓(xùn)練的深度推理大模型「訊飛星火 X1」,在模型參數(shù)比業(yè)界同類模型小一個數(shù)量級的情況下,實(shí)現(xiàn)整體效果對標(biāo)業(yè)界領(lǐng)先水平。
這種全棧自主可控的技術(shù)路線,正是科大訊飛作為人工智能國家隊(duì)的擔(dān)當(dāng)與使命。正如劉慶峰所言:「人工智能企業(yè)是要有家國情懷的,一定要把源頭技術(shù)構(gòu)建在自主可控的平臺上,成為國家可以借助和使用的力量。」
從技術(shù)到應(yīng)用:賦能千行百業(yè)
目前,訊飛星火大模型已在教育、醫(yī)療、金融、汽車、城市等領(lǐng)域廣泛落地。在教育領(lǐng)域,科大訊飛為全國 5 萬余所學(xué)校、1.3 億師生提供智慧教育產(chǎn)品;在醫(yī)療領(lǐng)域,「智醫(yī)助理」已在全國 801 個區(qū)縣實(shí)現(xiàn)常態(tài)化應(yīng)用,累計(jì)提供超 11 億次 AI 輔診建議。
從智能語音到認(rèn)知智能,從技術(shù)突破到產(chǎn)業(yè)落地,科大訊飛的發(fā)展歷程印證了劉慶峰的那句話:「流水不爭先,爭的是滔滔不絕。」在通用人工智能的新賽道上,這支從高校走出的創(chuàng)新團(tuán)隊(duì),正以全國產(chǎn)自主可控的技術(shù)底座,書寫著中國人工智能產(chǎn)業(yè)的嶄新篇章。