從語(yǔ)音識(shí)別到大模型:科大訊飛如何實(shí)現(xiàn)AI技術(shù)的“無(wú)縫銜接”
近日,無(wú)縫銜接《人民日?qǐng)?bào)》專訪科大訊飛董事長(zhǎng)劉慶峰,從語(yǔ)圍繞人工智能產(chǎn)業(yè)發(fā)展進(jìn)行深度對(duì)話。音識(shí)當(dāng)被問(wèn)及「一家做智能語(yǔ)音識(shí)別的大模大訊公司與人工智能的關(guān)系是什么」
時(shí),劉慶峰給出了堅(jiān)定的型科回答:「大模型也叫大語(yǔ)言模型,我們做的飛何大模型研發(fā)是智能語(yǔ)音技術(shù)的延續(xù)。2017 年,實(shí)現(xiàn)我們?cè)O(shè)立了認(rèn)知智能國(guó)家重點(diǎn)實(shí)驗(yàn)室,技術(shù)有很好的無(wú)縫銜接研究基礎(chǔ),所以我們并不是從語(yǔ)一個(gè)沒(méi)有技術(shù)積累的『后來(lái)者』。」
這番話背后,音識(shí)是大模大訊科大訊飛作為人工智能國(guó)家隊(duì)長(zhǎng)達(dá)二十余年的技術(shù)深耕與戰(zhàn)略布局。
從「聽(tīng)見(jiàn)」到「理解」:核心技術(shù)突破的型科里程碑
1999 年成立至今,科大訊飛始終將核心源頭技術(shù)自主創(chuàng)新放在戰(zhàn)略高度,飛何每年將營(yíng)業(yè)收入的實(shí)現(xiàn) 20% 左右用于研發(fā),創(chuàng)立了人工智能發(fā)展史上的一系列里程碑:2008 年首次讓機(jī)器的語(yǔ)音合成超過(guò)普通人說(shuō)話水平;2015 年首次讓機(jī)器的語(yǔ)音識(shí)別超過(guò)人類速記員水平;2017 年「智醫(yī)助理機(jī)器人」首次通過(guò)國(guó)家執(zhí)業(yè)醫(yī)師資格考試綜合筆試測(cè)試;2024 年,公司作為第一完成單位的「多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化」項(xiàng)目榮獲國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。
正是這種「頂天立地」的發(fā)展理念——關(guān)鍵源頭技術(shù)做到全球領(lǐng)先,技術(shù)大規(guī)模產(chǎn)業(yè)化形成自我造血——讓科大訊飛從語(yǔ)音識(shí)別領(lǐng)域自然延伸至認(rèn)知智能和大模型賽道。
全國(guó)重點(diǎn)實(shí)驗(yàn)室:大模型研發(fā)的堅(jiān)實(shí)根基
劉慶峰在專訪中特別提到的認(rèn)知智能國(guó)家重點(diǎn)實(shí)驗(yàn)室,正是科大訊飛大模型研發(fā)的核心支撐。作為推動(dòng)中國(guó)人工智能技術(shù)自主創(chuàng)新的重要力量,科大訊飛承建了中國(guó)唯一的認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室和語(yǔ)音及語(yǔ)言信息處理國(guó)家工程研究中心,同時(shí)是中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟理事長(zhǎng)單位、中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟理事長(zhǎng)單位。
依托全國(guó)重點(diǎn)實(shí)驗(yàn)室的技術(shù)和應(yīng)用積累,以及成建制的研發(fā)團(tuán)隊(duì),2023 年 5 月 6 日,科大訊飛正式發(fā)布訊飛星火大模型,具備文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等七大核心能力。
全國(guó)產(chǎn)算力:鑄就全棧自主可控的底座
「如果不利用國(guó)產(chǎn)算力進(jìn)行大模型訓(xùn)練,就始終存在無(wú)法突破的重大短板,缺乏長(zhǎng)期發(fā)展的安全保障。」劉慶峰在專訪中強(qiáng)調(diào)。
科大訊飛用實(shí)際行動(dòng)踐行這一理念。2023 年 10 月,科大訊飛與華為聯(lián)合發(fā)布了國(guó)內(nèi)首個(gè)全國(guó)產(chǎn)算力平臺(tái)「飛星一號(hào)」;2024 年 10 月,基于全國(guó)首個(gè)國(guó)產(chǎn)萬(wàn)卡算力集群訓(xùn)練的訊飛星火 4.0 Turbo 正式發(fā)布,七項(xiàng)核心能力在中文領(lǐng)域全面超過(guò) GPT-4 Turbo;2025 年,公司發(fā)布業(yè)內(nèi)首個(gè)基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型「訊飛星火 X1」,在模型參數(shù)比業(yè)界同類模型小一個(gè)數(shù)量級(jí)的情況下,實(shí)現(xiàn)整體效果對(duì)標(biāo)業(yè)界領(lǐng)先水平。
這種全棧自主可控的技術(shù)路線,正是科大訊飛作為人工智能國(guó)家隊(duì)的擔(dān)當(dāng)與使命。正如劉慶峰所言:「人工智能企業(yè)是要有家國(guó)情懷的,一定要把源頭技術(shù)構(gòu)建在自主可控的平臺(tái)上,成為國(guó)家可以借助和使用的力量。」
從技術(shù)到應(yīng)用:賦能千行百業(yè)
目前,訊飛星火大模型已在教育、醫(yī)療、金融、汽車、城市等領(lǐng)域廣泛落地。在教育領(lǐng)域,科大訊飛為全國(guó) 5 萬(wàn)余所學(xué)校、1.3 億師生提供智慧教育產(chǎn)品;在醫(yī)療領(lǐng)域,「智醫(yī)助理」已在全國(guó) 801 個(gè)區(qū)縣實(shí)現(xiàn)常態(tài)化應(yīng)用,累計(jì)提供超 11 億次 AI 輔診建議。
從智能語(yǔ)音到認(rèn)知智能,從技術(shù)突破到產(chǎn)業(yè)落地,科大訊飛的發(fā)展歷程印證了劉慶峰的那句話:「流水不爭(zhēng)先,爭(zhēng)的是滔滔不絕。」在通用人工智能的新賽道上,這支從高校走出的創(chuàng)新團(tuán)隊(duì),正以全國(guó)產(chǎn)自主可控的技術(shù)底座,書(shū)寫著中國(guó)人工智能產(chǎn)業(yè)的嶄新篇章。