大模型為什么能夠回答各種復(fù)雜問題,時(shí)薪事數(shù)甚至超過普通人?沖上答案的關(guān)鍵,還有一個(gè)不起眼,元碩卻至關(guān)重要的博正被批環(huán)節(jié)——數(shù)據(jù)標(biāo)注。
在模型運(yùn)作中,量招數(shù)據(jù)標(biāo)注者就像“老師”:簡(jiǎn)單任務(wù)時(shí),據(jù)標(biāo)他們?yōu)锳I的注工作回答打分,將最優(yōu)答案呈現(xiàn)給用戶;復(fù)雜任務(wù)時(shí),時(shí)薪事數(shù)他們親自操作,沖上讓AI學(xué)會(huì)理解:比如敘述一張圖所講的元碩故事,完成一個(gè)操作界面中的博正被批具體步驟。
曾經(jīng)被視為低門檻勞動(dòng)的量招數(shù)據(jù)標(biāo)注,正在大模型行業(yè)經(jīng)歷深刻變革。據(jù)標(biāo)多個(gè)行業(yè)內(nèi)部招聘群出現(xiàn)一種特殊需求:金融、注工作法律、時(shí)薪事數(shù)物理等專業(yè)的碩士、博士,被高薪招募從事數(shù)據(jù)標(biāo)注工作。
招聘要求與以往截然不同:985/頂尖院校碩士起步,部分需博士及2年以上行業(yè)經(jīng)驗(yàn)。工作內(nèi)容不再是“標(biāo)注撰寫”,而是撰寫高難度專業(yè)題目、構(gòu)建推理鏈條、解析模型輸出并糾錯(cuò)。時(shí)薪從100元躍升至400元以上,更有甚者上不封頂。
多家標(biāo)注公司證實(shí),2024年行業(yè)出現(xiàn)了顯著的需求變化。隨著大模型競(jìng)爭(zhēng)焦點(diǎn)轉(zhuǎn)向推理能力,訓(xùn)練數(shù)據(jù)在專業(yè)性、精細(xì)度和邏輯復(fù)雜度上要求劇增。“不是我們想招博士,是行業(yè)現(xiàn)在需要博士。”一位負(fù)責(zé)人總結(jié)。這背后也反映了模型能力的變遷:競(jìng)爭(zhēng)的核心已從比拼數(shù)據(jù)規(guī)模,轉(zhuǎn)向了比拼數(shù)據(jù)質(zhì)量與智能水平。
從粗顆粒到“專家級(jí)標(biāo)注”:行業(yè)只用了1 年
行業(yè)風(fēng)向標(biāo)在一年內(nèi)驟然轉(zhuǎn)向。這印證了業(yè)界對(duì)于大型模型演進(jìn)速度的超預(yù)期感受。在新一輪大模型迭代中,數(shù)據(jù)標(biāo)注市場(chǎng)正在發(fā)生一次被忽視但極為關(guān)鍵的結(jié)構(gòu)性變化。
記者從知情人士處了解到,某頭部大廠曾為應(yīng)對(duì)當(dāng)時(shí)的“普通標(biāo)注”需求,在人力成本較低的三四線城市自建了標(biāo)注基地。然而,大模型的進(jìn)化速度遠(yuǎn)超預(yù)期,對(duì)數(shù)據(jù)的質(zhì)量要求變得更好,基地的團(tuán)隊(duì)能力與培訓(xùn)體系難以跟上這種突變。
據(jù)他透露,這種案例在業(yè)內(nèi)并不是個(gè)例。“許多人低估了大模型的實(shí)際發(fā)展速度。他們?cè)鹊念A(yù)期是普通標(biāo)注階段需要三到五年時(shí)間,實(shí)際情況是,短短一年內(nèi)就已經(jīng)全部完成。”
關(guān)鍵的時(shí)間節(jié)點(diǎn)就在2024年左右,此前數(shù)據(jù)標(biāo)注行業(yè)多圍繞CV、短文本、語音轉(zhuǎn)寫等低知識(shí)密度工作,普通的大學(xué)生就可以完成。
從2024年開始,隨著大模型在to B和to G行業(yè)落地加速:提升模型能力不再靠堆規(guī)模,而要靠“結(jié)構(gòu)化知識(shí)”和“高質(zhì)量數(shù)據(jù)”。這直接導(dǎo)致任務(wù)形態(tài)發(fā)生重構(gòu),出現(xiàn)大量專業(yè)門檻極高的內(nèi)容需求:比如代碼模型的邏輯審校、解釋與優(yōu)化;醫(yī)療、法律、金融等領(lǐng)域的專業(yè)問答;多語種、方言體系的對(duì)齊;復(fù)雜agent 的任務(wù)鏈路構(gòu)建等,越來越多任務(wù)必須由碩士、博士來完成。2025 年起,這類專業(yè)深度的標(biāo)注需求愈發(fā)明顯。
相應(yīng)的,對(duì)參與數(shù)據(jù)標(biāo)注的人要求也變得更高,薪資也水漲船高。記者查閱資料發(fā)現(xiàn),在最頭部的平臺(tái),這類人才的時(shí)薪已經(jīng)從幾十漲到400元;醫(yī)療、法律類還更高。一位業(yè)內(nèi)人士透露:“有大廠以月薪10萬的價(jià)格挖三甲醫(yī)院醫(yī)生做標(biāo)注。”
一位金融從業(yè)者講述了試工經(jīng)歷:實(shí)際任務(wù)是一道開放難題,連頭部大模型都無法直接解答,需應(yīng)聘者獨(dú)立構(gòu)建推理、提供解析并點(diǎn)評(píng)模型錯(cuò)誤。“我寫了三小時(shí),極其復(fù)雜。據(jù)說幾十人里就我一個(gè)過關(guān)。”他8月正式接單,一道金融題常需近4小時(shí),但平臺(tái)結(jié)算時(shí)間封頂3小時(shí)。“質(zhì)檢直接通過,無需返修,說明難度確實(shí)高。”
從供給側(cè)看,據(jù)記者了解,目前字節(jié)、騰訊、阿里、百度、美團(tuán)等大廠,以及最近兩年加速推動(dòng)大模型落地的大型B端機(jī)構(gòu)是復(fù)雜知識(shí)類標(biāo)注任務(wù)的主要買方。
大廠普遍自建標(biāo)注平臺(tái),個(gè)人可通過申請(qǐng)進(jìn)入。以字節(jié)為例,其大模型標(biāo)注與評(píng)測(cè)平臺(tái)Xpert在公開招聘中給出的區(qū)間是“100—500元/時(shí)”,并強(qiáng)調(diào)已有專家“每天工作2小時(shí)、月入2萬+”。準(zhǔn)入門檻同樣不低:要求國(guó)內(nèi)外TOP 高校在讀生,碩博優(yōu)先。
記者了解到,申請(qǐng)流程除了提交基礎(chǔ)資料,還必須參加一次性的準(zhǔn)入考試。平臺(tái)會(huì)在幾天內(nèi)發(fā)放一套考卷,根據(jù)得分決定是否通過,且沒有重考機(jī)會(huì)。題目難度會(huì)依領(lǐng)域而異,但整體以專業(yè)知識(shí)為主,本科至博士階段的學(xué)術(shù)內(nèi)容占比很高,也會(huì)結(jié)合候選人的背景與工作年限進(jìn)行匹配。
OpenAI的300位生物學(xué)博士,只是開始
全球范圍內(nèi)的競(jìng)爭(zhēng)也推高了這股趨勢(shì)。OpenAI 今年大規(guī)模招募生物學(xué)博士做專業(yè)標(biāo)注,每小時(shí)100美元,300人團(tuán)隊(duì)一周成本120 萬美元,相當(dāng)于一年支出接近6億元人民幣。而這僅是生物學(xué)一個(gè)領(lǐng)域的數(shù)據(jù)生產(chǎn)需求。物理、化學(xué)、數(shù)學(xué)、社會(huì)科學(xué)等專業(yè)加起來,數(shù)據(jù)預(yù)算的深度幾乎難以想象。
但錢只是第一步。真正的競(jìng)爭(zhēng)焦點(diǎn)在于誰能把這些昂貴的專家數(shù)據(jù)真正轉(zhuǎn)化為模型能力。
業(yè)內(nèi)普遍認(rèn)為,這需要兩個(gè)工程鏈路同時(shí)跑通:能穩(wěn)定生產(chǎn)高質(zhì)量、結(jié)構(gòu)化的專業(yè)知識(shí);能讓模型真正學(xué)到路徑,而不是“背答案”。“如果只是靠人力寫出標(biāo)準(zhǔn)答案給模型背,那意義不大。關(guān)鍵是讓模型學(xué)到知識(shí)的結(jié)構(gòu)。”一位參與某大廠項(xiàng)目的標(biāo)注專家說。
也因此,資本與企業(yè)的注意力正在轉(zhuǎn)向數(shù)據(jù)生產(chǎn)的“工程化能力”。在海外,Scale AI、Surge、Mercor 等平臺(tái)化公司迅速崛起,隨著標(biāo)準(zhǔn)化流程和工具鏈驅(qū)動(dòng)規(guī)模增長(zhǎng),估值一路上漲。
Scale AI的成功用“平臺(tái)+標(biāo)注工具+交付體系“模式,將傳統(tǒng)“數(shù)據(jù)外包”變成了的數(shù)據(jù)工業(yè)化流水線,完成了規(guī)模化擴(kuò)張,最終Meta以約148億美元的價(jià)格收購(gòu)了Scale AI 49%股份的收購(gòu)。Mercor則憑借其在尖端人才招聘領(lǐng)域的積累,打造了面向高質(zhì)量數(shù)據(jù)標(biāo)注需求的新平臺(tái),一躍成為這個(gè)賽道最年輕的百億美金獨(dú)角獸初創(chuàng)公司,其估值已突破100億美元。
國(guó)內(nèi)的格局則有所不同。由于數(shù)據(jù)保密性要求更高,各大廠幾乎都自建平臺(tái),并在內(nèi)部形成了相對(duì)封閉的標(biāo)注體系,單獨(dú)對(duì)外靈活招聘。同時(shí),行業(yè)最有話語權(quán)的一批玩家是語音、自動(dòng)駕駛和早期CV 浪潮中成長(zhǎng)起來的公司——海天瑞聲、數(shù)據(jù)堂、標(biāo)貝等,它們憑借技術(shù)積累在這一輪大模型時(shí)代順利完成轉(zhuǎn)型,至今仍掌握著大量核心供應(yīng)能力。與此同時(shí),不少初創(chuàng)團(tuán)隊(duì)也在圍繞持續(xù)變化的模型能力熱點(diǎn)如AI眼鏡的視覺交互、GUI模型的界面理解等領(lǐng)域,持續(xù)供給新的“數(shù)據(jù)燃料”,成為大廠和傳統(tǒng)數(shù)據(jù)公司的上游補(bǔ)充力量。
數(shù)據(jù)標(biāo)注的本質(zhì),是教會(huì)AI理解人類世界的邏輯、規(guī)則與常識(shí)。而對(duì)專業(yè)標(biāo)準(zhǔn)人才的爭(zhēng)奪的背后是一場(chǎng)更為深遠(yuǎn)的競(jìng)爭(zhēng)——在大模型愈發(fā)垂直化、復(fù)雜化的今天,誰掌握了這套“數(shù)據(jù)生產(chǎn)工程”,誰就握住了下一代人工智能能力的底層鑰匙。
有公司甚至把崗位描述寫得極其文藝:“你將作為AI 進(jìn)化的關(guān)鍵參與者,沉淀行業(yè)智慧,指引模型能力的邊界。”然而,在這條將人的智慧抽象為“數(shù)據(jù)燃料”的生產(chǎn)鏈上,最現(xiàn)實(shí)、最直接的吸引力,還是錢。







