大模型為什么能夠回答各種復雜問題,時薪事數(shù)甚至超過普通人?沖上答案的關鍵,還有一個不起眼,元碩卻至關重要的博正被批環(huán)節(jié)——數(shù)據(jù)標注。
在模型運作中,量招數(shù)據(jù)標注者就像“老師”:簡單任務時,據(jù)標他們?yōu)锳I的注工作回答打分,將最優(yōu)答案呈現(xiàn)給用戶;復雜任務時,時薪事數(shù)他們親自操作,沖上讓AI學會理解:比如敘述一張圖所講的元碩故事,完成一個操作界面中的博正被批具體步驟。
曾經(jīng)被視為低門檻勞動的量招數(shù)據(jù)標注,正在大模型行業(yè)經(jīng)歷深刻變革。據(jù)標多個行業(yè)內(nèi)部招聘群出現(xiàn)一種特殊需求:金融、注工作法律、時薪事數(shù)物理等專業(yè)的碩士、博士,被高薪招募從事數(shù)據(jù)標注工作。
招聘要求與以往截然不同:985/頂尖院校碩士起步,部分需博士及2年以上行業(yè)經(jīng)驗。工作內(nèi)容不再是“標注撰寫”,而是撰寫高難度專業(yè)題目、構建推理鏈條、解析模型輸出并糾錯。時薪從100元躍升至400元以上,更有甚者上不封頂。
多家標注公司證實,2024年行業(yè)出現(xiàn)了顯著的需求變化。隨著大模型競爭焦點轉向推理能力,訓練數(shù)據(jù)在專業(yè)性、精細度和邏輯復雜度上要求劇增。“不是我們想招博士,是行業(yè)現(xiàn)在需要博士。”一位負責人總結。這背后也反映了模型能力的變遷:競爭的核心已從比拼數(shù)據(jù)規(guī)模,轉向了比拼數(shù)據(jù)質量與智能水平。
從粗顆粒到“專家級標注”:行業(yè)只用了1 年
行業(yè)風向標在一年內(nèi)驟然轉向。這印證了業(yè)界對于大型模型演進速度的超預期感受。在新一輪大模型迭代中,數(shù)據(jù)標注市場正在發(fā)生一次被忽視但極為關鍵的結構性變化。
記者從知情人士處了解到,某頭部大廠曾為應對當時的“普通標注”需求,在人力成本較低的三四線城市自建了標注基地。然而,大模型的進化速度遠超預期,對數(shù)據(jù)的質量要求變得更好,基地的團隊能力與培訓體系難以跟上這種突變。
據(jù)他透露,這種案例在業(yè)內(nèi)并不是個例。“許多人低估了大模型的實際發(fā)展速度。他們原先的預期是普通標注階段需要三到五年時間,實際情況是,短短一年內(nèi)就已經(jīng)全部完成。”
關鍵的時間節(jié)點就在2024年左右,此前數(shù)據(jù)標注行業(yè)多圍繞CV、短文本、語音轉寫等低知識密度工作,普通的大學生就可以完成。
從2024年開始,隨著大模型在to B和to G行業(yè)落地加速:提升模型能力不再靠堆規(guī)模,而要靠“結構化知識”和“高質量數(shù)據(jù)”。這直接導致任務形態(tài)發(fā)生重構,出現(xiàn)大量專業(yè)門檻極高的內(nèi)容需求:比如代碼模型的邏輯審校、解釋與優(yōu)化;醫(yī)療、法律、金融等領域的專業(yè)問答;多語種、方言體系的對齊;復雜agent 的任務鏈路構建等,越來越多任務必須由碩士、博士來完成。2025 年起,這類專業(yè)深度的標注需求愈發(fā)明顯。
相應的,對參與數(shù)據(jù)標注的人要求也變得更高,薪資也水漲船高。記者查閱資料發(fā)現(xiàn),在最頭部的平臺,這類人才的時薪已經(jīng)從幾十漲到400元;醫(yī)療、法律類還更高。一位業(yè)內(nèi)人士透露:“有大廠以月薪10萬的價格挖三甲醫(yī)院醫(yī)生做標注。”
一位金融從業(yè)者講述了試工經(jīng)歷:實際任務是一道開放難題,連頭部大模型都無法直接解答,需應聘者獨立構建推理、提供解析并點評模型錯誤。“我寫了三小時,極其復雜。據(jù)說幾十人里就我一個過關。”他8月正式接單,一道金融題常需近4小時,但平臺結算時間封頂3小時。“質檢直接通過,無需返修,說明難度確實高。”
從供給側看,據(jù)記者了解,目前字節(jié)、騰訊、阿里、百度、美團等大廠,以及最近兩年加速推動大模型落地的大型B端機構是復雜知識類標注任務的主要買方。
大廠普遍自建標注平臺,個人可通過申請進入。以字節(jié)為例,其大模型標注與評測平臺Xpert在公開招聘中給出的區(qū)間是“100—500元/時”,并強調(diào)已有專家“每天工作2小時、月入2萬+”。準入門檻同樣不低:要求國內(nèi)外TOP 高校在讀生,碩博優(yōu)先。
記者了解到,申請流程除了提交基礎資料,還必須參加一次性的準入考試。平臺會在幾天內(nèi)發(fā)放一套考卷,根據(jù)得分決定是否通過,且沒有重考機會。題目難度會依領域而異,但整體以專業(yè)知識為主,本科至博士階段的學術內(nèi)容占比很高,也會結合候選人的背景與工作年限進行匹配。
OpenAI的300位生物學博士,只是開始
全球范圍內(nèi)的競爭也推高了這股趨勢。OpenAI 今年大規(guī)模招募生物學博士做專業(yè)標注,每小時100美元,300人團隊一周成本120 萬美元,相當于一年支出接近6億元人民幣。而這僅是生物學一個領域的數(shù)據(jù)生產(chǎn)需求。物理、化學、數(shù)學、社會科學等專業(yè)加起來,數(shù)據(jù)預算的深度幾乎難以想象。
但錢只是第一步。真正的競爭焦點在于誰能把這些昂貴的專家數(shù)據(jù)真正轉化為模型能力。
業(yè)內(nèi)普遍認為,這需要兩個工程鏈路同時跑通:能穩(wěn)定生產(chǎn)高質量、結構化的專業(yè)知識;能讓模型真正學到路徑,而不是“背答案”。“如果只是靠人力寫出標準答案給模型背,那意義不大。關鍵是讓模型學到知識的結構。”一位參與某大廠項目的標注專家說。
也因此,資本與企業(yè)的注意力正在轉向數(shù)據(jù)生產(chǎn)的“工程化能力”。在海外,Scale AI、Surge、Mercor 等平臺化公司迅速崛起,隨著標準化流程和工具鏈驅動規(guī)模增長,估值一路上漲。
Scale AI的成功用“平臺+標注工具+交付體系“模式,將傳統(tǒng)“數(shù)據(jù)外包”變成了的數(shù)據(jù)工業(yè)化流水線,完成了規(guī)?;瘮U張,最終Meta以約148億美元的價格收購了Scale AI 49%股份的收購。Mercor則憑借其在尖端人才招聘領域的積累,打造了面向高質量數(shù)據(jù)標注需求的新平臺,一躍成為這個賽道最年輕的百億美金獨角獸初創(chuàng)公司,其估值已突破100億美元。
國內(nèi)的格局則有所不同。由于數(shù)據(jù)保密性要求更高,各大廠幾乎都自建平臺,并在內(nèi)部形成了相對封閉的標注體系,單獨對外靈活招聘。同時,行業(yè)最有話語權的一批玩家是語音、自動駕駛和早期CV 浪潮中成長起來的公司——海天瑞聲、數(shù)據(jù)堂、標貝等,它們憑借技術積累在這一輪大模型時代順利完成轉型,至今仍掌握著大量核心供應能力。與此同時,不少初創(chuàng)團隊也在圍繞持續(xù)變化的模型能力熱點如AI眼鏡的視覺交互、GUI模型的界面理解等領域,持續(xù)供給新的“數(shù)據(jù)燃料”,成為大廠和傳統(tǒng)數(shù)據(jù)公司的上游補充力量。
數(shù)據(jù)標注的本質,是教會AI理解人類世界的邏輯、規(guī)則與常識。而對專業(yè)標準人才的爭奪的背后是一場更為深遠的競爭——在大模型愈發(fā)垂直化、復雜化的今天,誰掌握了這套“數(shù)據(jù)生產(chǎn)工程”,誰就握住了下一代人工智能能力的底層鑰匙。
有公司甚至把崗位描述寫得極其文藝:“你將作為AI 進化的關鍵參與者,沉淀行業(yè)智慧,指引模型能力的邊界。”然而,在這條將人的智慧抽象為“數(shù)據(jù)燃料”的生產(chǎn)鏈上,最現(xiàn)實、最直接的吸引力,還是錢。







