91黄色入口,麻豆视频免费网站,宅男女神杨棋涵,足球之杀手,欧美成人免费在线观看,91pram免,亚洲综合98夜夜躁精品,马友蓉

企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶

ChatGPT文風(fēng) 原產(chǎn)地肯尼亞

ChatGPT文風(fēng)奇怪的風(fēng)原原因(俗稱AI味兒很濃)找到了!

肯尼亞作家:都是產(chǎn)地跟我們學(xué)的。

 

就在最近,肯尼一位肯尼亞作家的風(fēng)原“控訴貼”登上Hacker News熱榜——

我是肯尼亞人。不是產(chǎn)地我的寫(xiě)作風(fēng)格和ChatGPT一樣,而是肯尼ChatGPT寫(xiě)作風(fēng)格和我一樣。

一點(diǎn)進(jìn)去才知道,風(fēng)原原來(lái)這位朋友連續(xù)精心撰寫(xiě)的產(chǎn)地好幾篇文章都被退稿了,而且理由還都是肯尼“太像ChatGPT”。

emmm……一想到自己從小接受的風(fēng)原教育都是“文章必須像一座完美的大廈”、“你必須展現(xiàn)豐富的產(chǎn)地詞匯量”,而現(xiàn)在卻被誤認(rèn)為出自AI,肯尼這位朋友實(shí)在忍不住發(fā)出怒吼:

對(duì)于那些熱衷于偵查數(shù)字虛假性的風(fēng)原偵探們,我想說(shuō):朋友,產(chǎn)地歡迎來(lái)到肯尼亞教室、肯尼會(huì)議室或公司內(nèi)部Teams聊天室里一個(gè)典型的星期二。你們所認(rèn)為的機(jī)器指紋,實(shí)際上卻是我們教育的化石記錄。

而且很早就有消息指出,為了節(jié)省人力成本,很多AI模型廠商會(huì)把RLHF這類工作交給非洲人,所以模型的很多用語(yǔ)習(xí)慣也會(huì)偏向非洲那邊。

所以我們有理由懷疑,難道ChatGPT真是從肯尼亞“偷師”寫(xiě)作技巧的?

咱這就火速圍觀一下——

“ChatGPT無(wú)意中在模仿我們”

事情是這樣的。

來(lái)自肯尼亞的Marcus Olang’(以下簡(jiǎn)稱小馬)最近發(fā)文控訴,從年初收到第一條回復(fù)開(kāi)始,他就陷入了需要“自證不是AI”的困境中。當(dāng)時(shí)甲方給的回復(fù)是:

你寫(xiě)的挺好,邏輯也扎實(shí),就是……能不能用更“像人”的方式重寫(xiě)一下?現(xiàn)在這個(gè)感覺(jué),有點(diǎn)太像ChatGPT寫(xiě)的了。

而且不止是他,他身邊的很多作家朋友也都收到了類似反饋。

而在仔細(xì)對(duì)比了自己和ChatGPT所寫(xiě)內(nèi)容之后,小馬最終無(wú)奈發(fā)現(xiàn)——別說(shuō),你還真別說(shuō),咱們的文風(fēng)確實(shí)很像ChatGPT。

從某種意義上說(shuō),指控者并非完全錯(cuò)誤。我的寫(xiě)作風(fēng)格確實(shí)與大語(yǔ)言模型的輸出結(jié)果有幾分相似。

我們都傾向于使用結(jié)構(gòu)嚴(yán)謹(jǐn)、平衡的句子。我們都喜歡使用過(guò)渡詞,以確保邏輯流暢。我們都會(huì)偶爾使用(如今看來(lái)似乎成了罪證)連字符、分號(hào)或破折號(hào)來(lái)連接相關(guān)的想法,使其比簡(jiǎn)單的句號(hào)更顯優(yōu)雅。

 

不過(guò)在小馬看來(lái):

諷刺之處在于,這種諷刺或許會(huì)讓我們的祖先會(huì)心一笑。

他表示,不是自己寫(xiě)得像ChatGPT,而是ChatGPT無(wú)意中在模仿他們——模仿他們這一代,以及過(guò)去幾代在全球南方,尤其是在像肯尼亞這樣的地方,經(jīng)過(guò)嚴(yán)苛教育體系“鍛造”出來(lái)的人。

從小到大,小馬接受的寫(xiě)作指導(dǎo)都是講求規(guī)范、講求精心遣詞造句(是誰(shuí)DNA又動(dòng)了?)。

我們從小被教導(dǎo),文章必須像一座完美的大廈。引言是地基,主體是承重墻,結(jié)論是封頂,必須堅(jiān)固、對(duì)稱、無(wú)懈可擊。我們要用“首先、其次、最后”來(lái)構(gòu)建邏輯,要用“此外、然而、因此”來(lái)精確轉(zhuǎn)折,要用“光輝燦爛”、“精疲力竭”這樣的“好詞”來(lái)展現(xiàn)詞匯量。

這種寫(xiě)作,是我們的敲門磚,是我們?cè)贙CPE(小學(xué)畢業(yè)考試)決定命運(yùn)的四十分鐘里必須掌握的生存技能,是我們向上攀爬的階梯。它嚴(yán)謹(jǐn)、清晰、富有說(shuō)服力,但也因此,在今天某些人的耳朵里,它聽(tīng)起來(lái)“缺乏人性的溫度”。

而這一套恰巧也被AI學(xué)去了。

諷刺來(lái)了,AI大模型(比如ChatGPT)正是從海量的書(shū)籍、論文、報(bào)告中學(xué)習(xí)寫(xiě)作的。而這些文本庫(kù)中,充滿了歷史沉淀下來(lái)的、經(jīng)典的、正式的書(shū)面語(yǔ)——也就是我們被訓(xùn)練去模仿的那種文體。所以,當(dāng)AI為了顯得“權(quán)威”和“可信”而輸出時(shí),它的文風(fēng)自然就與我所受的教育產(chǎn)生了詭異的“孿生”效應(yīng)。

所以,如今面對(duì)“文風(fēng)像AI”的指責(zé),小馬憤而吐槽:

這臺(tái)機(jī)器為了顯得權(quán)威,最終聽(tīng)起來(lái)卻像個(gè)英語(yǔ)作文得了“A”的肯尼亞小學(xué)畢業(yè)考試(KCPE)畢業(yè)生。它無(wú)意中復(fù)制了大英帝國(guó)的語(yǔ)言幽靈。

而且他還提到,現(xiàn)存的一些AI檢測(cè)器往往更傾向于將流暢、邏輯嚴(yán)密、句式規(guī)整的文本標(biāo)記為AI生成,而這恰恰是許多非英語(yǔ)母語(yǔ)者(尤其接受過(guò)嚴(yán)格正式寫(xiě)作訓(xùn)練的人)的寫(xiě)作特點(diǎn),所以他們也更容易被誤判。

總之,小馬用自己的親身經(jīng)歷告訴大家——

由于歷史原因,一些非英語(yǔ)母語(yǔ)者的寫(xiě)作,本就是現(xiàn)有AI模型的“教材”,而現(xiàn)在他們卻成了AI普及后的“受害者”。

這一說(shuō)法也紛紛獲得了網(wǎng)友們的認(rèn)同:

不過(guò),令人啼笑皆非的是,小馬的這篇感情飽滿、“活人感”很強(qiáng)的文章,竟然還是被Pangram網(wǎng)站判定為100%由AI生成。

啊這……小馬不語(yǔ),小馬只是一味生氣吐血(doge)。

因非洲人做RLHF,ChatGPT還愛(ài)用“delve”一詞

而基于類似理由,人們還發(fā)現(xiàn),ChatGPT似乎對(duì)“delve”(挖掘、深入研究)這個(gè)詞情有獨(dú)鐘。

《衛(wèi)報(bào)》曾有一篇文章指出,Jeremy Nguyen這位來(lái)自墨爾本斯威本科技大學(xué)的AI專家發(fā)現(xiàn)——

在PubMed這類專業(yè)學(xué)術(shù)網(wǎng)站上,“delve”的出現(xiàn)頻率在近幾年激增了10到100倍。

(PubMed主要收錄了80余國(guó)5200+生物醫(yī)學(xué)期刊,總量超3900萬(wàn)條文獻(xiàn)。)

這暗示了,有大量研究人員可能在用ChatGPT輔助寫(xiě)作,并將其偏好的詞匯帶入了正式學(xué)術(shù)文本。

這一現(xiàn)象還引來(lái)馬斯克和YC聯(lián)合創(chuàng)始人保羅·格雷厄姆的關(guān)注,后者發(fā)帖表示:

有人給我發(fā)了一封帶“delve”一詞的郵件,而這個(gè)詞表明文本大概率是AI生成的(暗示對(duì)方用AI寫(xiě)項(xiàng)目書(shū),還要找他投資hhh)。

并且就在格雷厄姆發(fā)帖之后,ChatGPT官號(hào)還用這個(gè)詞公開(kāi)整活,繼而引來(lái)無(wú)數(shù)網(wǎng)友跟風(fēng)。

不過(guò),進(jìn)一步的數(shù)據(jù)分析顯示,“delve”遠(yuǎn)非孤例——

像“explore”、“tapestry”、“testament”和“leverage”等詞匯,在ChatGPT生成的文本中出現(xiàn)頻率也異常地高。

《衛(wèi)報(bào)》在文章中詳細(xì)揭開(kāi)了這背后的謎底——

為了將大語(yǔ)言模型“馴化”成安全、有用、可控的聊天機(jī)器人,企業(yè)一般會(huì)雇傭大量人類測(cè)試員,讓他們與模型互動(dòng)并提供反饋(如點(diǎn)贊/點(diǎn)踩,或撰寫(xiě)理想的回復(fù))。

模型從這些海量的人類偏好數(shù)據(jù)中學(xué)習(xí),從而調(diào)整自己的行為,也即所謂的RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))。

而出于人力成本考量,RLHF這項(xiàng)勞動(dòng)密集型工作被大量外包給了肯尼亞、尼日利亞等英語(yǔ)區(qū)的非洲國(guó)家。

對(duì)這些國(guó)家來(lái)說(shuō),“delve”這樣的詞正是他們?nèi)粘I钪凶匀弧⒁?guī)范的商務(wù)或?qū)W術(shù)英語(yǔ),因此被高頻使用。

所以這些詞也就自然在ChatGPT中高頻出現(xiàn)了。

BTW,你還有哪些小技巧來(lái)鑒別某項(xiàng)內(nèi)容是出自AI之手嗎?

有網(wǎng)友先給大家打個(gè)樣了:

“幼獸般的嗚咽”、“瞳孔縮成針尖”……嗯,一般人屬實(shí)想不到了(doge)。

贊(1)
未經(jīng)允許不得轉(zhuǎn)載:>企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶 » ChatGPT文風(fēng) 原產(chǎn)地肯尼亞
主站蜘蛛池模板: 通城县| 门源| 黄浦区| 栖霞市| 阿拉尔市| 临城县| 政和县| 淮安市| 乡城县| 佛山市| 冕宁县| 济宁市| 巴林左旗| 新建县| 新乐市| 津南区| 越西县| 淳安县| 东丰县| 徐汇区| 海安县| 闵行区| 新河县| 梅州市| 中阳县| 进贤县| 昆明市| 晋江市| 廊坊市| 通江县| 宜阳县| 晴隆县| 玉树县| 绥中县| 营口市| 东城区| 昂仁县| 马关县| 芦溪县| 平顺县| 苍梧县| 邹平县| 上杭县| 酒泉市| 肥西县| 颍上县| 龙陵县| 桐梓县| 柳州市| 广西| 新沂市| 金乡县| 双流县| 乡城县| 华阴市| 张北县| 永昌县| 南城县| 定边县| 嫩江县| 仲巴县| 红桥区| 马龙县| 山阳县| 香港| 寿宁县| 凭祥市| 绥阳县| 射阳县| 建平县| 琼结县| 武义县| 贵德县| 三穗县| 义乌市| 收藏| 城固县| 鸡西市| 绩溪县| 大同县| 财经| 彩票|