在當(dāng)下科技浪潮中,人工智能(AI)尤其是大語(yǔ)言模型發(fā)展勢(shì)頭迅猛。其核心基礎(chǔ)在于海量訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)皆源自真實(shí)人類創(chuàng)作的文本、視頻和圖像。人類借助這些數(shù)據(jù)精心教導(dǎo)AI模型,使其能夠精準(zhǔn)識(shí)別模式并生成相應(yīng)內(nèi)容。毫無(wú)疑問(wèn),人類在AI的訓(xùn)練進(jìn)程中扮演著至關(guān)重要的角色。然而,一個(gè)引人深思的問(wèn)題隨之浮現(xiàn):AI是否也在反向“訓(xùn)練”著我們呢?
近期,越來(lái)越多的研究報(bào)告揭示出一個(gè)令人警醒的現(xiàn)象:人們?cè)谑褂么笳Z(yǔ)言模型(LLM)的過(guò)程中,會(huì)不自覺(jué)地受其影響,逐漸習(xí)得其寫作模式、推理方法,甚至在觀點(diǎn)形成上也受到潛移默化的作用。
近日,南加州大學(xué)的研究團(tuán)隊(duì)在Cell子刊《Trends in Cognitive Sciences》上發(fā)表了一篇頗具影響力的觀點(diǎn)文章,題為《The homogenizing effect of large language models on human expression and thought》(大語(yǔ)言模型對(duì)人類表達(dá)和思維的同質(zhì)化影響)。
該文章著重指出,大語(yǔ)言模型(LLM)正悄然成為人類表達(dá)和思維走向同質(zhì)化的“幕后推手”。在其影響下,我們每個(gè)人的語(yǔ)言風(fēng)格、觀點(diǎn)傾向,乃至思考問(wèn)題的方式,都呈現(xiàn)出愈發(fā)相似的趨勢(shì)。更為驚人的是,這種同質(zhì)化現(xiàn)象的影響范圍極為廣泛,甚至?xí)澳切┎⑽粗苯邮褂肁I的人群。
文章作者之一、南加州大學(xué)計(jì)算機(jī)科學(xué)家Zhivar Sourati進(jìn)一步解釋道,倘若你身邊的人都在頻繁與這些大語(yǔ)言模型互動(dòng),并且紛紛采用模型所呈現(xiàn)的表達(dá)風(fēng)格、觀點(diǎn)立場(chǎng)以及推理邏輯,那么久而久之,你會(huì)發(fā)現(xiàn)自己仿佛置身于一個(gè)無(wú)形的“信息繭房”之中。這種環(huán)境會(huì)讓你產(chǎn)生一種錯(cuò)覺(jué),似乎只有按照這種方式來(lái)表述信息,才更符合社會(huì)的普遍規(guī)范和大眾的期待。
當(dāng)你正為一篇工作報(bào)告愁眉不展,或是對(duì)一封重要郵件的措辭反復(fù)斟酌時(shí),只需打開像ChatGPT、DeepSeek這類基于大語(yǔ)言模型(LLM)的AI工具,輸入幾個(gè)關(guān)鍵信息,短短幾秒,一段條理清晰、用詞恰當(dāng)、邏輯連貫的文字便會(huì)躍然眼前。你只需稍作調(diào)整,便可點(diǎn)擊發(fā)送,這般高效便捷,著實(shí)讓人滿意。
事實(shí)上,這已然成為眾多人的日常操作。大語(yǔ)言模型正以前所未有的態(tài)勢(shì)深度融入我們的生活,它不僅是寫作時(shí)的得力助手,還是創(chuàng)意激發(fā)的親密伙伴,甚至在決策過(guò)程中,也如同我們的“外腦”一般,提供著支持與參考。
然而,在我們愈發(fā)依賴這些AI助手的同時(shí),是否思考過(guò),它們正以一種不易察覺(jué)的方式,悄然改變著我們自身呢?
認(rèn)知多樣性,體現(xiàn)在語(yǔ)言風(fēng)格、觀點(diǎn)視角以及推理策略的差異上,它是人類創(chuàng)造力、集體智慧和適應(yīng)能力的基石。這種多樣性深深扎根于我們不同的文化背景、歷史經(jīng)歷以及個(gè)體經(jīng)驗(yàn)之中。
不同的語(yǔ)言風(fēng)格,宛如一面鏡子,能夠映射出人的個(gè)性、年齡,甚至健康狀況。例如,阿爾茨海默病在早期就有著獨(dú)特的語(yǔ)言特征。不同的觀點(diǎn),則是構(gòu)建健康公共討論的基石,讓各種聲音得以碰撞、交流。而不同的推理方式,比如有的基于生態(tài)關(guān)系進(jìn)行歸類,有的則依據(jù)物種分類法,這使得群體在面對(duì)復(fù)雜問(wèn)題時(shí),能夠各展所長(zhǎng),找到多樣化的解決方案。
但令人惋惜的是,大語(yǔ)言模型的設(shè)計(jì)與運(yùn)行機(jī)制,卻在不知不覺(jué)中侵蝕著這種珍貴的多樣性。
先看語(yǔ)言的“美顏濾鏡”現(xiàn)象。研究顯示,當(dāng)人們借助LLM對(duì)各類文本進(jìn)行“潤(rùn)色”,無(wú)論是社交媒體上的帖子、新聞稿,還是學(xué)術(shù)摘要,甚至是個(gè)人隨筆,這些文本的寫作復(fù)雜程度都會(huì)趨于一致。原本那些能夠預(yù)測(cè)作者政治傾向、性格、性別或年齡的語(yǔ)言特征,比如特定詞匯的使用頻率,變得難以分辨。這意味著,經(jīng)過(guò)AI修飾后的文字,雖然更加“規(guī)范”“流暢”,卻也抹去了個(gè)人獨(dú)特的語(yǔ)言印記。更為嚴(yán)峻的是,這種“語(yǔ)言美顏”還可能掩蓋如阿爾茨海默病早期語(yǔ)言特征等重要的健康信號(hào),讓我們錯(cuò)過(guò)早期發(fā)現(xiàn)和干預(yù)的機(jī)會(huì)。
再瞧觀點(diǎn)的“主流回聲”情況。相關(guān)文章指出,LLM所呈現(xiàn)的觀點(diǎn),往往傾向于反映西方、高受教育程度、工業(yè)化、富裕社會(huì)的特征。當(dāng)被詢問(wèn)對(duì)某些議題的看法時(shí),LLM生成的回答不僅在多樣性上遠(yuǎn)遠(yuǎn)低于真實(shí)人類,而且更貼近所謂的“主流”或“社會(huì)認(rèn)可”的立場(chǎng)。即便我們嘗試讓AI模擬特定身份,其結(jié)果也常常是刻板印象的簡(jiǎn)單堆砌,而非真實(shí)、多元的群體經(jīng)驗(yàn)。當(dāng)我們頻繁與這些觀點(diǎn)高度一致的模型“對(duì)話”,我們自身的觀點(diǎn)和表達(dá)框架,也可能會(huì)在不知不覺(jué)中被其“校準(zhǔn)”,逐漸失去獨(dú)特的視角和見(jiàn)解。
最后說(shuō)說(shuō)思維的“最佳路徑”依賴問(wèn)題。在推理和創(chuàng)造領(lǐng)域,多樣性是創(chuàng)新突破的關(guān)鍵因素。然而,LLM通常被訓(xùn)練和優(yōu)化以追求“最佳性能”,即更高的準(zhǔn)確性、有用性和無(wú)害性。廣泛應(yīng)用的“思維鏈”(Chain of Thought,CoT)提示等技術(shù),雖然能夠提升邏輯性,但也強(qiáng)化了線性、顯式的推理模板。研究表明,在創(chuàng)意構(gòu)思任務(wù)中,借助LLM協(xié)助的人雖然能夠產(chǎn)出更多、更詳細(xì)的點(diǎn)子,但不同參與者產(chǎn)出的點(diǎn)子在語(yǔ)義上的相似度也顯著升高。更值得關(guān)注的是,神經(jīng)科學(xué)研究發(fā)現(xiàn),與獨(dú)立寫作或使用搜索引擎輔助相比,使用LLM輔助寫作時(shí),大腦的神經(jīng)耦合程度最弱,記憶召回能力也更差。這意味著,我們可能正在將思考和創(chuàng)造的核心過(guò)程“外包”給AI,并為此付出認(rèn)知能力退化的代價(jià)。

這種同質(zhì)化現(xiàn)象絕非偶然降臨。一方面,LLM所依賴的訓(xùn)練數(shù)據(jù),本身就存在過(guò)度偏向網(wǎng)絡(luò)主流語(yǔ)言和觀點(diǎn)的問(wèn)題。那些在網(wǎng)絡(luò)上占據(jù)主導(dǎo)地位的語(yǔ)言風(fēng)格、觀點(diǎn)傾向,在訓(xùn)練數(shù)據(jù)中占據(jù)了極大比例,為同質(zhì)化埋下了伏筆。另一方面,LLM的訓(xùn)練目標(biāo)聚焦于預(yù)測(cè)下一個(gè)詞,這種特性使得它天然地傾向于學(xué)習(xí)并復(fù)制最常見(jiàn)、最容易廣泛應(yīng)用的模式,而那些少數(shù)、特殊的表達(dá)方式則會(huì)被無(wú)情“抹平”。
更為棘手的是循環(huán)反饋機(jī)制帶來(lái)的惡性循環(huán)。隨著越來(lái)越多的人選擇使用少數(shù)幾個(gè)主流的LLM,大量同質(zhì)化的內(nèi)容如潮水般涌入網(wǎng)絡(luò)。而這些同質(zhì)化的內(nèi)容,又搖身一變成為訓(xùn)練下一代模型的數(shù)據(jù)“養(yǎng)料”。新一代模型基于這些數(shù)據(jù)輸出內(nèi)容,進(jìn)一步加劇了同質(zhì)化程度。這一過(guò)程就像一個(gè)不斷收緊的漩渦,將人類表達(dá)原本豐富多彩的多樣性,無(wú)情地卷入一個(gè)愈發(fā)狹窄的通道之中。
論文作者將這一現(xiàn)象形象地類比為社會(huì)學(xué)領(lǐng)域的“麥當(dāng)勞化”。在追求效率、可預(yù)測(cè)性和控制的道路上,我們往往以犧牲情境的豐富性和獨(dú)特性作為代價(jià)。在認(rèn)知領(lǐng)域,我們正逐漸用流暢、一致的AI輸出,取代那些基于具體情境、獨(dú)具特色的思考方式。原本多元的思考視角,在AI的“標(biāo)準(zhǔn)化”輸出面前,變得千篇一律。
當(dāng)然,論文作者并非要對(duì)AI的價(jià)值全盤否定,而是發(fā)出了警惕風(fēng)險(xiǎn)的誠(chéng)摯呼吁。他們進(jìn)一步提出了幾個(gè)極具前瞻性的關(guān)鍵研究方向。例如,如何讓AI的“對(duì)齊”技術(shù)真正做到尊重人類認(rèn)知的深層多樣性,而不是僅僅制造一些表面的差異?長(zhǎng)期依賴AI進(jìn)行思考,會(huì)對(duì)我們的大腦產(chǎn)生哪些不可逆轉(zhuǎn)的影響?能否通過(guò)精心的產(chǎn)品設(shè)計(jì),幫助使用者在使用AI的過(guò)程中保持主動(dòng)性和獨(dú)特性,避免被AI“同化”?
大語(yǔ)言模型(LLM)無(wú)疑是一類威力強(qiáng)大的工具,但我們必須清醒地認(rèn)識(shí)到,它絕非只是一個(gè)被動(dòng)的存在。它是一個(gè)充滿活力、具有強(qiáng)大塑造能力的參與者,正與我們攜手共同書寫未來(lái)思維的“源代碼”。在盡情享受AI帶來(lái)的便利與高效時(shí),我們或許應(yīng)該時(shí)常停下腳步,認(rèn)真反思:當(dāng)我們借助AI來(lái)表達(dá)時(shí),我們是在不斷增強(qiáng)自身的表達(dá)能力,還是在不知不覺(jué)中逐漸遺忘自己獨(dú)特的聲音?當(dāng)AI能夠替我們思考時(shí),我們是在解放大腦,讓它有更多精力去探索更深層次的未知,還是在悄無(wú)聲息中,讓所有人的思想都走向一個(gè)由數(shù)據(jù)定義的“標(biāo)準(zhǔn)答案”,失去原本的個(gè)性與色彩?
在AI時(shí)代,保護(hù)人類語(yǔ)言、思維和表達(dá)的“生態(tài)多樣性”,或許將成為人類面臨的最重要文化命題之一。這需要開發(fā)者在技術(shù)研發(fā)中秉持多元包容的理念,研究者深入探索潛在影響與應(yīng)對(duì)策略,政策制定者制定科學(xué)合理的規(guī)范與引導(dǎo)政策,更需要每一位使用者保持清醒的認(rèn)知和主動(dòng)的思考。唯有各方共同警醒、攜手努力,才能守護(hù)好人類認(rèn)知與表達(dá)的獨(dú)特“生態(tài)”。
樂(lè)備實(shí)(上海優(yōu)寧維生物科技股份有限公司旗下全資子公司),是國(guó)內(nèi)專注于提供高質(zhì)量蛋白檢測(cè)以及組學(xué)分析服務(wù)的實(shí)驗(yàn)服務(wù)專家,自2018年成立以來(lái),樂(lè)備實(shí)不斷尋求突破,公司的服務(wù)技術(shù)平臺(tái)已擴(kuò)展到單細(xì)胞測(cè)序、空間多組學(xué)、流式檢測(cè)、超敏電化學(xué)發(fā)光、Luminex多因子檢測(cè)、抗體芯片、PCR Array、ELISA、Elispot、PLA蛋白互作、多色免疫組化、DSP空間多組學(xué)等30多個(gè),建立起了一套涵蓋基因、蛋白、細(xì)胞以及組織水平實(shí)驗(yàn)的完整檢測(cè)體系。