
五分鐘心理學2025年8月8日約 26 分鐘
劣質語文會悄悄改變我們的思維:當我們用「情緒價值」去形容人與人的互動,就把「衡量、計算」的意涵帶進了本應坦誠的關係,扭曲了溝通的本質。Peter借用人工智能AI的嵌入(embedding)與注意力(attention)技術,說明每個詞語其實是高維空間中的一組向量,而一個字會改變身旁另一個字的意涵——所以精準用字,正是維護清晰思考的方式。
這一集想跟大家分享:一些劣等的語文,如何影響我們自己的思考。這個題目其實一點都不簡單,連我構思整個思路時都覺得很困難,因為它牽涉數學、哲學、生物學、電腦科學和心理學,要把它們融會貫通。我會透過講解人工智能AI的技術,去解釋為什麼會這樣。
起點是我最近一直在研究AI技術。當我把AI、心理學和哲學這幾方面接觸得深入之後,發覺它們其實有可以融會貫通的部分,也讓我對大語言模型(LLM)的技術更添一層讚嘆。我希望這一系列影片能讓大家更理解:人是如何理解這個世界、為什麼語言對我們這麼重要、心理治療如何運作,以及每個人的世界觀是如何形成的。
不知道大家有沒有發覺,我們整個社會的語言文化品味其實很令人堪憂,出現很多奇怪的詞語。例如「非遺」,我一聽就覺得難聽,後來才知道原來是「非物質文化遺產」的簡稱。「非」這個字在文字上已經帶著很強的負面意涵(negative connotation),由「非」字,我們怎可能聯想到優良的傳統和習俗?當城市明明有更好的詞語可以代替,卻選用詞不達意的語言,這會影響我們作為一個群體的思考。
再看「情緒價值」。當我們講「價值(value)」,比較容易聯想到「衡量、計算」這類配搭詞。但「情緒價值」是用來形容人與人之間的互動——這種互動本應是坦誠的、是拿出真心的。當我們用「價值」去配「情緒」,其實歪曲了人與人溝通的意涵。我覺得「共鳴」或者「頭契(默契)」是更好的字。
還有「永遠的神(YYDS)」,我聽完覺得很尷尬。它表達的是佩服、讚嘆對方。但「永遠」「神」這些字,其實和我們的日常生活脫離得很遠,帶著一種絕對的意涵。當我們把這種字用進語言裏,就可能出現把凡事非黑即白化、神化的心理效應。神的特點是不可以有污點,可是被你形容為「永遠的神」的對象,多數並不是真的神——這反映出我們可能沒有能力去處理「一件事有好有不好」的意象。我在之前講梅蘭妮·克萊因(Melanie Klein)精神分析的影片已說過:一個很優秀、令你佩服得五體投地的人,同樣可以有缺點、有不為人知的面向,這才是真實。
要明白語言為何能塑造思考,可以先學一點AI的概念。一個很神奇的現象是:AI能由「apple」這個字生成一張蘋果的圖像。它是怎麼知道字符和形狀之間的關聯的?這就要講「嵌入(embedding)」。
我常用一個故事去講。我問現場同事:椰子是不是水果?有人說是,有人說不是。從這個反應可以看到,當我們探索一個語言概念時,會用一些標準去判斷。例如判斷是不是水果,有人看「適不適合放進沙律」(士多啤梨、蘋果、橙都很適合),有人看「有沒有營養(nutrition)」。我畫一個二維圖:橙營養高、又適合放沙律,定位在某一點,蘋果也類似。
但問題來了:有些東西既有營養又適合放沙律,卻不是水果,例如吞拿魚——它高蛋白(high protein)、適合做沙律,卻和水果混淆了。解決辦法是加第三個維度:「這東西是不是肉」。吞拿魚很「肉」,水果不「肉」,這樣就能準確區分。
這個概念在數學上叫「向量(vector)」。大家不必想得太複雜,它純粹就是一連串數字的集合。以蘋果、橙、吞拿魚三樣東西、三項準則(營養、沙律、肉)為例,各給一個0至1的分數:蘋果的營養0.9、沙律0.9、肉很低(因為是植物);橙類似;吞拿魚則營養0.9、放沙律的頻率低一點給0.7、但肉的向度很高給0.8。這就是一個三維的嵌入。
嵌入技術,就是把一個詞語的意思投射到高維空間,用數學方式表達它的意涵。我們只要把維度無限延伸,維度越多,就越能捕捉詞語更多的意涵。現代AI普遍用至少一千幾百、甚至幾萬個維度去表示一個字。例如「人」這個字,會變成0.5、0.2……一直下去幾萬個數值。這些維度沒有明確定義,但可能有一個代表「是不是生物」、一個代表「會不會死」、一個代表「有沒有勇氣」。這是一種很奇妙的技術:把我們的理解,用數學和高維空間的方式表示出來。
大語言模型還能理解詞與詞之間的關聯。例如「小明是一隻狗,牠跑得很快」,我們能知道「牠」指的是狗。當一句裏有幾個代名詞,AI怎麼知道哪個「牠」指「狗」?這要講「點積(Dot Product)」,一個很簡單的概念:把兩個字的向量相乘相加,就能得出兩者在語言空間中的相關性。
用回三個維度:蘋果是(0.9, 0.9, 0.1),橙是(0.9, 0.9, 0.1),相乘相加得0.81+0.81+0.01=1.63;而薯片營養低0.2、不適合沙律、也不是肉,蘋果與薯片的點積就低得多。由此推論:蘋果與橙的概念,比蘋果與薯片更相關。(真實模型還會經過歸一化Normalization,這裏只是簡化版。)
這正是2017年論文《Attention is all you need》的核心技術。要理解一句裏哪個字相關於哪個字,我們用「注意力(Attention)」——它模擬人腦的運作方式:把「牠」這個字和句中每個字計算點積,抽取出語言相關性高的部分。真實AI用成千上萬維,於是會有很特殊的詞,例如「牠」是代名詞,它在多維空間裏擁有一個「能夠指涉其他名詞」的維度特性,所以能連回「狗」。
其實世界上一切概念,我們都可以用一個「-ness」去理解:可能有「水果-ness」「沙律-ness」、能指涉其他東西的「-ness」。這也解答了開頭的問題:無論一件事用語言、圖像還是聲音表達,它們都在多維空間中指涉同一個概念、同一個向量,所以AI能由「apple」生成圖像。這種對應甚至跨語言——有AI語言專家發現,中文「蘋果」和英文「Apple」在很多向量分數上一樣,唯獨「Apple」在英文相關的向量高很多、「蘋果」在中文相關的向量高很多,兩者的差別幾乎等於蘋果對apple、橙對orange之間的連結。
回到開頭:椰子是不是水果?答案是「是」(我已查過資料,這是生物學的細胞結構分類)。但我想帶出一個有趣的觀點——「是不是」這個詞。當我們問蘋果「是不是」水果,正確答案是「是」;可是我們應該用什麼準則去判斷對錯?很多人憑直觀判斷時,看的其實是營養和沙律這兩個向量,而不是科學意涵。
「是不是」和「正確」這兩個字,表面上和科學沒什麼關係,但原來在我們整個社會文化裏,回答「是不是一個水果」時,必然蘊含了「要從科學數據得到判準」。所以「是不是」拿來判斷東西時,可能有一個「以科學為首」的向量,分數高達0.8。而這會隨時代改變:2025年的「是不是」和1800年的「是不是」,對科學實證的看重未必一樣,後者分數可能只有0.4。「是不是」字面從未變過,意涵卻每一刻都在更新——這就是語言的流變,也是這條片最想帶出的重點:一個字,從來不只是一個字。
正如維根斯坦的名言:「我的語言的界限意味著我的世界的界限。」用什麼字,影響了我們的世界。既然文化之間、個體之間都有差異,我們就更要小心、精準地用字,特別是重要的概念。這也是心理學家Jordan Peterson在《生命的十二法則》(12 Rules for Life)裏的建議:盡量精準地用字,因為不準確的用字會混淆我們的思考。
我用OpenAI的Embedding Model做了一點研究:給它兩個詞,「情緒價值」和「情感共鳴」,再請AI生成一百個和深度連結、親密、愛有關的詞語,例如柔情、默契、支持、包容、信任,然後分析它們的相似度。
結果在圖表上很清楚:代表「情感共鳴」的紅色那一邊比較擠擁,意思是「情感共鳴」這個概念在公共語言空間裏,和分享、交流、溝通、坦誠、真誠、真心、無私、奉獻這些情感相關詞語的相似度(也就是點積)高一點;反而「情緒價值」離它們比較遠。
這正是語言會影響我們思考的原因。如果大腦也有類似注意力模型的運作方式,那麼當我們用一個字時,其實就在改變另一個字的意涵。選用「情緒價值」還是「情感共鳴」,會牽動我們對一段關係的整體理解。當然,逐字深思是很費神的工作,被潛移默化也是人的特性;但希望這條片能讓願意看到最後的你,開始反思日常中的語言選擇。
因為「價值(value)」這個字本身連結著「衡量、計算」的意涵,當我們把它配上「情緒」去形容人與人之間的互動時,就在無形中把一段本應坦誠、交心的關係,框架成一種可以被計算的東西。人與人相處本來講的是真誠相待,而「情緒價值」卻把它變成像在評估收益。用「共鳴」或「頭契(默契)」這類字眼,反而更貼近這種互動的真正意涵。
問題不只是難聽,而是這些字本身的向量會牽引我們的思考。「非遺」是「非物質文化遺產」的簡稱,但「非」字帶著很強的負面意涵,一個用來指涉優良傳統與習俗的詞,卻以否定字開頭,根本詞不達意。「永遠的神(YYDS)」則更明顯:「永遠」「神」都是脫離日常、帶絕對意味的字,當我們習慣用這種字眼,就容易滋生非黑即白、把人神化的傾向——而被神化的對象其實只是普通人,於是我們失去了「一個人既優秀又有缺點」的理解能力。
靠的是「嵌入(embedding)」技術,也就是把一個詞語的意思投射到高維空間,用一連串數字(向量)去表示。以「水果」為例,可以用幾個維度去刻畫:有沒有營養、適不適合放進沙律、是不是肉。蘋果在「營養」和「沙律」上分數高、「肉」上分數低;吞拿魚雖然有營養又適合沙律,但「肉」這個維度分數很高,於是就和水果區分開來。維度越多,就越能捕捉一個詞更細緻的意涵;現代AI會用上千甚至幾萬個維度,每個維度可能代表「是不是生物」「會不會死」「有沒有勇氣」之類我們未必說得清的特性。
靠「點積(Dot Product)」和「注意力(Attention)」。把兩個詞的向量相乘相加,得出的數字就代表兩者在語言空間中的相關性——蘋果和橙的點積會明顯高於蘋果和薯片。當句子裏出現「小明是一隻狗,牠跑得很快」,AI會計算代名詞「牠」和句中每個字的點積,從而抽取出相關性最高的部分。在真實模型裏維度成千上萬,代名詞本身就有一個「能夠指涉其他名詞」的維度特性,所以AI能把「牠」連回「狗」。這個注意力技術正是模擬人腦運作方式。
因為無論一件事是用文字、圖像還是聲音去表達,它們都在同一個多維空間裏指涉著同一個概念、同一個向量。文字的「蘋果」和圖像的蘋果,背後對應的是相近的向量,所以AI可以在不同形式之間轉換。這種對應甚至跨越語言:有AI語言專家發現中文「蘋果」和英文「Apple」在很多向量分數上幾乎一樣,唯一的差別是「Apple」在「英國/英文」相關的維度分數較高、「蘋果」在「中文」相關的維度分數較高——兩者的差距,差不多就等於蘋果對apple、橙對orange之間的連結。
答案是「是」(已查證)。但更值得想的是:為什麼科學上的判準凌駕了大眾的直觀理解?很多人憑直覺判斷時,看的是「營養」和「適不適合放沙律」這些維度,而不是生物學的細胞結構分類。這透露出「是不是」「正確」這兩個字,表面上和科學無關,但在我們的社會文化裏,它們其實隱含了「要以科學數據為判準」的向量——這個向量分數可能高達0.8。而且它會隨時代改變:2025年的「是不是」對科學實證的看重,未必等於1800年的「是不是」。一個字從來不只是一個字。
意思是:同一個詞,字面不變,意涵卻時刻在更新。「是不是」在2025年和1800年寫法一樣,但它所承載的「以科學為本」的程度已經不同。既然語言會流變、文化之間有差異、個體之間也有差異,這正提醒我們用字要小心、要精準,特別是重要的概念。正如維根斯坦所說「我的語言的界限意味著我的世界的界限」,不準確的用字會混淆我們的思考——這也是Jordan Peterson在《生命的十二法則》裏給出的建議:盡量精準地用字。
Attention Is All You Need (Vaswani et al.)
提出Transformer架構與注意力(Attention)機制:透過計算詞語向量之間的點積,模型可判斷句中各字的相關性,從而理解「牠」指向「狗」這類詞語關聯。Peter以此論文說明AI如何理解詞語之間的關係。
詞語嵌入(Embedding)與向量(Vector)
把一個詞語的意思投射到高維空間,用一連串數字(向量)表示;維度越多越能捕捉詞義的細緻面向,現代AI用上千至數萬維。
維根斯坦的語言界限論
「我的語言的界限意味著我的世界的界限」——用什麼字會限定我們能理解的世界。
梅蘭妮·克萊因(Melanie Klein)精神分析
Peter引述其精神分析觀點,說明非黑即白、把人理想化或神化,反映無法處理「一個人既優秀又有缺點」的心理。
《生命的十二法則》(12 Rules for Life, Jordan Peterson)
其中一項建議是盡量精準地用字,因為不準確的用字會混淆思考。
這星期挑一個你常用、卻很少細想的流行詞語(例如「情緒價值」「YYDS」),問自己:它真正想表達的是什麼?有沒有一個更精準、更貼近你本意的字可以替換?試著換上那個字,留意它如何改變你對那件事的感受與理解。
