
五分鐘心理學2022年9月2日約 18 分鐘
為什麼 MBTI 不夠準確、而 BIG5 大五人格被認為更科學?關鍵在於 MBTI 是榮格憑個人世界觀挑出來的維度,再測信度只有約五成;BIG5 則建基於「字彙學假說」與「因素分析」,由幾萬個形容詞的數學關聯整合出五個性格維度,而非由心理學家憑空創作。這一集醉後傾談還談到用 AI 為大五數據分類時反覆出現的「兩極化」結果,以及情侶到底該看性格相似還是看共同的人生故事。
要明白性格測試為甚麼有準與不準之分,可以先做一個思想實驗:如果要你設計一個性格測試,你會怎樣做?合理的做法,是先預設一些你認為重要的性格特徵,再據此出題,去問受訪者在這些指數上有多高。
問題就在這裏:你憑甚麼決定哪些特徵重要、要問哪些問題?通常你只能根據自己作為一個人覺得甚麼重要去設定。榮格雖然是公認的天才,但他也是這樣想出榮格八維——他覺得外向性、內向性重要,於是製作出一堆題目。這代表測試的理論根基本身受到他個人世界觀的影響,這是 MBTI 其中一個理論上的短板。
除了這個理論問題,MBTI 還有第二個問題:再測信度(Test-retest Reliability)很差。玩過的人可能有經驗,大約有五成人做第一次和做第二次的結果並不一樣。
怎樣解決「一個人看到的太片面」這個問題?思路是集結不同人的觀點:一人看到的是片面,多人就更全面。這正是 BIG5 大五人格的根基,它建基於一個叫「字彙學假說」(Lexical Hypothesis)的概念。
字彙學假說的定義很簡單:人與人之間一切重要的差別,必然會在語言當中呈現出來。想像一群人流落荒島,語言不斷演化,總會發明出一些詞語去形容彼此的差異——例如形容某人「有型」、形容自己「蝕底」。換句話說,只要研究、分析語言中所有可以用來形容人的詞語,就足以捕捉人全部的性格分別,因為性格講的正是個人之間的差別。
BIG5 原本的做法,是美國人找出幾萬個最平常、用來形容人的形容詞(例如外向、開心),再把這幾萬個形容詞發給幾百人去填。結果發現某些形容詞之間有統計上的關聯:例如你說自己是個緊張的人,多數你也會形容自己是個會擔心的人。
BIG5 之所以厲害,在於它最後整合出來的五個維度不是某個心理學家創作出來的,而是用一個叫「因素分析」(Factor Analysis)的數學方法得出——發現人根本地有五種不同的性格特質。
那為甚麼是五個、不能更少?這牽涉資訊處理裏一個叫「資訊獲利」(Information Gain)的概念。把人分成幾萬類並不合情理,資訊獲利就是計算每多分一類能多得到多少資訊;只要歸類後沒有流失太多資訊就好。學過機器學習的人會聯想到「手肘法」(Elbow Method):看每減一個因子能保留多少資訊,普遍發現減到第五個之後再往下減就沒有用了。
即使維度由數學整合出來,仍然有爭議的地方——其中之一是標籤。你看完一群形容詞之後,要怎樣替它們命名,是一個主觀而且很「標籤化」的決定。
主持舉例:外向性曾經有心理學家認為不應該叫外向性,而應該用「正面情緒」去標籤。你會發覺,說別人「外向」聽起來沒那麼批判,但若改稱「正面情緒」,等於說對方「少正面情緒」,就變得很有批判性。同一群特質,換個名字味道就完全不同,這正是性格測試其中一個具爭議性之處。
把榮格八維/MBTI 拿來和 BIG5 對照,會發現一件很有趣的事。MBTI 的維度大致可以一一配對到 BIG5:E/I 對外向性,N/S 對開放性,T/F 對親和性(理性導向的人較少把情感當成考量,所以對應親和性),J/P 對嚴謹性。後來有人覺得原本榮格那套不夠用,再加上 T/A 這個維度,對應的就是神經質。
這幾組維度之間的關聯度,大約在零點六至零點七——意思是兩個性格測試的對應維度,接近是同一個概念,並非差很遠。換言之,不論你用 MBTI 去包裝,還是用 BIG5 去整合,人看來都可以在根本相同的五個性格維度上有分別。在現階段,這為「人有五個基本性格特徵」提供了實證基礎。
不過也有人不太認同單靠字彙學假說直接做。現今學界有一種華人心理學,認為華人的性格結構與美國有所不同,多出一個「人性」的概念。有興趣的話,可以了解一下 HEXACO 性格模型,也就是 BIG6——在大五之外多加一個維度,有人認為對華人更準確。
資訊獲利的故事到第五個維度就完了,但主持團隊自己內部收集了萬幾筆 BIG5 數據(很多人在網上做過),得出一個相當有趣的結論。MBTI 會把人分類,但 BIG5 本身不分類;於是主持用機器學習的方法,叫電腦把這萬幾人的數據嘗試分成幾個類別。
最有趣的地方是:無論指示電腦分成兩類、三類、四類還是六類,結果總會出現同樣兩個極端。一類人外向、親和、嚴謹、開放四樣皆高,而神經質很低;另一類人則神經質很高、其餘四樣皆低。當主持把這結論講出來時,有人直覺替前者貼上「人生勝利組」的標籤,替後者貼上「魯蛇」的標籤——而這些名字都是人事後加上去的。
把人擺進不同情景,這個基本事實都會出現:叫電腦分兩類,就是這兩個極端;分三類,中間多一個中位;分六類,又多一些形形色色的人,但永遠都有這兩端。主持也用資訊獲利去看分到幾多類才不再有得着,多數結果落在六至八類。他覺得這個反覆出現的兩極,其實有點悲哀。
能不能用性格測試做情侶配對?可以。一般來說,性格不要差太遠:例如嚴謹性一個很高、一個很低,就可能很大件事——一方看對方亂得「跌在地上還算是人嗎」,另一方看你「這麼認真做甚麼」。性格相似的好處,是面對同一情景會有相近的情緒反應,於是有一種很 sync、很共鳴的感覺;主持以前寫過的文章也提過,那種同步感其實來自情緒相似。
但主持強調,他絕對不是叫人玩一玩性格測試、發現差得遠就直接分手。若按官方答案,更要看兩人的人生敍事(narrative)。除了大家較熟悉的愛情三角,Sternberg 還提出「雙重愛情理論」(Duplex Theory of Love):愛情不單看愛情三角,也要看情侶之間有沒有一個共通的故事。
有些情侶把愛情視作「園藝」(Gardening),悉心栽培共同的價值;有些視作「歷險」(Adventure),一起探索事物。功能性的愛情價值觀有很多種,但也有很不要得的,例如「警察」(Police)式的——不斷查對方是否出軌、要對方交出手機。重點是兩人的故事要對齊:一起去建立同一樣事物,一個對內、一個捍衛。
回到性格那一環:本身性格不合,當然可能要在摩擦上吃苦,但也有好的部分,例如親和性一高一低,只要能跨過原有的阻力,其實是不錯的組合。主持的結論是——若性格不合,就更需要一個比較強的人生故事去支撐;若大家沒有共同目標、只側重開心與相似的共鳴,往往撐不了很久,因為他們建構不了其他事物。當然,像有些上一代夫妻為了下一代或建立家庭而堅持,建立家庭也可以是一個共同目標,只是比較表層;這要看每個人的世界觀。最後主持也補一句:真心想讀心理學的話,最好也懂一點哲學。
因為 MBTI 的維度是榮格憑自己的世界觀挑出來的。設計一個性格測試時,你必須先決定「對人而言哪些特質重要」,再據此出題;榮格覺得外向與內向重要,於是用這個前設想出榮格八維。這代表測試的根基本身受設計者的主觀視角影響,這是 MBTI 理論上的一個短板。除此之外,MBTI 的再測信度也很差——同一個人做第一次和第二次,大約有五成人會得出不一樣的結果。
字彙學假說(Lexical Hypothesis)的定義很簡單:人與人之間一切重要的差別,必然會在語言當中呈現出來。隨着語言演化,人總會發明詞語去形容彼此的差異。BIG5 因此不靠某個心理學家拍腦袋訂維度,而是收集幾萬個用來形容人的常見形容詞,發給幾百人填寫,再看哪些形容詞之間有統計上的關聯——例如說自己「緊張」的人多半也會說自己「擔心」。這種做法的好處是把片面的個人觀點,換成由大量人的語言共同構成的全面圖像。
那五個維度不是有人創作出來的,而是用「因素分析」(Factor Analysis)這個數學方法,從幾萬個形容詞的關聯結構中整合出來的。至於為什麼是五個,關鍵在資訊處理上的「資訊獲利」(information gain):把人分得太細(例如幾萬類)並不合情理,所以要計每多分一類能多得到多少資訊。類似機器學習裏的「手肘法」(Elbow Method),普遍發現整合到第五個維度之後,再往下減已經得不到甚麼新資訊,所以停在五個。
不完全客觀。即使因素分析整合出哪些形容詞屬於同一群是數學決定的,但你要怎樣為這一群貼標籤,仍然是主觀決定。主持舉例:外向性曾有心理學家認為不應叫「外向」,而應叫「正面情緒」。兩者描述的其實是同一群特質,但「外向/內向」聽起來中性,「正面情緒」卻很有批判性——等於說對方「少正面情緒」。可見標籤本身會帶價值判斷,這也是性格測試其中一個爭議之處。
很大程度上是。把 MBTI 的維度逐一對照 BIG5,會發現對應的維度概念相近、關聯度大約在零點六至零點七:E/I 對外向性、N/S 對開放性、T/F 對親和性(理性導向的人較少把情感當成考量,所以對應親和性)、J/P 對嚴謹性;後來有人覺得不夠用,再加上 T/A 去對應神經質。換言之不論用 MBTI 去包裝,還是用 BIG5 去整合,人看來都可以在大致相同的五個維度上有分別,這為「人有五個基本性格特徵」提供了實證基礎。
主持團隊用機器學習,把網上收集的萬幾筆 BIG5 數據交給電腦做分類。有趣的是,無論指示電腦分成兩類、三類還是六類,結果都會穩定地出現兩個極端:一類是外向、親和、嚴謹、開放四項皆高而神經質很低(有人直覺標籤為「人生勝利組」),另一類則是神經質很高而其餘四項皆低(被戲稱為「魯蛇」),中間才是形形色色的人。主持覺得這個反覆出現的兩極其實有點悲哀,也再次顯示「標籤化」的問題——這些名字都是人事後加上去的。
不是。性格差太遠確實會帶來摩擦——例如一個嚴謹性很高、一個很低,彼此看對方的生活方式都會覺得難以理解。性格相似的好處,是面對同一情景時情緒反應相近,會有一種同步、共鳴的感覺。但主持強調,他絕不是叫人一玩性格測試發現差得遠就分手。若按官方答案,更要看兩人有沒有一個共通的人生故事;性格不合的伴侶,需要一個更強的人生故事去支撐關係。
這源自 Sternberg 的「雙重愛情理論」(Duplex Theory of Love)。除了大家熟悉的愛情三角,他指出還要看情侶之間有沒有一個共通的故事。有些伴侶把愛情視作「園藝」,悉心栽培共同事物;有些視作「歷險」,一起探索;也有很不健康的,例如把愛情當成「警察」,不斷查對方手機是否出軌。重點在於兩人的故事要對齊:若只側重「開心」與相似度的共鳴,缺乏共同目標,關係就較難長久撐住;反而親和性一高一低、只要跨過原有阻力並一起建立同一件事,也可以是不錯的組合。
字彙學假說(Lexical Hypothesis)
人與人之間一切重要的差別必然會在語言中呈現;因此研究所有形容人的詞語,就足以捕捉人的性格差異——這是 BIG5 的根基。
因素分析(Factor Analysis)與資訊獲利(Information Gain)
用因素分析把幾萬個形容詞整合,再以資訊獲利(類似機器學習的手肘法)判斷整合到第五個維度後再減已得不到新資訊,從而得出 BIG5 的五個維度。
再測信度(Test-retest Reliability)
MBTI 的再測信度很差,約有五成人第一次與第二次作答結果不一致。
HEXACO 六維人格模型(BIG6, Ashton & Lee)
在大五之外加入第六個維度(誠實-謙遜 Honesty-Humility);有觀點認為這類六維模型對華人更準確。
Sternberg 雙重愛情理論(Duplex Theory of Love)
整合愛情三角與「愛情即故事」:關係能否長久,不只看親密與承諾的多寡,更看兩人是否在演同一個愛情故事(如園藝、歷險,相對於警察式互相監視)。
回想你最近一段重要的關係:你和對方除了性格是否相似,有沒有一個共通的「人生故事」?試寫下你心目中這段關係正在演的是哪一種故事(例如一起栽培的園藝、共同探索的歷險),以及對方眼中又是哪一種——兩者對得上嗎?
