
五分鐘心理學難度 ★★★2025年9月26日約 26 分鐘
MBTI 流行於找伴侶、找工作,但它一個更恰當的位置其實是「個人的神話」,而不是能準確預測行為的科學工具。本集從榮格學派與心理計量學(信度、效度)兩個角度拆解現代 MBTI 的理論問題,並指出它最大的爭議——「true type(與生俱來、不會改變的核心類型)」既不符合榮格的個體化思想,也不符合現代科學對性格的理解。MBTI 的真正價值,是讓你接觸自己被壓抑的陰影,而不是用四個字母把自己定型。
MBTI 無疑很流行:找伴侶用 MBTI,找工作又用 MBTI。但整個社會好像對這件事有點走火入魔,而我認為 MBTI 的作用從來不應該是這樣。
在研究過現代心理學、MBTI 的理論和榮格的說法之後,我認為 MBTI 一個更恰當的位置,是「個人的神話」,而不是一個能夠預測你行為的科學工具。
這集會更深入地講解 MBTI 的理論問題,以及如果我們要真正認識 MBTI,究竟要知道些甚麼。甚麼是人?甚麼是性格?這集很適合每一個做完 MBTI、覺得性格類型很能形容自己、很有感受的人——我想跟你分享,那種所謂的感受,在榮格和現代科學的理論裏究竟是甚麼。
在評論 MBTI 之前,先要鋪墊一點榮格的概念。榮格怎樣理解人的意識?你可以想像一個小朋友,他好像完全沒看過真實的戰爭,卻知道甚麼叫英雄、甚麼叫惡人。這些對人形象的理解,其實是伴隨基因給我們的禮物而來的,那叫集體潛意識——我們本身就有一個勇士的原型在自己那裏。
但每個人都有勇士的概念和原型,卻未必每個人都能成為真正的勇士。有人跟勇士的形象相差很遠,而正正在「有勇士的概念、卻沒有成為勇士」這個分野裏,象徵著一種發展的可能。榮格告訴你,人應該往的方向,就是個體化(individualization):把自己不同的面向帶出來,這是榮格認為一個人心靈發展的要務。
榮格還有一個很有趣的觀察:我們今天拿來面對社會的意識,很多時候是透過壓抑一些潛藏面向而形成的。例如兩三歲的小朋友是沒有異性概念的,男女玩在一起;要到小學,男生女生才分開玩。換言之,我們一出生本是一個完整的存在,但社會對我們有期望——你是男性,可能就不應該太柔弱、不應該太多表達陰柔(feminine)的部分,而應該多表達陽剛(masculine)的面向。於是你壓抑了一些面向,那成為你心目中不意識到、不表現出來的一塊;而你呈現出來的,就是你的人格面具(Persona),那個你拿來過日子的東西。
所以榮格的概念是這樣:人本是一個完整的東西,那叫大寫 S 的自性(Self);為了成為一個能在社會行走的人,我們壓抑了面向,剩下呈現出來的那個就是自我(Ego)。自我是功能性的(functional),但它沒有那股心理的能量。這也解釋了為甚麼愛情常給我們一種「找回自己、令整個人更完整」的感覺——它幫你跟自己壓抑了的部分重新連結。但這件事向來不應該只靠另一個人去找到,而是一個你告訴自己的發展故事。把缺失的一塊重新化為現實,這個過程就叫融合(integration),也是一個人走上個體化的路。
MBTI 宣稱自己是一種心理測試、一種心理計量(psychometrics)。在現代科學界,一個好的心理計量要符合兩項條件,就是我們常說的信度和效度。
先說信度(reliability)。心理量表顧名思義是一把尺,而一把好尺量度東西要穩定,不可以每次量度同一樣東西都給你不同的長度——那很明顯不是一把好尺。對應到心理量表,就是再測信度(test-retest reliability):我們每次做測試,是不是都得出一樣的結果。有人研究過,若從分類別的方式看,MBTI 的再測信度不算理想;相信很多人做 MBTI 都會發覺那四個字母經常轉來轉去,這正是有人批評 MBTI 再測信度不好的原因。
除了信度,量表還要有效度(validity)。效度象徵它量度的東西,是不是真的在量度它宣稱量度的東西。例如外向,如果定義為把較多能量放在社交生活上,那這個概念應該能在一些行為上呈現——例如在派對上跟更多人聊天,或跟其他量表有相關性(correlation),我們就會說它有比較好的效度。經過信效度區間檢驗的測量工具,才會成為業界認可的心理計量。
你大概會發現,看前面講榮格那段的感覺,跟聽我講信效度那段很不同。連我自己講的時候都感覺到,內心在用很不同的部分:講榮格那段我是有感情地講,講信效度這段我是很陳述事實、用分析思維(analytical mind)去講。用榮格的角度看,這分別對應了自我(Ego)和自性(Self)。
這也許正是 MBTI 引人入勝之處:它好像直擊你心靈的某些面向,把你最不想面對的東西帶出來。這無可否認是 MBTI 的魅力。例如在我身處的心理學行業,多數行家都認為大五模型(Big Five)有更好的科學有效性,但我從沒見過行家放工吹水時拿 Big Five 來聊;我們吃飯時還是會說「你是甚麼 MBTI」「我是 ENTP」。當然我們知道這不是真的在做科學討論,但這件事值得思考:為甚麼會這樣?它好像有股魔力。
這是個很複雜的問題,因為問題本身有很多層面。令這四個字母走紅的,有一個叫 16personalities.com 的性格測試,它用了很多漂亮的公仔、介面做得很好;但原來它跟傳統理論不同,它用很類似 Big Five 的測量方法,再以 MBTI 的方式去包裝。這是第一個引起混亂(confusion)的地方——很多時候它不是真的在說 MBTI 那回事。最弔詭的是,這樣做在方法學(methodology)上其實很 sound。
至於原典——例如 Myers-Briggs,或一些比較直接量度認知功能(cognitive function)的版本——那才是比較傳統的性格測試。但我看過它們的說法,理論和概念有問題。其中一個問題是,它們常強調 inborn type、true type:你出生時是怎樣就是這樣,評測結果會變只是因為你解讀題目的方式不同、或處於某種情緒狀態之下,但你一出生的核心是不會變的。
我認為 true type 這個概念有兩個很大的問題。第一,它不符合榮格所提倡的人生態度和原典。記得榮格認為人格怎樣形成嗎?我們本是整全的自我,因社會制約埋藏了某部分,再透過個體化的使命重新拾回失落的一部分。例如我是 ENTP,dominant function 是 Ne,比較不擅長的可能是 Fe 或 Si、情感的面向或身體的觸感等等;但這些並不是我一出生就如此。我的家庭背景確是很重視思考、不太講感情,這也可能是令我變成這樣的原因之一。
有趣的是,心理學、靜觀(mindfulness)這些很吸引我;又例如我自知運動做得差,卻很享受挑戰自己的感覺——這些都是我嘗試拾回自己失落面向的努力,而且看得到變化。我覺得自己現在跟幾年前相比,在情感處理上差別很大。那這一刻我還能不能說自己是一個 ENTP?還是不同的力量一直在平衡?要不斷成為一個整全的人,榮格的理論是很神秘(mystical)也令人感動的:人生的可能其實早已在你完整的自性那裏帶給你,問題是你只發揮自己已有的面向,還是真真正正去體驗作為一個人你可以有的東西。這跟 true type 的概念完全相違背。當我們相信有 true type,我們會說要發展第三功能(tertiary function)、第四功能(inferior function);但會不會連功能的部位都可以調轉,那才是更大的個體化?提出理論的人並沒有足夠理由解釋為甚麼不能,單純說就是這樣,我覺得不太合理,也不忠於榮格。
他們會回應說:那是因為 16personalities 表層,真正的 MBTI 不是這樣。但我的論點是,連真正的、量度認知功能、講 true type 的 MBTI 原典,本身都有理論缺陷——這缺陷不單不符合榮格,也不符合現代科學。現代科學普遍怎樣理解性格?我們會說性格是一個持久而穩定的特質變化:特質在年月間不會急劇轉變,而是穩定地改變。在這框架下,沒有理由相信甚麼 true type;你只能說它是一種信仰,但證明不出來。至於「你答錯只是因為你不理解題目」這種說法,我只能說那是心理計量版的金手指——如果每個心理測試都能用這藉口,做心理計量會輕鬆很多,但它也會喪失效度。所以這些東西並不可取。
就 MBTI,我研究過幾篇論文。例如 Randall 2017 有一篇研究 MBTI 信效度,普遍發現其實不錯,沒有某些人說得那麼差。信度方面,多數在三個向度上都過 .7,只有思考與情感(Thinking-Feeling)這向度比較低;以心理學界標準不算很好,但也不完全是垃圾。研究也發現 MBTI 一些向度跟 Big Five 關係很大,例如你是 T 人還是 F 人,跟 Big Five 裏的親和性(agreeableness)有很大相關:親和性低多數是 T 人,親和性高多數是 F 人,這也很直觀。
但你會發現,這些科學上的「不差」,似乎沒辦法跟前面講的 true type 理論放在一起。記得我一開始用另一個判準說 MBTI 再測信度不夠、約一半人會轉字母嗎?會轉字母的意思是:當它作為「類型」的性格測試時,再測信度不合格;但當它作為一種「基於特質」的性格測試時,可能就有足夠的再測信度。我想主要問題其實就在這裏。
當然還可牽扯到很多複雜問題,例如 MBTI 本身是被一些(我不太喜歡這種區分)非心理學背景的人做出來的,所以學界一向沒給它應得的重視。但 MBTI 能引起這麼大軒然大波,這個事實本身就很值得心理學人去看看是怎麼一回事。可惜我們這行有時是政治先行的世界,凡事都要區分你是正統科班還是不純正出身,這既可悲,也違背科學探求真理的精神。
那 MBTI 在整個性格的版圖上應該怎樣理解?MBTI 源自榮格的《Psychological Types》。要知道榮格是個很注重內省(introspective)、內觀很強的人,他研究科學不是做現代的隨機對照試驗(randomized control trial),而是深觀自己內心去做概念化。用榮格的語言說,他是用自性(Self)的力量把人的整全性呈現出來,這可能正是 MBTI 有其心理力量的原因。
但這跟現代科學是否不相容?作為一個頗喜歡、也忠實於榮格信念的人,我會說:自性這股心理力量,必須能跟事實連結才有用。這是否做不到?我不認為。例如思考與感知之間的關係,或自我–自性軸(Ego-Self axis),其實在腦神經科學上有些類似概念,例如前額葉皮質–杏仁核迴路(prefrontal cortex-amygdala link)——那股情緒力量要經多少理性區域去處理。這些跟一些傳統智慧很結合,只是還沒有人去做這些研究,這是可惜的地方。
再看 Big Five,它基於詞彙假說(lexical hypothesis):假設人與人之間所有有意思的差異,必然會在語言裏呈現;透過分析用字的分別與頻率,用集群分析(cluster analysis)這種數學上的共變方式,歸納出五大向度——外向性、親和性、盡責性、神經質、開放性。Big Five 注意的焦點是人與人之間社會行為的表述,而不是內心心靈的面向;它涵蓋心靈面向的形容詞反而少,因為人與人之間的感覺本來就有些不會宣之於口,語言上貧乏,心裏未被了解之處也未必有形容詞去呈現。取而代之,我們有小說故事、意象神話、各種比喻——這些是詞彙假說觸及不到,而 MBTI 可能觸及得到的地方。
由於 Big Five 的定位是把人當成一種現象、一個可被研究的對象去觀察,它的合理性很理想,能預測人生很多行為和成就。例如最影響一個人收入的因素是 IQ,第二就是盡責性;Big Five 很多指標在高的時候是心理健康的保護因子(protective factors)——一個人很外向、很有親和力、開放性高、神經質低、又很盡責,多數心理健康不會太差,這也有研究發表過。所以在科學應用上,Big Five 的確很適用。
正如我在片頭說的,做職涯導向、或判斷該不該聘請一個人,Big Five 可能是更合適的選擇;類似的工業與組織心理學測試,例如 Hogan、SHL 等產品,也是用類似方式做出來的。但作為一個個人神話去解讀、作為接觸自己陰影的方式,我覺得真的沒有理論能比 MBTI 帶來更深刻的感受。它帶給我們的這個面向,可能也是我們要接受、要去整合的——這是我們作為一個人的使命。
這些是不是全部?又不是,這世界真的很大。幾年前我看過丹·麥克亞當斯(Dan McAdams)一篇文章〈What Do We Know When We Know a Person?〉,他說人的性格只是底層、是人與人之間共通的地方。例如兩個 INTP 之間可能有很多共通性,但一個人那股對直覺(intuition)的追求跟情感之間的關係、他願不願意理解善良與邪惡在社會上的價值、甚至他在社會網絡裏的身份,這些是人多幾個層次的特質,包括人的個性(character)和人生的敘述(narrative)。在 McAdams 的理論裏,這些可能才是我們理解一個人真正應該理解的地方。
總而言之,MBTI 是一個屬於你的神話:記住它給你的感受,但不要只記住它給你的感受。我們要走出去接觸不同的人,真摯地理解一個人,而不是被他的性格所限制;對自己也一樣,你需要真摯地理解自己。自己不是四個字母——這樣,人才可能有一個更整全的人生。
與其說它是科學工具,不如說它更接近一個「個人的神話」。MBTI 源自榮格,而榮格本身不是用現代科學的隨機對照試驗去研究人,而是靠很強的內省去把人的整全性概念化。所以 MBTI 真正的力量,是它好像直擊你心靈某些面向、把你最不想面對的東西帶出來——這是它的魅力,但這份「直擊內心」的感受,跟「能準確預測你行為的科學」是兩回事。把它放在個人神話、接觸自我的位置,比把它當成預測工具更恰當。
因為若把 MBTI 當成「分類別」的測試,它的再測信度(test-retest reliability)並不理想——大約有一半人重測會轉字母。信度的意思就像一把尺:好的尺量度同一樣東西應該每次都給出穩定的數值,量度同一個人卻不斷給出不同類型,就代表這把「尺」在分類上不夠穩定。但有趣的是,如果改用「基於特質(trait)」的角度去看同一份結果,它其實可能有足夠的再測信度;問題主要出在「非此即彼地分成一個類型」這個做法上。
現代科學上沒有理由相信有所謂 true type,它比較像一種信仰,是證明不出來的。原典理論常強調你出生時是甚麼類型就是甚麼,結果會變只是因為你解讀題目的方式或當下情緒不同,核心永遠不變。但這個說法有兩個問題:第一,它不符合榮格——榮格認為人本是整全的自性,因社會制約而壓抑了部分面向,再透過個體化重新拾回失落的自己,人格本來就會發展和改變;第二,「你答錯只是因為你不夠了解自己」這種解釋,等於是心理計量的金手指,每個測試都用這藉口就會做得很輕鬆,但同時也會失去它的效度。
因為令這四個字母走紅的 16personalities,雖然用 MBTI 的方式去包裝,骨子裏卻是用類似 Big Five 大五性格測試的測量方法去做的,跟強調認知功能的 MBTI 原典並不相同,這正是混亂的起點。弔詭的是,這種做法在方法學上反而比較 sound;真正的麻煩是,即使回到強調認知功能、量度 true type 的 MBTI 原典,那套理論本身仍然有缺陷——它既不符合榮格,也不符合現代科學。
在現代科學界,一個好的心理計量工具要同時符合兩個條件。信度(reliability)講的是穩定,就像一把好尺量度同一樣東西要給出一致的結果;MBTI 在這裏被詬病的是「再測信度」,即重測會不會得出同樣的類型。效度(validity)講的是「準不準」,即它量度的東西是不是真的在量度它宣稱的那回事——例如它說的外向,是否真的對應你在派對上跟更多人聊天等外顯行為,或跟其他量表有相關。經過信效度檢驗的工具,才會成為業界認可的心理計量。
兩者其實在說人的不同層面。Big Five 基於詞彙假說(lexical hypothesis):假設人與人之間所有有意思的差異,最終都會在語言裏呈現,於是透過分析用字的分別和頻率,整理出外向性、親和性、盡責性、神經質、開放性五大向度。它科學有效性高,能預測很多人生行為和成就(例如影響收入的因素第一是 IQ,第二是盡責性),多項指標也是心理健康的保護因子,所以做職涯導向或判斷該不該聘請一個人,Big Five 更合適。但它聚焦的是人與人之間的社會行為表述,較少觸及內心、心靈的面向;而那些難以宣之於口、語言貧乏之處,正是 MBTI 透過神話、意象去觸及的地方。研究也發現兩者相關,例如 T/F 向度跟 Big Five 的親和性高度相關:親和性低多數是 T 人,親和性高多數是 F 人。
MBTI 是一個屬於你的神話:記住它帶給你的感受,但不要只記住那份感受。它最大的價值,是讓你接觸自己的陰影、那些被社會制約壓抑了的面向,這種深刻感受暫時沒有別的理論能取代。但人遠不只四個字母——除了底層共通的特質,還有個性(character)、人生的敘述(narrative)、價值觀與社會身份等更多層次。真正認識一個人、認識自己,是要真摯地理解,而不是被一個類型所限制;不把自己定型,人才可能有更整全的人生。
Randall, Isaacson & Ciro (Journal of Best Practices in Health Professions Diversity)
對 MBTI 信效度的系統性回顧與後設分析;普遍發現並非如某些批評那麼差:E-I、S-N、J-P 三個向度的信度多數達 .75 以上,只有思考–情感(T-F)向度較低(約 .61),且 MBTI 多個向度與 Big Five 有相當的關係。
Dan McAdams, 「What Do We Know When We Know a Person?」(Journal of Personality)
提出理解一個人要看多個層次:底層是人與人之間共通的特質,之上還有人的個性(character)與人生的敘述(narrative);性格特質只是最底層,真正認識一個人需要超越類型。
榮格《Psychological Types》與個體化(Individualization)理論
榮格認為人本是整全的自性(Self),因社會期望而壓抑部分面向、剩下功能性的自我(Ego)與人格面具(Persona);心靈發展的要務是透過個體化重新拾回失落的面向,使人重歸完整。MBTI 即源自此書。
詞彙假說(Lexical Hypothesis)與 Big Five 大五性格測試
假設人與人之間所有有意思的差異最終都會在語言中呈現,透過分析用字的分別與頻率(集群分析/數學上的共變),歸納出外向性、親和性、盡責性、神經質、開放性五大向度。
前額葉皮質–杏仁核迴路(Prefrontal cortex–amygdala link)
主持以此作類比:情緒力量經過多少理性區域去處理,跟榮格自我–自性軸(Ego-Self axis)、思考與感知之間的關係等傳統智慧頗為呼應,惜暫未見有人就此做相關研究。
回想一個你「不擅長、卻偶爾很想嘗試」的面向(例如表達情感、做運動、或安靜獨處)。它可能正是你被社會制約壓抑、而值得在這星期主動去接觸一次的失落面向——試著做一件小事去親近它,而不是用 MBTI 類型告訴自己「我就是這樣的人」。
