原文出處:命理與統計的距離。林聖軒(民109.02)。科學發展月刊,第566期。[下載全文PDF]
當對統計學的了解越來越深後,
漸漸發現「命理」和「統計」的距離有登山一樣,
在遠處看覺得近在眼前的山頭,
等到越接近的時候才驚覺到,
距離比想像中的還要遙遠許多。
前些日子,台灣一位家喻戶曉的占星學家與目前在Youtuber 界科學的代表人物之一錄了一段訪談影片。該節目專門製作以大眾科學知識為主軸的節目,因此在訪談中很自然地詢問命理是否是科學?號稱「國師」的占星學家是這樣回答的:
「很多人說星座(或泛指所有的命理學)不科學的原因,是他們覺得無法驗證,可是相對的,(星座命理學)是可以驗證的⋯⋯歡迎各位今年過完後可以拿去年的書翻一翻,驗證去年是不是長這樣⋯⋯這其實是一門科學!(註1)」
這番說法是大部分命理學家的論調,而且也是追隨者之所以對命理學堅信不移的原因。就像早上在星座版看到「天蠍座的妳,在感情上今天可能會遇到挫折」,然後晚上就不小心發現男朋友手機裡有奇怪的曖昧簡訊,有什麼證據比這樣子的巧合還要更撼動人心呢?這樣的個人體驗就好比各個宗教一樣,記得有位虔誠的基督徒朋友曾經說過:「不管你邏輯再嚴謹,證據再充足,來證明天天和我對話的神是不存在的,我也是不信的!」
然而上帝歸上帝,凱薩歸凱薩;同樣的,科學歸科學,命理歸命理。命理師所謂「拿去年的書翻一翻,驗證去年是不是長這樣,」來當過是否為科學的準則,有念過研究所,曾經被指導教授荼毒(正式的學名是「訓練」)過兩三年的人,都很清楚這個準則距離科學還蠻遙遠的。基本上科學至少要具備「測量」的嚴謹度、「事前離手」的判定標準、「機制定理」的合理與普世性。命理學具備的個人經驗就像直銷一樣,雖然撼動人心,但一來以主觀感受為主、二來為事後驗證、三來沒有足夠的科學原理可以解釋其機制,並不具備上述科學應有的三項性質。
曾經科學家提到占星學就大發脾氣:「如果命理學真的是科學的話,那可以拿好幾個諾貝爾獎了!」為什麼呢?且不論星辰宇宙的電磁場能夠影響命運的詳細機制是什麼,除了太陽月亮和五曜星,離我們最近的恆星半人馬座,距離都超過4光年。其他有名的諸如十二星座,每顆星距離地球都是數百光年起跳的。光年,那可是光走一年的距離( 公里)呢!若是如此遙遠的星斗造成的電磁場竟然能夠影響到幾個小時前後出生的人的命運,就已經違背了愛因斯坦提出的相對論;更不用說這些因素對命運(包括性格、事業、婚姻等)所造成影響,應該如何用目前已知的物理學、生物學、以及社會學來解釋。所以命理師試圖用「星辰排列位置造成的電磁場分布的不同」來解釋出生時間能夠影響命運,在沒有充足的證據之前,是完全顛覆現在科學定理的!這也是為何科學家幾乎一致痛斥「命理學是科學」這類的論調。這反應就好比當年達爾文提出演化論,或是哥白尼提出日心說,完全動搖聖經千年以來堅信不移的鐵律一樣,教會急得跳腳,欲除之而後快。
談到命理與科學的關係普羅大眾(或命理師)與科學家似乎沒有什麼共識。但是如果說命理學是「統計學(Statistics)」這個說法,似乎是支持者與反對者雙方的最大公約數。畢竟統計給人的感覺是一個經驗法則,命理學或占星學,嚴謹程度與客觀性姑且不論,基本上都是數百甚至數千年來觀察經驗的累積。再說統計學是否為科學的一環這點也還沒有成為定論,不過很多人會把諸多「量化」的社會學科,諸如計量經濟學,政治學,社會學…等等,都歸類為「社會科學」。不過此科學非彼科學。一般來講,傳統的科學諸如物理、化學、生物學等等,為了強調他們特別嚴謹,常會說自己是「硬科學」,並將這些社會科學被歸類為「軟科學」。而這些「軟科學」之流有一個很重要的特色,就是他們在研究上不論是測量還是理論皆是充滿誤差,統計學就是他們完美的數學工具,因為統計學的主要目的就是量化誤差,去蕪存菁,從許多不完美中的數據找到有用的訊息與自然律。
筆者在甫接觸命理學時會毫無疑問的覺得他是個統計學;然而當對統計學的了解越來越深,漸漸發現,當初覺得「命理」和「統計」的距離,有如在登山客一樣,在遠處看覺得小不拉機的山脈,等到越接近的時候才驚覺到,這兩者的距離比想像中的還要遙遠許多。如果經驗累積是統計學,那麼各種煉金術和宗教,這些也都累積了許多個人經驗與見證,不也都成了統計學了嗎?所以簡單來說,命理學充其量只是「可以被統計學去驗證的假說」。站在統計學家的角度,命理究竟需要多遠才能真正地接近統計學呢?根據我的看法,不多不少,還有四哩路要走。
第一哩路:定義問題,下好就要離手
有個故事曾經報導:
「志明接到了自稱命理大師的一封信,除了介紹自己的神通以及開運服務,並附上不久後某場籃球淘汰賽中輸贏隊伍的預測。志明一開始沒有理會那封信,結果竟然猜中了!
不久又獲得同樣命理大師的信,持續介紹以外還預測了第二場比賽的贏家,結果也是被猜中了…直到連續猜中了十次,志明終於相信遇到了能夠指點迷津的貴人,於是奉獻了大筆的金錢,接下來的是你知我知,該命理大師捲款而逃,不知去向…」
很多統計或機率的書都有記載過相似的故事。這個原理非常簡單,假設該騙徒找上1024個人,第一次比賽寄信給其中一半的人(512人)預測A隊會贏,另一半預測B隊會贏,這樣子至少有一半的人會收到正確的訊息;接下來第二場比賽,寄信給第一次預測正確的人,也是一樣,將兩隊贏的消息各寄給一半(256人),這樣就必定會有其中一半的人收到連續兩次預測正確的訊息…以此類推,每1024個人,就會有一位收到連續猜中十次的預測。
這場景是不是和一般聽到「命理學好準」的情境有87%相似?所以命理學所謂的「驗證」,絕不能夠以「今年過完後可以拿去年的書翻一翻,驗證去年是不是發生這樣的事情」來進入統計學的大門,而是要將這個動作反過來,在年初的時候就先定義命理預測的問題,年終的時候再檢視事實發生的事情是否有符合年初的預測。簡單來說,就是和賭博一樣「下好離手」的概念。補充一個題外話,統計機率學,原本就是從博奕學家(俗稱「賭徒」)的拿手絕活!
第二哩路:實驗設計(Study design)、排除巴南效應(Burnum Effect)
巴南效應是在主觀心理測量常見的系統誤差,內容是「一段模稜兩可的性格敘述,所有人會都先注意到與自己相關的部分,而忽略掉與自己無關的部分,而認為該敘述有一定程度符合自己的狀況。」以下是個星座巴南效應很經典的例子:
PTT是台灣最大的網路平台之一,自然也不乏命理學的交流平台,其中最有名的是「十二星座版」,每個星座的人都在此處分享自己對星座的看法(或取暖)。
大概在十年前,在雙魚板曾有一段流傳於社交網路的星座描述:
「對魔羯開玩笑的話,要小心,因為有些玩笑開不得,要很小心不能踩到他的地雷……。」
當時,眾多網友都留言說:「超準的,根本就是我自己啊!」「講到心坎裡了!」誰知道,這個貼文的人居心不良,之後每隔一個月,他就用同樣的描述解釋換成不同的星座,這些不同星座版上的網友還是紛紛覺得,這段描述就是自己的人生寫照。花了一年的時間,這位用心良苦的網友終於收集了十二個星座的文章,集合成一篇打臉文,於是反命理的網友們士氣大振,廣為轉發。
平心而論,這個研究其實不能夠當作命理不準確的證據。畢竟只是個沒有消除掉巴南效應的研究而已。巴南效應可以使用統計分析前的「實驗設計」來消除掉。最簡單的方法就是多測量一個對照組的準度。打個比方說,你在幫雙魚座的人算命(一般都是先看人格個性是否有符合)時,不能只拿雙魚座對性格的敘述來問對方準不準,應該同時要隨意挑一個星座(牡羊座好了)來當對照組,問問其敘述有沒有符合對方的個性?和雙魚座的敘述相比哪個較符合?
相信有人一定對這以上的研究有意見:「如果已經知道自己是什麼星座了,一定會較傾向選擇自己星座的敘述呀!」這個質疑也不難解決,使用「盲測」即可。在1983年在世界最知名的期刊「自然(Nature)」有一個研究,將約九十人的命盤交給命理師算命,接著每人都會收到一真兩假的三份命理敘述(在所有受試者都沒有算過命的前提下,本人無法知道哪個敘述才是真正屬於自己的算命結果),並要求給三份敘述「最準」、「次準」、「最不準」三種評論。結果呢?真的命盤被評論是「最準」、「次準」、「最不準」的比率大致是三分之一。這個結果和丟銅板完全沒有差別!
這篇研究即便使用所謂的雙盲來否證了命理學的準確性,不過用嚴格的角度來看,該研究還是有許多可議之處:畢竟排序「最準」、「次準」、「最不準」是一種最初階、蓋括式的評論,這會導致統計的檢定效力不足;該研究的命理學方法也只是其中一種流派的論命法,參與的命理師的水準更是不可考。但該篇論文的確為命理學統計研究開啟了一個排除巴南效應的實驗設計典範。
第三哩路:統計分析,繼以機器學習
講到命理和統計的距離,當然一定要有統計分析的步驟才行。不過常跑統計的人都知道一個名言「garbage in, garbage out」。翻譯成白話就是:進來的(資料)如果是垃圾的話,(用統計方法)算出的結果也是垃圾。要有好品質的資料,就必須在做好「定義問題」以及「實驗設計」這前兩哩路,如此一來,使用統計方法得到的結果,才能夠令人信服。每種資料格式和問題要用的統計方法都有固定的流程;計算命理學的準度,無外乎是建立統計迴歸模型去算解釋力,再來用假說檢定來驗證理論是否正確,如此而已。
最近統計界興起了一股「機器學習」的熱潮,像是近年來最有名的圍棋軟體「AlphaGo Zero」,僅僅只花了40天也超越了所有人類的極限。若能將機器學習應用於命理學,很有可能和圍棋一樣,許多命理原則都可以被改寫。舉例來說,中國命理學建構在「天干地支」系統之下,六十年為一個循環,就很有可能被新的循環週期改變!更不用說各門派流傳千年的口訣了。其實連紫微(北極星)過了一萬年就會易主了(換成織女座),整個占星學法則系統又有怎麼可能期望它歷千古而不朽呢?
最後一哩路:因果推論—從預測到預防
2012年醫學界最頂級的期刊「新英格蘭醫學雜誌(New England Journal of Medicine,影響指數=71分)」報導了一則有趣的研究:該研究把世界上大部分的國家每年人民的巧克力攝取量以及諾貝爾獎的得獎比例做了統計分析,結果相當驚人:單單是巧克力的攝取就可以解釋八成的諾貝爾獎桂冠!聽到這個研究,會有考生(或是考生的爸媽)馬上瘋狂的購買巧克力嗎?或是所有的研究機構,把所有的研究經費都拿去買巧克力,上至所長下至研究助理,大家每天狂嗑一輪?這個道理就好比當公雞叫的時候太陽就會升起,但若是想要晚點起床殺掉了公雞,太陽還是會依然升起呀!
這兩件事告訴我們:即便是前三哩路都漂亮的達成,命理學達到統計上顯著意義,但「統計上的相關」、「預測能力」並不代表「因果關係」。就像巧克力和諾貝爾獎,以及公雞叫和太陽升起一樣。想想看自己算命的時候,如果被警告「您明年擎羊入大運的疾厄宮,明年要小心有血光之災」,難道就要馬上掏出鈔票跟師父買個開運水晶來解厄?如果被告知自己的姓名帶賽導致姻緣不順遂,就有馬上請大師改個姓名的必要?抑或者被告知小孩預產期的時辰是個一生窮困的命格,就得拜託醫師擇個良辰吉日來剖婦產?這些問題都顯現出命理學研究,不能僅在「統計上的顯著相關」就滿足,一定還要進一步推論是否這些命理的因素與命運為真正的因果關係,還是只是像公雞叫和日出一樣的假相關。
這也讓我回想起以前在醫院工作時,在婦產科遇到一位準媽媽,千般拒絕醫師安排的剖腹產時間,因為根據命理師給他的建議「這些日子不是剋到父母,就是剋到他未來的配偶或小孩」。所以只有8/7那天是可以的。「你那位算命師道行不夠啦,那天也是大凶他竟然沒算出來?!」醫師瞄了一眼電腦螢幕,淡淡地說道。病人聽了又驚又喜,難道醫師您也懂算命?「那有什麼稀奇?」醫師笑著說:「8/7是周日,醫院開刀房沒開,麻醉師放假,醫護人員留守不到一半,那天剋整間醫院的患者啊!」
以上講的這四哩路:「定義科學問題」、「實驗設計」、「統計分析」、以及「因果推論」,就是資料科學以及統計學研究的四部曲。所有的社會科學,十之八九就是依照這個流程來進行研究與驗證假說的。如果完成以上四個步驟後,都還充分的顯示命理學的正確率,相信超過九成的統計學家都會承認命理學在統計學的證據下有一定的可信度了,這樣的結果也會引起更多科學家的好奇心,一同來進行更嚴謹的硬科學研究,慢慢找出是否有科學根據來解釋這神秘的機制。這樣統計上顯著,但機制尚未明瞭的例子在醫學上不勝枚舉,像是現在數不清的助眠藥與止咳藥,機制雖然還不清楚,不過無數的病人的反應告訴你:有效就是有效,找不到機制是你科學本身還太落伍了!
在這四哩路完成之前,身為一為科學信仰者,在面臨人生抉擇的交叉路口時,是否也應該求助於命理諮詢呢?又回到一開始說的,科學歸科學,命理歸命理,苓膏龜苓膏。命理學其實除了預測的功能以外,其實還有民俗、文化、與人生哲學等許多不同的面向;端看您把命理當成像天氣預報一樣的科學預測工具、專業建議、心理諮商、還是單純的哲學信仰?以占卜為例,即便證明卜卦無法準確預測未來發生的事情,但易經中「亢龍有悔、盈不可久」、「地山謙、山地剝」這些名句所傳達出曖曖內含光的處事態度,是和整個民族的文化和價值信仰是密不可分的,又豈能用統計的準確度來否證?相信屈原若是生在今日,他「卜居」的名篇可能就會改寫成這樣來評論命理和統計的距離:
「夫尺有所短,寸有所長;物有所不足,數有所不逮…『統計』誠不能知此事!」