一個故事

請容許我說了的話不算數。這個故事實在太精彩了,幾乎放在《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)一書的最後,未看到就自絕後路。但不抄下來,日後忘記了,有點對不起自己。可能你已看過,不要緊。我自行作了分段。

曾有這麼一個在沙漠裡的監獄,裡面有個已聽天由命的老犯人和一個新來的年輕犯人。年輕犯人不停說要逃走,而且幾個月之後真的越獄了。

他在外面一個禮拜,然後被獄卒抓了回來。他差不多只剩了半條命,既餓又渴,快瘋了。他向老犯人形容這一切有多可怕﹕綿延無盡的沙,看不到綠洲,看不到任何生命跡象。

老犯人聽了一會兒,然後說﹕「是啊,我知道,二十年以前,我自己也試過逃走。」

年輕犯人說﹕「真的?這幾個月我一直在計劃逃亡時,你為什麼不告訴我?為什麼不讓我知道根本不可能?」

老犯人聳肩,然後說﹕「有人發表不成功結果的嗎?」(頁362)

書作者說這個故事,當然有「教訓」要說。

如果有好的理由相信某種效應的存在,而設計良好的研究卻無法找出這個效應,這是應該要公開的新聞。失敗的結果不公開,會讓別人一直重複去做。(同上)

還記得「失敗乃成功之母」這句話嗎?不過,說起來,失敗的研究有媒體會替你「公開」嗎?

其實這個故事可供想像的東西其實遠不止於此,例如還有人性的問題。作者的「教訓」也未說完的。且聽﹕

更糟的是(對研究者來說,不是對犯人來說)重複的嘗試遲早可能會光因機遇而成功。結果這個機遇造成的成功就發表了。這樣就造成發表偏差(publication bias)﹕比如說,醫學方面發表的研究使人想到,報導出來的新治療法的成功率要比實際成功率高。(頁363)

嘩,好得人驚呀!以後真係唔再講呢本書喇。

信心

《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)一書,已近尾聲了。最後一章是〈推論﹕有信心的結論〉,我讀著讀著,完全沒有信心明白。

數字更多,在我看來更繁複,公式,其實不算太難,但我已無心順著一一記住。於是,只能相信文字的敘述了。有兩節一開始即有溫馨提示﹕

(.注﹕這節內容的專門性比本書其他部分要高。)(頁333、350)

哦,原來我一直看的都不夠專門。也罷了,能對「統計」有個概念也算不錯了。

這章經常出現一個形狀很相近的圖,我總會想起《小王子》。《小王子》一開始也有近似的圖,可包著不是數字,而是一隻象呢。

只剩下十頁左右。明天吧。

這篇該是最後一篇了。

不是這個網誌的最後一篇。不用開心太早,只是關於《統計,讓數字說話!》的最後一篇而已。完結前,還是抄一小段文字﹕

這個數學事實是在說﹕小的誤差界限需要很大的樣本,因此要花很多錢。真是抱歉。(頁339)

何必偏偏選中我

說起來真要臉紅。一直以來都以為或然率是高深的數學。

這樣以為,只因沒學過,沒接觸,也就無知。

或然率,有作「機率」或「概率」,百度百科說,該寫作「幾率」。因為「有人誤以為『幾率』的含義是指『機會』(英語為opportunity)的多少,進而誤寫成『機率』,數學界就另外取了一个譯名『概率』。如今數學上早已廢止『幾率』。」

不過,我看的《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)一書,還是譯作「機率」的。定義為﹕「一個隨機現象任一結果的機率是﹕在重複很多很多次的情況下,該結果應會出現的比率。」百度這樣說﹕

機率(probability)﹕表示某件事發生的可能性大小的一個量。很自然地把必然發生的事件的概率定為1,把不可能發生的事件的概率定為0,而一般隨機事件的概率是介於0與1之間的一個數。

原來是那麼簡單的事,枉我多年怕了它。現在算是又解開了一個心結。看一本書,有意想不到的得益,又多賺了。

講機率,當然不能不講賭。我當然知道進得賭場,是預了要輸錢的,「理論」何在,現在終於真正知道了。會因而影響我進賭場下注的可能性嗎?大概不會。更不會令我不再買「六合彩」。

書中有這樣的話﹕

賭博設施的經營者根本就不是在賭博。很大數量的客人平均贏的錢很接近期望值。賭場經營者事先就算好了期望值,並且知道長期下來收入會是多少。並不需要給骰子灌鉛或者做牌來保證利潤。賭場只要花精神在提供不貴的娛樂和便宜的交通工具,讓顧客川流不息地進場就行了。(頁314)

我將「秘密」如此公告天下,不會引來殺身之禍的,放心。

進賭場,賭的方式很多,愈是本小利大,贏的機率愈小。買彩券或六合彩嘛,真要贏,計機率,更低。問題是,錢花得不多的話,一般人都抱著買一個「希望」而已。更可況,真要計機率,「正如賓州哈立斯堡的布魯托在一次報紙訪問中所說﹕『我贏到一百萬的機會,要比我賺到一百萬的機會還大。』」(頁316)

大概人同此心的也不少吧。更何況,誰會想到「九一一」事件會出現?而你當時在那兩座大廈或兩架飛機之中的機率又會有多大呢?死前的一刻,大概有人會想﹕「何必偏偏選中我?」

不是總有人中六合彩頭獎嗎?我們可能會反過來說﹕為何中的不是我?

機率,其實是不計算「運氣」這回事的。又或者,正如書中所引大經濟學家凱因斯(John Maynard Keynes)對於長期秩序所做的注解才夠「抵死」,更值得思考﹕「長期來說,我們都會死掉。」作者跟著說﹕

如果你了解機率,在你思考凱因斯的注解時,也許會有些安慰。(頁319)

這也要兩面看。不到死的一刻,誰也不敢說在某種環境下不會遇上某種機率很小的意外;也不能說,不斷買六合彩,沒有中上一次頭獎的可能性。何況,還有一樣東西叫「運氣」,包括好運和衰運,是千算萬算都算不到的。

估總統

不知現在還有沒有人玩一種不用道具的集體遊戲﹕估領袖

原來半個世紀以前,美國有一位作家玩過「預測總統選舉結果」的「遊戲」。

方法很簡單,就是猜姓氏比較長(字母較多)的候選人。

據《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)說,在1876年到1960年間的22次選舉中,這方法只失敗過1次。

作者跟著說,「我希望那位作者在提出這麼聰明的主張之後,沒有在後來的選舉中把家當拿來下注。」為什麼?作者再舉了1964到1992年的8次選舉為「姓氏長的會贏」這個方法提供了7 次檢定的機會來說明。

結果如何,也不用我多說了。有興趣的,不妨檢一下再之後的結果又如何。這個統計,無花無假,簡單方便快捷,玩至下一屆也無不可。

作者舉這個例子,其實要說明利用統計「沒法子很清楚看到未來,即使有過去的統計紀錄幫忙也不成。」(頁279)

不成又如何,

雖然很少人成功,仍然阻止不了一些魯莽的人繼續嘗試預測未來。經濟學家即使用了精密的統計方法仍常常失敗,被經濟的複雜性好及不規則的外來衡擊給打敗了。一些不高明的預測常會發現了巧合,卻把巧合當做解釋。(頁279)

有多少人就是靠「預測」來吃飯甚至成名致富的。有巧合,要找解釋自然更易有信眾。

有理論有理據的所謂「科學」方法做預測不行,就「另闢蹊徑」了。這個,大概就是「食腦」之謂吧。

統計數字的威力

《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)有這段話﹕

現代化的國家依賴統計而運作。經濟方面的資料尤其可以引導政府政策,以及為私人企業及個人決策提供資訊。我們已經看到﹕光是一個數字,每月CPI,就可以真接響七千萬美國人的收入、金融市場的方向及經濟政策的決定。另一個數字,每月失業率,可以決定一個尋求連任的總統之命運。(頁267)

CPI 即消費物價指數。書中還提到,「物價指數、失業率及其他許多不常見的列資料,是由政府統計機構整合出來的。」香港大概也是這樣吧。上引一段,有多少地方跟香港相似呢?

大概現在香港的最高領導人即特首,就不可能因為失業率而引退了。全球以華人佔多數的地方,大概只有台灣會有這種可能吧。香港第一任特首,可以說因為一個數字而離任,但香港人還是沒能靠數字帶出領導人,連立法會議員也不是全部靠數字來選出來。當然,這裡所說的數字,要有背後的意義,需要詮釋。

民主能竟全功,就是數字發揮最大威力的時候了。現在,香港很多與所謂「民主」相關的數字,仍像美國的統計機構(共有72個聯邦統計單位),並不統一,未致一盤散沙,但各自為政,甚或「各為其票」,未能產生令人信服的「數字」,「威力」自然減弱了。

因果問題

《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)已看了三分之二,到第二部分「整合數據」,已漸覺有點吃力,因為有較多與數字相關的論述。

來到第五章,講「了解關聯的意義」,也不是完全看不入腦。例如談「因果關係」,倒又頗「人文」的。不如先將一個圖放在下面,方便我繼續胡言。

圖算是很簡單吧。真接的的因果關係當然最易明解,但世事哪會如此理想,沒有其他因素的影響呢;這就是變數了。

簡單如父子間的身高關係,是最直接的因果關係(如遺傳),其實也受其他因素如營養的影響,日常幾乎自行觀察也可得到結果,不用多作解釋。這本書當然沒有令我失望,也拿吸菸與肺癌的統計結果來作例子。

不詳述了。只抄結論﹕

醫界當局毫不猶豫宣稱吸菸導致肺癌。……因果證據是壓倒性的——但是比不上用隨機化比較實驗得到的證據強。(頁239)

有留意的話,司徒華知道肺癌之後,曾有記者問他後不後悔以前吸菸。他安然答道,其實吸的時候已知道有這種後果。(大意)也即後悔也無補於事,只有積極面對和接受治療。

這又令我想起梁文道,他雖然沒有明言肺癌與吸菸無關,卻將反吸菸與納粹黨聯想到一起,更列舉當年那些策劃反吸菸運動的人,「沒一個好死」。(〈反對吸煙的納粹黨〉,《常識》,廣西師範大學出版社,2009年1月第1版,頁288-90)這種說法,比吸菸致癌的統計更嚇人。

書中再說了相關的另一個例子。就是處方藥與胎兒缺陷的關係。這是一個要考慮多種變數的關係,卻又不能直接以人來做實驗。吸菸者較普遍,做觀測研究較易。但孕婦吃處方藥的例子不多,真要有令人完全信服的統計,接近不可能。試看本書是怎樣寫這個結論﹕

以班得廷這個例子來說,超過20個研究大部分發現這個藥是安全的。大部分控訴班得廷造成胎兒缺陷的案子都敗訴。但訴訟費仍然迫使製造商將藥自市面撤回。使用班得廷可能風險很小或者沒有風險,但是我們能夠確定的只是「沒有足夠證據」。(頁238)

好一個「沒有足夠證據」。班得廷是用來減輕懷孕期嘔吐症狀的藥。有風險沒風險,有時未必完全基於「事實」。原來我們日常有很多可能要承受莫名也莫明的痛苦或風險而不知原因的。統計學在其間原來扮演了重要的角色。

莖葉圖

上列一表一圖分別採自《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,台北﹕天下遠見,2009年6月第2版第1刷)頁176和178,都是真實資料,說的都是同一件事。

將歷任美國總統的死亡年齡當作趣味知識來看,也是不錯的。不過,我大驚小怪的不是有兩個總統有90高齡,或有兩人卻沒能超越50之年。我只因書讀得少,學識淺陋,一直不知道有一種統計圖叫莖葉圖(stemplot,也稱stem-and-leaf plot)。

百度一下,最初結果竟是﹕沒有收錄這個條目。過了一個晚上,很奇怪,完全改觀,滿目都是啊。一夜白頭。不,一夜頭而已。這個 就介紹得很精簡。

昨夜是有點不忿的,用stemplot 來搜尋,英語維基百科 有。然後發覺,香港和大陸用的大多是「背對背幹葉圖」,有些示例都來自香港一些中學,似乎是香港教科書的既定名詞。更奇怪的是,今天用「背對背幹葉圖」百度一下,百度百科竟又沒有了這個條目,只餘幾個與此條目相關的連結,背對背的搞笑圖片倒有不少。難道這個名詞一時間也成了「關鏈詞」,要河蟹?

不多想這個了。倒是想起一件少年往事。

話說初中時,很愛畫畫,曾給美術老師選去參加全港公開美術比賽。都知道畫的都是「自由題」。我就預先選定題材,畫了一幅。老師似乎也認為可以。就此敲定了。

臨場我的手腳慢,畫只完成了一半。畫題其實很簡單,就是數字。用不同顏色不同形態的數字,將一張畫紙填滿。我的感想似乎是,這個世界充斥著數字。

假如當年知道有這樣一種統計圖,有莖有葉,根本就是一棵樹。畫起來可能既簡單又有意思得多,興許能完成,得到一個一生中唯一的什麼獎也說不定。

足有三年迷於畫畫,經常坐在碌架床前畫至不知天昏地暗。不捨不捨還得捨,終於放棄了。

都說沒有「如果」的。人生中「遺憾」的事多的是,留下一件不傷身不傷心的憾事,偶然回想,反覺有點甜絲絲。不錯啊。

數字.圖片.文字

《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)第三章講「量度」,提醒了我幾個與數字相關而忽略了的概念,很好。章末最後一句說﹕

如果你養成仔細檢查數字的習慣,你的朋友們很快就會覺得你很有頭腦,而且他們還可能是對的呢。(頁148)

那就怪不得我的朋友都不覺得我很有頭腦了。算了吧。

這章有一個議題﹕數字可以怎樣「詐」我們。它再次提醒我們永遠要問﹕資料怎樣產生的?所度量的確實是什麼?因為有些數字「是事實,但不是全部的事實」;要留心「用意良善」的數字;更要有懷疑的態度,因為有「不可信的數字」、數字彼此之間可能不一致,甚至有些數字可能好得不像真的。(頁140-5)這個也不用我多引述了吧。

不如講講可信數字可以會說些什麼吧。「我們已經習慣於用有點虔敬的態度來對待數字。因為它們看起來那麼可靠,又那麼確實。」(頁136)這樣說,算不算有點賣花讚化香呢?

我們都聽說過,一張好的圖片勝似甚或勝過萬語千言。

統計數字可以說明很多東西。戰爭圖片可以說明很多東西。那麼,文字呢?

一個人倒臥在血泊中,可以說明些什麼呢。如果沒有文字。

再說數字0。「長度0公分就是『沒有長度』,時間0秒是『沒有時間』。但是溫度攝氏0度只是水的冰點,不是『沒有溫度』。」(頁139)

沒有了圖片顯示出來,我們還可以說「有一個人倒臥在血泊中,是敵軍亂槍掃射而死去的」。沒有數字,我們還可以說現在已冷至「冰點」。

不過,有圖片,有數字,再加上文字,就更清楚明白了。

要「詐」,圖片可以假,「古」已有之,於今為烈。製造數字,玩弄數字,可以變出不同的「事實」。當然,文字也可以作假。

沒有哪一樣最真最假最好最差。各有不同的位置不同的作用。公平點好。

數字真要來了

享受了兩章不用與數字多大打交道的甜蜜溫馨時光,終於很怕面對的都要來到眼前了。

拖拖延延,還是要來到《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)的第三章「量度」。Measurement 可以沒有數字嗎。

統計是討論數字的。光是計劃如何利用樣本及實驗來產生數據,並不會自動就產生數字。一旦……(頁122)

我知道我知道。我的「噩夢」要開始了。我當然不會就此放棄啦。睇戲睇全套,看書看全本嘛。才不怕呢,最壞也不過看得昏頭昏腦,又不用考試的。更何況,跟著下來就出現這樣的文字﹕

讓我們繞過大學入學試採用SAT分數的爭論。我們就只量度所有申請者的身高,然後錄取個子最高的學生。餿主意,你一定會這麼說。為什麼呢?因為身高和適不適合讀大學一點關係也沒有。用比較正式一點的語言來說,身高並不是一個學生學業背景的「有效」(valid)量度。(頁125)

「餿主意」,咪即係「屎橋」?呵呵呵。無論怎樣,數字要說話,但數字又不能不靠文字「加把口」說清楚「心裡的話」。更不用怕了。數字正式「隆重」登場,還是要有文字「拍住上」的;何況這本書有的是沒有那麼正式的語言,偶然搞一點笑,輕鬆一下。提神醒腦啊。

來,再來,努力。前進,前進進。

雙盲.退出

《統計,讓數字說話!》(David S. Moore 著,鄭惟厚譯,天下遠見,2009年6月第2版第1刷)真的很好看啊。

看見數字,我就心煩頭昏,但在看不算多的數字之前,看到這張插圖,就先精神為之一振,再看下去就增加了樂趣。這是一個講隱性偏差的例子﹕雙盲(double-blind)實驗。主要提到醫學實驗中的受試對象不會被告知他們服用的是標準用藥、新藥或安慰劑。因為無論受試者或醫師和其他醫事人員知道某一受試對象服用「只是安慰劑」,「心理因素」會影響實驗結果,從而也令統計不夠準確。

後面就提到一個名為「紐澤西福利實驗」(New Jersey Income-Maintenance Experiment)的公共政策實驗(頁108-9)。這個實驗從1968年開始,經過9 年才得到結果。成功?失敗?不如看看下「圖」吧。(其實是我懶惰,也怕了那些數字,只拍照「交差」當圖算了。呵呵呵。)不知香港的公共政策統計,又是如何做的呢。