【摘錄1】第七章 追尋確定性──精算學始祖普萊斯
一七二五年,棣美弗出版了一本書,名叫《人壽保險》(Annuities upon Lives),書中分析了哈雷的〈布雷斯洛平均壽命表〉。雖然這本書重心放在討論數學,但也就伯努利試圖解決,而棣美弗後來也曾深入研究的難題,提出幾個重要的疑點。
研究統計學史的史蒂格勒(Stephen Stigler),在說明棣美弗的養老金研究與機率的關係時,舉了個有趣的例子。根據哈雷的表,布雷斯洛有三百四十六個五十歲的男人,其中只有一百四十二人會活到七十歲,亦即四一%的比率。這是個非常小的樣本。我們若把這種結論推廣到所有五十歲男人的預期壽命,可做到什麼程度?棣美弗當然不能據此認定,所有五十歲男人活到七十歲的機會都小於一半,但他可以回答這個問題:「如果機率的實際值是二分之一,出現像142/346這麼小或更小的比例,機率會是多少?」
◎損失的可能性
棣美弗第一部直接探討機率的著作,名叫《抽籤計算法》(De Mensura Sortis)。這本書首次發表於一七一一年皇家學會的出版品《哲學會報》(Philosophical Transactions)中。一七一八年,棣美弗出版英文版,將內容大量擴充,更名為《機會論》(The Doctrine of Chances),他把這本書題獻給好友牛頓。此書一出就大獲成功,在一七三八年和一七五六年分別再版。牛頓很欣賞這本書,曾告訴他的學生說:「去請教棣美弗先生吧;這方面他懂得比我多。」《抽籤計算法》可能是最早明確把風險界定為「損失的可能性」的著作:「損失任何金額的風險均與期待相反;其計算方法是將投資的金額,乘以蒙受損失的機率之積。」
一七三○年,棣美弗終於用伯努利的預測方法,求知某一樣本相對於它所從中抽離的現實世界,究竟具有多少代表性。他在一七三三年出版完整的解答,並將之增補在《機會論》的第二版與第三版裡。他一開始就承認傑可伯和尼古拉斯「數學技巧極高明⋯⋯但還需要進一步的增補」。最大的問題在於,伯努利叔姪的處理方式「顯得很累贅,也非常困難,很少人願意接著做」。
做二五、五五○次實驗,是很明顯的障礙。即使如紐曼建議的,傑可伯願意接受「不確定為必然」的結果,容許抽石子推論的結果,只有一半機會落在實際值三比二的二%誤差範圍內,也仍然需要抽籤八千四百次。照今天的標準來看,傑可伯選擇的1000/1001機率,它本身就很奇怪,大多數現代統計學家都認為,二十分之一的成功機率就足以證明一種結果有意義(即「幾乎可確定為必然」的現代說法)。
棣美弗解決這些難題的貢獻,可列入數學史上最重要的成就。他應用微積分和「巴斯卡三角形」潛在的結構,即通稱的「二項展開式」(binomial theorem)證明任一組隨機抽樣,例如傑可伯的黑白石子罐實驗,能自動在一定誤差的範圍內,分布在平均值周圍。舉個例子,假設你從傑可伯的罐子裡抽出一百顆小石頭,每次抽完都記錄黑白的比例,並把石頭都放回去。然後假設你又每次抽一百顆石頭,一連抽了若干次。棣美弗就都能事先告訴你,抽出的各次比例之中,大約有多少次會與前一梯次抽籤算出的平均值非常接近,還有各次得出的比例相對於總平均值的線形分布情形。
如今我們把棣美弗發現的分布曲線稱為「常態曲線」,也因為它形狀像個鐘而稱作「鐘形曲線」(bell curve)。將各次分布點畫成曲線就可以看出,大部分的觀察值集中於中央,接近總平均值。然後曲線對稱的向兩旁下傾,總平均值兩側有相等的觀察次數,先是急遽下降,然後依平緩的坡度下斜而結束。換言之,跟平均值差距大的觀察次數,遠比接近平均值的觀察次數少。
棣美弗曲線的形狀,使他能夠計算它在平均值周圍的統計學離差(dispersion)。算出的數值現在稱為「標準差」(standard deviation),是判斷任一組觀察值可否視為足以代表其所屬範域(universe)之樣本的決定性因素。在常態分配下,約有六八%的觀察值會落在全部觀察之平均值的一個標準差之內,九五%會落在平均值的兩個標準差之內。
標準差可以告訴我們,目前處理的個案是否有頭在烤箱,而腳在冰箱的傾向──這個可憐人的平均體溫不能告訴我們他真正的感覺。大部分的數據都跟他身體中段的平均感覺相去甚遠。標準差可以告訴我們,傑可伯抽取鵝卵石二五、五五○次,可得到對於罐內黑石與白石之比、極為接近正確數字的估計。因為相對而言,只有極少數的觀察結果會大幅偏離平均值。
◎神的計畫
隨著隨機而不相關的觀察次數增加、產生的結果愈顯得井然有序,此一現象令棣美弗印象深刻;他把這種秩序稱作「神的計畫」。其中有種承諾,只要在適當狀況下,我們可以靠計算超越不確定性,制服風險。棣美弗總結他的研究成果說:「雖然機率會產生例外,但遵守規律的可能性卻大於一切,所以只要時間夠久,這些例外發生的次數跟符合原始設計、自然而然產生的秩序重現的次數相比,根本不成比例。」
棣美弗對數學的貢獻就是提出估算機率的工具。他發現,經過一定次數的觀察後,觀察值會落在實際值的特定誤差範圍之內。這個發現有很多實際的應用。比方說,所有製造商都擔心瑕疵品會通過裝配線流出廠外,送到顧客手中。在絕大多數情況下,百分之百的完美都無法實現──我們熟知的世界似乎與生俱來有排斥完美的惡習。
假設有位製針工廠的經理,試圖把瑕疵針的數量減至每十萬根中僅十根,亦即○.一%的比例。他為了了解進展,於是從裝配線上隨機選取十萬根樣本針,並發現有十二根沒有針頭──比他希望達成的平均十根瑕疵多出兩根。這個差別有多重要?如果工廠每製造十萬根針,平均有十根有瑕疵,那麼從十萬根樣本裡發現十二根瑕疵品的機率是多少?棣美弗提出的常態分配與標準差就能回答這個問題。
但一般人想解答的不是這個問題。通常他們無法確定工廠平均會生產多少件瑕疵品。再怎麼求好心切,到頭來瑕疵品的比例仍可能超過十萬分之十。十萬根針的樣本,對於全體產品中的平均瑕疵比例會不會超過○.一%,提供了什麼樣的訊息?如果樣本擴大為二十萬根,我們可以多知道些什麼?什麼樣的機率之下,平均瑕疵比例會落在○.○○九%與○.○一一%之間?或○.○○七%與○.○一三%之間?我隨手拿起一根針就是瑕疵品的機率又是多少?
在這種情形下,數據是已知數──十根針、十二根針、一根針──機率是未知數。以這種方式提出的問題,就是所謂「逆機率」(inverse probability):十萬根針之中有十二根瑕疵,如果實際的平均瑕疵率是○.○一%,這種事發生的機率是多少。
◎統計學家貝葉斯
處理這類問題最有效的方法,由一位名叫貝葉斯(Thomas Bayes)的牧師提出,他一七○一年出生於英國肯特郡(Kent)。貝葉斯是個不信奉英國國教的基督徒;他反對自亨利八世宣布脫離天主教以來,英國國教保留的天主教儀式。
貝葉斯雖然也是皇家學會的會士,但他的身世我們所知不多。一本相當枯燥、不涉及人性的統計學教科書,甚至形容他為「謎樣」人物。他在世時不曾出版任何數學著作,死後也只留下兩件作品,但問世時並未引起注意。
不過其中的一篇論文〈試解決機會論的一個難題〉(Essay Towards Solving a Problem in The Doctrine of Chances)卻極富創意,使貝葉斯躋身統計學家、經濟學家,以及其他社會學門的專家之林,名垂不朽。這篇論文奠定了現代統計推論方法的基礎,解決了最初由傑可伯.伯努利提出的大問題。
貝葉斯在一七六一年去世時,他在前一年寫的遺囑中,指定將這份論文和一百英鎊遺贈給「目前大概是在紐恩登林蔭路(Newington Green)做牧師的普萊斯(Richard Price)」。貝葉斯對普萊斯的所在語焉不詳,實在很奇怪,因為普萊斯來頭頗大,不僅是肯特郡的一名小鎮牧師而已。
普萊斯道德水準很高,熱烈相信全人類都應享自由,尤其是宗教信仰的自由。他深信不疑自由乃上天所賜,所以是一切道德行為不可或缺的要素;他聲稱,寧可自由而犯罪,也不要做別人的奴隸。他在一七八○年代寫了一本談美國革命的書,書名很長:《論美國革命之重要性以及使它裨益全世界的方法》(Observations on the Importance of the American Revolution and the Means of Making It a Benefit to the World),他在書中發表自己的信念,認為獨立革命是上帝注定。他還冒了個人風險去照顧轉運到英格蘭境內俘虜營裡的美國戰俘。他跟富蘭克林是好友,跟亞當.斯密也有點頭之緣。斯密撰寫《國富論》時,普萊斯與富蘭克林都看過部分草稿,並提出批評。
有一種自由令普萊斯不安──借錢的自由。他非常關切方興未艾的國債金額因對法戰爭與對北美殖民地作戰而不斷膨脹。他抱怨這筆債務是「為永恆籌款」,為它取了別號叫「國之大惡」。
普萊斯還不僅是牧師和捍衛人類自由的鬥士而已,他也是一位數學家,憑著研究機率的成就,贏得皇家學會的會士資格。一七六五年,一家名叫「公平協會」(Equitable Society)的保險公司派了三名員工去拜訪普萊斯,請他協助設計一個死亡率統計表,以便計算壽險的保費與年金。在研讀哈雷、棣美弗及其他人的著作後,普萊斯在《哲學會報》上發表了兩篇論文;據他的傳記作者康恩(Carl Cone)報導,普萊斯貫注全副精力撰寫第二篇論文而一夜白頭。
◎精算學始祖
普萊斯從研究倫敦保存的紀錄著手,但紀錄中的預期壽命比實際死亡統計低太多。接著他又去查紀錄保存較完善的北安普頓郡(Northampton)。他在一七七一年出版一本名叫《保險金償付論》(Observations on Reversionary Payments)的書,公開研究結果。這本書直到十九世紀都還是這方面的聖經。這部著作為他贏得精算學(actuarial science)──今天所有保險公司做為計算保費根據的複雜機率演算──始祖的頭銜。
但普萊斯的著作也有不少嚴重而昂貴的錯誤,一部分是因為他採用的資料中,遺漏了大量未登記的出生人口所致。更有甚者,他把較年輕者的死亡率高估,又把年齡較長者的死亡率低估;他對遷入和遷出北安普頓的人口數估計,更是錯誤百出。尤其要命的是,他似乎也低估了預期壽命,以致人壽保險的保費遠高於實際需要。「公平協會」靠著他的錯誤大發利市;英國政府也用同一套表格決定養老年金付款標準,結果虧損慘重。
兩年後,貝葉斯已去世,普萊斯把一份貝葉斯「極具創意」的論文送交皇家學會另一位會員坎吞(John Canton),所附的信函讓我們對貝葉斯撰寫這篇文章的動機有更多的了解。一七六四年,皇家學會終於把貝葉斯的論文刊登在《哲學會報》上,但即使此時,他的創新研究還是乏人注意,又被埋沒了二十年之久。
貝葉斯對他試圖解決的問題說明如下:「已知某一未知事件發生與未發生的次數:要得知只試一次時,該事件發生的機率處於什麼範圍之內。」在此提出的問題恰好是傑可伯六十年前界定的問題的逆轉。貝葉斯問的是,如果我們只知道某件事曾經發生多少次,還有其他多少次不曾發生。那麼,在對其他條件一無所知的狀態下,如何判定一件事會不會發生的機率。換言之,一根針可能有瑕疵,也可能完美無缺。如果我們在一百根樣本當中找到十根有瑕疵的針,那麼所有生產的針之中──不僅那一百根樣本──瑕疵率介於九%到十一%之間的可能性是多大?
◎機率絕非猜測
從普萊斯附寄給坎吞的信可知,短短一百年工夫,機率分析應用在實際決策上已有相當進展。普萊斯寫道:「凡是有判斷力的人都知道,在此討論的絕非機會學說中一個有趣的猜測而已,而是吾人為了要根據過去事實,推演未來發展,建立一個牢靠的基礎,必須先行解決的問題。」
他並指出,傑可伯與棣美弗都未能完全依照這種措辭說明問題所在,不過棣美弗曾經把他個人解題時所遭遇的困難,形容為「機率領域中最難的問題」。
貝葉斯證明他觀點的方式甚是古怪,考慮到他身為反對國教的牧師身分,更是難以想像:他選中了撞球台為例。一個球滾過台面,可自由停頓於任何位置。接著以同樣方式滾動第二個球,記錄它停在第一個球右測的次數。這個數字就是「未知事件發生的次數」。失敗──上述結果未發生──即球滾到第一球左側。第一球落點的機率──只試一次──可從第二球的「成功」與「失敗」中推論。
貝葉斯系統的主要應用是在利用新資訊修訂根據舊資訊建立的機率時,或用統計學家的話說,就是拿時間順序在後的機率,跟時間順序在前的機率做比較。以撞球台為例,第一個球代表事前,藉著重複滾動第二球,修訂對第一球落點的估計,後者即「事後的機率」。
貝葉斯提出這道隨著新資訊湧進,修訂根據舊資訊所做推論的手續,在哲學觀念上極其現代化:在動態世界裡,狀態不確定時,就沒有單一答案存在。數學家史密斯(A. F. M. Smith)說得好:「在我看來,任何尋求以單一答案解決複雜的不確定狀態的科學推論方法,都是基於威權心態,對理性學習過程的拙劣模仿。」
雖然貝葉斯的推論系統過於複雜,無法在此詳加說明,不過本章之末的附錄中,還是介紹一個貝葉斯分析的典型應用實例。
◎不確定性可以計算
本章介紹的各種成就,最令人興奮的一個大膽創見就是,不確定性可以計算。不確定性代表未知的機率;倒轉海金對確定性的描述:若我們的資訊正確,而某件事未若預期發生,或我們的資訊錯誤,某件事卻發生了,我們就可以說這件事不確定。
傑可伯、棣美弗、貝葉斯教我們如何根據實驗中得到的數據,推算原先不知道的機率。他們的成就需要可觀的心智活力,以及探索未知的勇氣。棣美弗提出「原始設計」(origin design)的觀念時,毫不掩飾對自己的成就深感自豪的心理。他經常公然表達這種觀點;有次他寫道:「只要人類不用玄學的塵沙蒙蔽自己,就可採取明顯的捷徑,認清萬物的偉大創造者與統治者。」
我們現在已來到十八世紀後期的啟蒙時代,這時代高唱:追求知識是人類最崇高的活動。這是一個科學家拭去眼睛上的玄學塵沙的時代。探索未知、創造新事物,再沒有任何禁忌。一八○○年以前,致力馴服風險的人類,已獲得可觀的進展,這方面的活動也隨著新的世紀來臨而有更大的動力──維多利亞時代會提供更多的誘因。
【摘錄2】第八章 至高無上的非理性──股市隨機漫步現象
股票價格變化跟常態分配有多密切的關係?有些研究市場行為的權威人士認為,股價捉摸不定──就像一個想抱緊路燈桿的醉漢,沒有目標、沒有計畫。他們認為股價就像輪盤或兩枚骰子般毫無記憶,每次觀察都與前次的觀察無關,今天的價格會是什麼樣,就是什麼樣,不論前一分鐘、昨天、前天、大前天發生了什麼事。
判斷股價變動是否確實獨立於其他條件之外,必須觀察它是否符合常態分配曲線。有相當可觀的證據肯定股價是落在常態曲線上。這實在不足為怪。像美國股市這麼一個流動性大、競爭激烈的資本市場,每個投資人都企圖智取所有其他人,新資訊很快就反映在股價上。如果通用汽車公司收益令人失望,或默克大藥廠宣布推出新藥,在投資人思索消息的意義時,股價絕不可能原地踏步。沒有一個投資人承受得了等候其他人先採取行動的代價,所以他們會成群結隊的行動,立刻把通用汽車或默克的股價推到足以反映新資訊的價位。但新資訊以隨機的方式出現,使股價的動向完全無法預測。
一九五○年代,芝加哥大學教授羅伯斯(Harry Roberts)提出支持這個觀點的有趣證據。他設計了一個與股市價格變動有相同平均值與相同標準差的數列,並用電腦從這個數列隨機取樣,同時根據這些亂數的起落畫出一個表。結果與股市分析家預測市場動向時使用的線型圖完全相符。真正的價格波動與電腦選取的亂數,根本無法區分。或許,股價真的沒有記憶。表格雖各不相同,卻有兩種共同的特徽。首先,正如摩根(J. P. Morgan)的名言:「凡是市場,就會波動。」股市是個變化多端的地方,上漲下跌存在著許多變數。其次,上漲趨勢所受的觀察總比下跌趨勢多:一般而言,股市上漲的時候也比下跌多。
◎隨機漫步
常態分配對「隨機漫步假設」(random-walk)是一種更嚴格的考驗。但有一點很重要。即使「隨機漫步現象」能有效的描述股市的現實──即使股價的變動完全符合常態分配的原則──平均值也不會是零。多頭的走勢是意料中事。長期持有股票,投資人的財富會隨著經濟和企業營收成長而增加,也因為股價波動向上比向下多,所以股價的平均變化應該是個正值。
逐年的數據顯示,每一年度的股價變動沒有典型可言。變化的幅度以七.七%為平均值,起落毫無秩序可言。 標準差是十九.三%。換言之,在任何一年中,股價會有三分之二的時間在正二七.○%與負十二.一%的範圍裡波動。雖然只有二.五%的機會──亦即四十年裡只有一年──股價上漲四六.四%,但所幸也只有二.五%的時間出現市場大空頭,股價下跌三一.六%。
抽樣的七十年間,有四十七年股價上揚,亦即三分之二的機會。換言之,有二十三年股價是下跌的:但其中只有十年(或將近一半),股價跌幅超過標準誤差──亦即超出十二.一%。事實上,壞年頭的平均跌幅為十五.二%。
七十次觀察是否能提供充分的證據,夠我們確認股市的行為模式可視為「隨機漫步」?也許不能。我們知道丟骰子每次之間完全獨立,但只試六次得到的結果可能跟常態分配截然有異。只有增加丟擲的次數,大規模的試驗,理論與實際才開始契合。
據二百八十條季線的觀察,比年線更接近常態曲線。儘管如此,各數據還是分散得很開,而且毫無對稱之感,只是一小撮變化很大的數字。每季的平均變化是二%,但標準差是十二%,由此可知,我們根本不能預期每季的波動會符合二%這個標準。四五%的季波動小於二%,而五五%大於二%。
假設一位投資人購買一套股票組合,並持股七十年,其收益會相當可觀,但冀望每三個月賺二%的投資人則是個傻瓜。
八百四十個月的波動就比年或季的變化來得密集,看起來也更有秩序。每月平均變動是正○.六%。如果我們從每次觀察減掉這麼多,以校正長期以來市場自然的上升趨勢,平均變化就是正0.0000000000000002%,旺月是五○.六%,而衰月是四九.四%。觀察第一組四分位數(quartile),有二○四次位於平均數之下,即負二.七八%,觀察第三組四分位數也有二○四次位於平均點之上,即正二.九一%。可說是相當完美的對稱。
八百四十個月變動的隨機性質,也可從上漲或下降趨勢很少能持續到兩個月的現象,獲得證實。只有半數情況下,連續兩個月,股價朝同一方向移動;僅一○%的情況,股價會朝同一方向移動持續五個月之久。因此,至少根據這八百四十個月的變動而言,股市紀錄與「隨機漫步」類似。要是股價波動不互相獨立,數據就不會以這種方式──就像是丟骰子──沿平均值分布。校正過上升趨勢後,變化就微乎其微;與時間對應的變動指數,跟理論的預期非常接近。
◎預估股票風險
假設我們採用傑可伯·伯努利的限制,即未來會與過去類似,就可以計算任何一個月,特定股票的風險。標準普爾指數表中,股價的平均月波動是○.六%,標準偏差是五.六%,如果價格波動隨機分布,就有六八%的機會,任一月的價格跌幅不超過負五.二%,漲幅也不超過正六.四%。假設我們要知道任何一個月股價下跌的機率,答案是四五%──或略少於半數的時間。但同一個月跌幅超過一○%的機率,僅三.五%,亦即每三十個月才會發生一次;每十五個月會出現一次上漲或下跌超過一○%的現象。
事實上,我們觀察的八百四十個月中,有三十三個月(或四%),波動超過月平均值正○.六%兩個標準差,亦即跌幅超過十一%,或漲幅超過十二.二%。雖然三十三次的大幅波動少於一般對完全隨機觀察的預期,但其中有二十一次是下跌;而純從機率考慮,應該是十六次或十七次才對。一個擁有與生俱來的上升趨勢的市場,在八百一十六個月之中,發生的災難次數應該少於十六次或十七次才對。
從極端的角度而論,市場不是「隨機漫步」;從極端的角度而論,市場較可能毀滅財富,而不是創造財富。股市是個高風險的地方。
◎分辨常態與非常態的能力
截至目前為止,我們的故事一直與數字有關。從古印度、阿拉伯、希臘,乃至十九世紀高斯與拉普拉斯的創新,數學家始終居於歷史舞臺中心的地位。我們討論的主題是機率,而非不確定性。
但現在場景要改變了。現實人生跟帕契歐里的骰子遊戲不一樣,現實不是一連串互不相干、毫無關係的事件。股市看起來很像隨機漫步,但這方面的相似性非常不完美。某些情形下,平均值可充作有用的指南,但在很多其他情形下卻造成誤導。還有些數字根本派不上用場的情況,我們唯有靠猜測向未來匍匐前進。
不過,這不代表數字在現實生活裡沒有用。要緊的是有能力判斷它何時有影響,何時則無。所以我們現在得解答一整套的新問題。例如,被炸彈擊中的風險用什麼界定,七百萬人或一頭大象?我們該用哪種平均數界定股市的正常表現:一九二六到一九九五年的平均每月價格波動正○.六%,一九三○年至一九四○年不夠塞牙縫的平均波動正○.一%,或一九五四年至一九六四年誘人的正一.○%?
股市連續上漲五個月的難得情況又如何呢?「漲多必跌」當真是必然?驕兵是否必敗?一家陷於困境的公司整頓成功的機會多大?亢奮的躁鬱症患者是否不久就又會墜入憂鬱症的情緒谷底,而且交替循環?旱災何時會結束?市場榮景是否即將捲土重來?
這些問題的答案,都決定於分辨常態與非常態的能力。很多冒險行為都仰賴從偏離常態發展出來的機會。分析家告訴我們,他們最看好的股票價格被「低估」,真正的意思是,投資人可以馬上買進這支股票,等它的價格回升到正常水準。另一方面,躁鬱症這種心理疾病可能一輩子都不會好。正如一九三二年的美國經濟,一點振興的生機都沒有,連胡佛總統和他的顧問都認為,政府再怎麼鼓勵和干預,充其量不過是妨礙它自行找到復甦的途徑罷了。