從賭場(chǎng)里的賭博機(jī)器到下周天氣的預(yù)測(cè),我們周圍的世界都受到看似隨機(jī)的事件影響。那么,數(shù)學(xué)家是如何理解隨機(jī)事件的?對(duì)隨機(jī)事物的“預(yù)測(cè)”又意味著什么?
在《數(shù)學(xué)家是如何描述生活中的隨機(jī)事件的?》一文中,我們提到了隨機(jī)性是一個(gè)我們熟悉、卻又難以給出正式定義的概念;但我們有一套用概率論在數(shù)學(xué)上描述隨機(jī)性的明確方法。而今天我們要探討的是,在理解概率時(shí)的兩個(gè)指導(dǎo)原則:對(duì)稱性和普遍性。
1
對(duì)稱性
對(duì)稱性在概率論中能起到以下作用:如果不同的結(jié)果是等價(jià)的,那它們應(yīng)該具有相同的概率。這兩個(gè)結(jié)果可能看起來(lái)并不一樣(比如硬幣是正面著陸還是背面著陸),但產(chǎn)生結(jié)果的過程(硬幣旋轉(zhuǎn)的機(jī)制)絲毫不關(guān)心哪一面落地的問題。
這種對(duì)稱性讓我們可以判斷出硬幣正面著陸的概率應(yīng)該與背面著陸的概率相同——都為1/2。與之相似的還有骰子,投擲出骰子上六個(gè)數(shù)字中的任何一個(gè)的概率都應(yīng)相同,即得到每個(gè)數(shù)字的概率皆為1/6。
○ 骰子。推薦閱讀:《數(shù)學(xué)家是如何描述生活中的隨機(jī)事件?》
對(duì)稱性是概率論中的一個(gè)強(qiáng)有力的指導(dǎo)原則,如同它在數(shù)學(xué)中的許多領(lǐng)域一樣。但是,在將它應(yīng)用于現(xiàn)實(shí)世界中的概率時(shí),就需要更加謹(jǐn)慎了,即便是在簡(jiǎn)單的情況下。
雙信封悖論
例如,想象你有兩個(gè)信封。它們各自包含了一張支票,其中一張的金額比另一張高出兩倍。你選擇其中一個(gè)信封,并將其打開,得知了里面所含的金額。現(xiàn)在你有一次機(jī)會(huì)決定是否保留這些錢,又或者換另成一個(gè)信封。你會(huì)怎么做?
我們先假設(shè)你選中的信封中所含金額數(shù)為x,那么這意味著另一個(gè)信封中裝的金額要么是2x,要么是x/2,這兩種金額的概率都是1/2。所以如果換掉信封的話,你所得金額的期望值為
由于這個(gè)結(jié)果比一開始的x更大,所以應(yīng)該換。但如果你在看信封之前就被要求做出選擇呢?你就會(huì)發(fā)現(xiàn)自己會(huì)不斷地改變想法,最終被困在一個(gè)無(wú)限循環(huán)的交換過程中。這就是概率論中著名的雙信封悖論(詳見:《雙信封悖論:換,還是不換?》)。
一旦你意識(shí)到不同的結(jié)果是不對(duì)稱的,你就會(huì)發(fā)現(xiàn)這并不是什么悖論。如果在你的第一個(gè)信封中的支票是10萬(wàn),那么你就會(huì)選擇保留,因?yàn)槊爸?萬(wàn)的代價(jià)太大。但如果你看到的是5塊錢,那你就會(huì)很樂意賭一把。
更重要的是,你還需要將對(duì)提供這兩個(gè)信封的人愿意給出多少金錢的先驗(yàn)概率考慮在內(nèi)。對(duì)稱性表明,所有可能的數(shù)額都具有相同的可能性——這不僅完全不現(xiàn)實(shí),還會(huì)造成不適定(ill-posed)的概率模型。上述情況沒有足夠的信息來(lái)構(gòu)建完整的模型。
這個(gè)例子闡明了一個(gè)非常重要的論點(diǎn)——即盲目地遵循對(duì)稱性原則可能導(dǎo)致錯(cuò)誤的數(shù)學(xué)模型的使用,或者誘使你錯(cuò)誤地認(rèn)為你有足夠的信息來(lái)創(chuàng)建一個(gè)這樣的模型。而使用錯(cuò)誤的數(shù)學(xué)模型可能會(huì)造成非常嚴(yán)重的后果。
缺陷統(tǒng)計(jì)導(dǎo)致的危險(xiǎn)
1999年,Sally Clark 被控謀殺了她的兩個(gè)孩子并被法庭審判。辯方的辯詞為,兩名孩童都死于嬰兒猝死綜合癥(SIDS)。而檢方的一位專家證人認(rèn)為,兩個(gè)孩子都死于SIDS的概率是一個(gè)孩子發(fā)生猝死事件概率的平方,也就是說(shuō)在一個(gè)家庭中出現(xiàn)兩個(gè)SIDS事件的概率為7千3百萬(wàn)分之一。但是,這個(gè)論點(diǎn)基于的是假定這兩次死亡事件是各自獨(dú)立的,卻忽視了未知的環(huán)境或遺傳因素可能導(dǎo)致一個(gè)家庭更易患上SIDS,使二次死亡的幾率變大。
這種不正確的數(shù)學(xué)模型,連同呈上的統(tǒng)計(jì)證據(jù)里的基本錯(cuò)誤,導(dǎo)致 Clark 被判監(jiān)禁。雖然她的罪名最終在上訴中被推翻,但卻給 Clark 和她的家人帶來(lái)了難以承受的可怕經(jīng)歷。而這個(gè)事件也是使用有缺陷的統(tǒng)計(jì)論證之所以危險(xiǎn)的一個(gè)示例。在將概率應(yīng)用于現(xiàn)實(shí)世界中的情況時(shí),我們必須非常小心謹(jǐn)慎,無(wú)論情況看上去有多么簡(jiǎn)單。
但是概率論確實(shí)可以讓我們?cè)诓痪哂型暾R(shí)的條件下對(duì)情況進(jìn)行分析和描述。將這些數(shù)學(xué)與真實(shí)事件聯(lián)系起來(lái)可能會(huì)造成問題,但試圖了解這種現(xiàn)實(shí)世界的情況刺激著數(shù)學(xué)的發(fā)展。隨機(jī)性的數(shù)學(xué)描述能讓我們更深入地了解周圍的世界。
2
普遍性
普遍性是理解概率的第二個(gè)指導(dǎo)原則,它比對(duì)稱性更為微妙。普遍性的思路是,如果一個(gè)結(jié)果是由許多不同隨機(jī)來(lái)源造成的,那么根本機(jī)制的細(xì)節(jié)應(yīng)該不重要。
在更大的尺度范圍內(nèi)
這個(gè)概念來(lái)自于理論物理。例如,流體有著大致相同的行為,即使組成它們的分子有著非常不同的形狀和特性。如果用顯微鏡觀察兩種不同流體中的分子,就會(huì)發(fā)現(xiàn)它們看起來(lái)很不同。但是,如果只是在宏觀尺度下觀察這兩種不同的流體,就會(huì)看到非常相似的行為。所有流體的行為都可以用一個(gè)相同的數(shù)學(xué)模型——納維-斯托克斯方程——來(lái)描述,它只涉及到少數(shù)的幾個(gè)參數(shù)。
概率論也是這樣一個(gè)相似的故事。在宏觀尺度下,信息被匯總、聚集,并且在有的時(shí)候,相同的數(shù)學(xué)可用來(lái)描述有著不同基礎(chǔ)過程的結(jié)果。在數(shù)學(xué)中,中心極限定理就是能體現(xiàn)這一概念的一個(gè)例子。它說(shuō)的是,如果將許多隨機(jī)量混合在一起,那么結(jié)果將始終遵循“鐘形曲線”——即正態(tài)分布的形狀。
中心極限定理是具有普遍性的。它描述的是,測(cè)量某一性質(zhì)的大量平均值會(huì)遵循正態(tài)分布,即便這一性質(zhì)本身的分布并非正態(tài)。例如,多次拋擲硬幣的分布是均勻的——正面朝上與背面朝上的次數(shù)幾乎各占一半。但是如果將硬幣拋擲100次,正面朝上記為0,反面朝上記為1,取其平均值;再擲一100次硬幣,并再取其平均值,循環(huán)往復(fù),直到得到很多平均值……那么這些平均值將呈正態(tài)分布,且它們的均值為0.5。與流體動(dòng)力學(xué)的情況類似,基本屬性分布的微觀細(xì)節(jié)可以忽略不計(jì),因?yàn)槠骄植嫉暮暧^景象總是正態(tài)的。
布朗運(yùn)動(dòng)
布朗運(yùn)動(dòng)的發(fā)現(xiàn)是普遍性中最著名、也最令人驚喜的例子。1827年,蘇格蘭植物學(xué)家羅伯特·布朗(Robert Brown)在顯微鏡下觀察懸浮在水中的花粉粒。他觀察到花粉粒所釋放的微觀粒子表現(xiàn)出高度不規(guī)則的運(yùn)動(dòng),使他非常困惑。在巨大的好奇心被激發(fā)之后,他繼續(xù)進(jìn)行了多項(xiàng)實(shí)驗(yàn),排除了周圍環(huán)境或?qū)嶒?yàn)設(shè)置中任何能導(dǎo)致這種抖動(dòng)的外部因素,以及因?yàn)榱W邮怯袡C(jī)的這種內(nèi)部原因。(他在無(wú)機(jī)顆?!簤m中也觀察到了同樣的運(yùn)動(dòng)。)
○ 布朗運(yùn)動(dòng)的一個(gè)可能路徑。| 圖片來(lái)源:Plus
到了1905年,愛因斯坦和 Marian Smoluchowski 分別獨(dú)立的對(duì)這種抖動(dòng)的運(yùn)動(dòng)作出了解釋:流體中振動(dòng)的流體分子會(huì)對(duì)微觀粒子施加微小的作用力,因而這許多的獨(dú)立的微小作用力積聚起來(lái)與微觀粒子對(duì)抗。
由此而產(chǎn)生的布朗運(yùn)動(dòng)是隨機(jī)的,你無(wú)法確切地預(yù)測(cè)其中一顆微粒從某一時(shí)刻到另一時(shí)刻的位置變化。但是你可以指定一個(gè)描述粒子可能移動(dòng)到哪個(gè)位置的概率分布。愛因斯坦和 Smoluchowski 意識(shí)到,用來(lái)描述這種概率分布隨著時(shí)間推移而發(fā)生變化的數(shù)學(xué),與描述熱量流經(jīng)物體的數(shù)學(xué)(即熱傳導(dǎo)方程式)是一樣的。
1908年,讓·佩蘭(Jean Perrin)通過實(shí)驗(yàn)驗(yàn)證對(duì)這一理論進(jìn)行了定量預(yù)測(cè),這不僅證實(shí)了布朗運(yùn)動(dòng)的描述,并且解決了當(dāng)時(shí)對(duì)于原子存在的爭(zhēng)論。
更大的繪景
布朗運(yùn)動(dòng)是普遍的。無(wú)論所涉及的粒子和流體分子有著怎樣的特定形狀、以及基礎(chǔ)細(xì)節(jié),我們?cè)谠S多微粒的隨機(jī)運(yùn)動(dòng)中都能觀察到布朗運(yùn)動(dòng)。但這種普遍性能進(jìn)一步延伸。其實(shí)早在1900年,法國(guó)數(shù)學(xué)家路易·巴舍利耶(Louis Bachelier)在研究金融系統(tǒng)時(shí),就首次用數(shù)學(xué)描述了布朗運(yùn)動(dòng)。Bachelier 將股票價(jià)格的演變描述為由于無(wú)數(shù)交易的發(fā)生導(dǎo)致的價(jià)格微小波動(dòng)的積累。與花粉微粒的運(yùn)動(dòng)一樣,股票價(jià)格的演變不可能被準(zhǔn)確的預(yù)測(cè)。但是,卻可以用一個(gè)概率分布來(lái)描述股票價(jià)格在價(jià)值上的變化,并且描述這個(gè)概率分布演變的還是熱傳導(dǎo)方程,這是一個(gè)奠定了金融數(shù)學(xué)基礎(chǔ)的發(fā)現(xiàn)。
○ 布朗運(yùn)動(dòng)也被運(yùn)用于金融學(xué),推薦進(jìn)一步閱讀:《隨機(jī)漫步的金融交易員》
○ 布朗運(yùn)動(dòng)也被運(yùn)用于金融學(xué),推薦進(jìn)一步閱讀:《隨機(jī)漫步的金融交易員》。| 圖片來(lái)源:APS/Alan Stonebraker
聯(lián)系客服