教學目標與教學指導:
正如英國學者威爾斯所說,統(tǒng)計的思維方法,就像讀和寫的能力一樣,有一天會成為有效率的公民的必備能力。所以概率統(tǒng)計內容的教學要在提高學生的文化修養(yǎng)上下功夫,希望學員通過本專題的學習,了解統(tǒng)計與概率產生和發(fā)展的過程,從而對隨機思想有更深刻的體會,能夠在日常教學中中捕捉它滲透它,潛移默化地影響學生。
一、隨機現(xiàn)象
在自然界和現(xiàn)實生活中,一些事物是相互聯(lián)系和不斷發(fā)展的。在它們彼此間的聯(lián)系和發(fā)展中,根據(jù)它們是否有必然的因果聯(lián)系,可以分成截然不同的兩大類:一類是確定性的現(xiàn)象。這類現(xiàn)象是在一定條件下,必定會導致某種確定的結果。舉例來說,在標準大氣壓下,水加熱到100攝氏度,就必然會沸騰。事物間的這種聯(lián)系是屬于必然性的。通常的,自然科學各學科就是專門研究和認識這種必然性的,尋求這類必然現(xiàn)象的因果關系,把握它們之間的數(shù)量規(guī)律。
另一類是不確定性的現(xiàn)象。這類現(xiàn)象是在一定條件下,它的結果是不確定的。舉例來說,同一個工人在同一臺機床上加工同一種零件若干個,它們的尺寸總會有一點差異。為什么在相同的情況下,會出現(xiàn)這種不確定的結果呢?這是因為,我們說的“相同條件”是指一些主要條件來說的,除了這些主要條件外,還會有許多次要條件和偶然因素,這些是人們無法事先一一掌握的。正因為這樣,我們對這一類現(xiàn)象的結果,就無法事先做出確定的答案。事物間的這種關系是屬于偶然性的,這種現(xiàn)象叫做偶然現(xiàn)象,或者叫做隨機現(xiàn)象。
在日常生產生活中,隨機現(xiàn)象十分普遍。比如:每期體育彩票的中獎號碼、同一條生產線上生產的燈泡的壽命等,都是隨機現(xiàn)象。因此,我們說:隨機現(xiàn)象就是:在同樣條件下,多次進行同一試驗或調查同一現(xiàn)象,所得的結果不完全一樣,而且無法準確地預測下一次所得結果的現(xiàn)象。隨機現(xiàn)象這種結果的不確定性,是由于一些次要的、偶然的因素影響所造成的。
隨機現(xiàn)象從表面上看,似乎是雜亂無章的、沒有什么規(guī)律的現(xiàn)象。但實踐證明,如果同類的隨機現(xiàn)象大量重復出現(xiàn),它的總體就呈現(xiàn)出一定的規(guī)律性。大量同類隨機現(xiàn)象所呈現(xiàn)的這種規(guī)律性,隨著我們觀察的次數(shù)的增多而愈加明顯。比如擲硬幣,每一次投擲很難判斷是哪一面朝上,但是如果多次重復的擲這枚硬幣,就會越來越清楚的發(fā)現(xiàn)它們朝上的次數(shù)大體相同。
我們把這種由大量同類隨機現(xiàn)象所呈現(xiàn)出來的集體規(guī)律性,叫做統(tǒng)計規(guī)律性。概率論和數(shù)理統(tǒng)計就是研究大量同類隨機現(xiàn)象的統(tǒng)計規(guī)律性的數(shù)學學科。但是應該指出,概率論、數(shù)理統(tǒng)計又都各有它們自己所包含的不同內容。下面我們分別來看一看它們的起源與發(fā)展。
二、數(shù)理統(tǒng)計學的起源
數(shù)理統(tǒng)計學是研究收集數(shù)據(jù)、分析數(shù)據(jù)并據(jù)以對所研究的問題做出一定的結論的科學和藝術。數(shù)理統(tǒng)計學所考察的數(shù)據(jù)都帶有隨機性(偶然性)的誤差。這給根據(jù)這種數(shù)據(jù)所做出的結論帶來了一種不確定性,其量化要借助于概率論的概念和方法。因此,數(shù)理統(tǒng)計學與概率論成為密切聯(lián)系的兩個學科。
統(tǒng)計學首先起源于收集數(shù)據(jù)的活動。小至個人的事情,大至治理一個國家,都有必要收集種種有關的數(shù)據(jù),如在我國古代典籍中,就有不少關于戶口、錢糧、兵役、地震、水災和旱災等等的記載?,F(xiàn)今各國都設有統(tǒng)計局或相當?shù)臋C構。當然,單是收集、記錄數(shù)據(jù)這種活動本身并不能等同于統(tǒng)計學這門科學的建立,需要對收集來的數(shù)據(jù)進行排比、整理,用精煉和醒目的形式表達,在這個基礎上對所研究的事物進行定量或定性估計、描述和解釋,并預測其在未來可能的發(fā)展狀況。例如根據(jù)人口普查或抽樣調查的資料對我國人口狀況進行描述,根據(jù)適當?shù)某闃诱{查結果,對受教育年限與收入的關系,對某種生活習慣與嗜好(如吸煙)與健康的關系作定量的評估。根據(jù)以往一般時間某項或某些經濟指標的變化情況,預測其在未來一段時間的走向等。做這些事情的理論與方法,才能構成一門學問——數(shù)理統(tǒng)計學的內容。
這樣的統(tǒng)計學始于何時?恐怕難于找到一個明顯的、大家公認的起點。一些著名學者認為,英國學者葛朗特在1662年發(fā)表的著作《關于死亡公報的自然和政治觀察》,標志著這門學科的誕生。中世紀歐洲流行黑死病,該病在歐洲猖獗兩個世紀,奪去了2500余萬人的生命。自1604年起,倫敦教會每周發(fā)表一次“死亡公報”,記錄該周內死亡的人的姓名、年齡、性別、死因。以后還包括該周的出生情況——依據(jù)受洗的人的名單,這基本上可以反映出生的情況。幾十年來,積累了很多資料,葛朗特是第一個對這一龐大的資料加以整理和利用的人,他原是一個小店主的兒子,后來靠自學成才。他因這一部著作被選入當年成立的英國皇家學會,反映出學術界對他這一著作的承認和重視。
這是一本篇幅很小的著作,主要內容為8個表,從今天的觀點看,這只是一種例行的數(shù)據(jù)整理工作,但在當時則是有原創(chuàng)性的科研成果,其中所提出的一些概念,在某種程度上可以說沿用至今,如數(shù)據(jù)簡約(大量的、雜亂無章的數(shù)據(jù),須經過整理、約化,才能突出其中所包含的信息)、頻率穩(wěn)定性(一定的事件,如“生男”、“生女”,在較長時期中有一個基本穩(wěn)定的比率,這是進行統(tǒng)計性推斷的基礎)、數(shù)據(jù)糾錯、生命表(反映人群中壽命分布的情況,至今仍是保險與精算的基礎概念)等。
葛朗特的方法被他同時代的政治經濟學家佩蒂引進到社會經濟問題的研究中,他提倡在這類問題的研究中不能尚空談,要讓實際數(shù)據(jù)說話,他的工作總結在他去世后于1690年出版的《政治算術》一書中。
當然,也應當指出,他們的工作還停留在描述性的階段,不是現(xiàn)代意義下的數(shù)理統(tǒng)計學。那時,概率論尚處在萌芽的階段,不足以給數(shù)理統(tǒng)計學的發(fā)展提供充分的理論支持,但不能由此否定他們工作的重大意義。作為現(xiàn)代數(shù)理統(tǒng)計學發(fā)展的幾個源頭之一,他們以及后續(xù)學者在人口、社會、經濟等領域的工作,特別是比利時天文學家兼統(tǒng)計學家凱特勒19世紀的工作,對促成現(xiàn)代數(shù)理統(tǒng)計學的誕生起了很大的作用。
數(shù)理統(tǒng)計學的另一個重要源頭來自天文和測地學中的誤差分析問題。
早期,測量工具的精度不高,人們希望通過多次測量獲取更多的數(shù)據(jù),以便得到對量測對象的精度更高的估計值。量測誤差有隨機性,適合于用概率論即統(tǒng)計的方法處理,遠至伽利略就做過這方面的工作,他對測量誤差的性態(tài)作了一般性的描述,法國大數(shù)學家拉普拉斯曾對這個問題進行了長時間的研究,現(xiàn)今概率論中著名的“拉普拉斯分布”,即是他在這研究中的一個產物。
這方面最著名且影響深遠的研究成果有二:一是法國數(shù)學家兼天文學家勒讓德19世紀初(1805)在研究慧星軌道計算時發(fā)明的“最小二乘法”,他在估計過巴黎的子午線長這一工作中,曾使用這個方法?,F(xiàn)今著作中把這一方法的發(fā)明歸功于高斯,但高斯使用這一方法最早見諸文字是1809年,比勒讓德晚。一種觀點現(xiàn)在逐步取得公認——這項發(fā)明系由二人獨立做出,看來是比較妥當?shù)?。另外一個重要成果是德國大學者高斯1809年在研究行星繞日運動時提出用正態(tài)分布刻畫測量誤差的分布。正態(tài)分布也常稱為高斯分布,其曲線是鐘形,故有時又稱為“鐘形曲線”。它反映了這樣一種極普通的情況:天下形形色色的事物中,“兩頭小,中間大”的居多,如人的身高,太高太矮的都不多,而居于中間者占多數(shù)——當然,這只是一個極粗略的描述,要作出準確的描述,須動用高等數(shù)學的知識。
正態(tài)分布在數(shù)理統(tǒng)計學中占有極重要的地位,現(xiàn)今仍在常用的許多統(tǒng)計方法,就是建立在“所研究的量具有或近似地具有正態(tài)分布”這個假定的基礎上,而經驗和理論(概率論中所謂“中心極限定理”)都表明這個假定的現(xiàn)實性?,F(xiàn)實世界許多現(xiàn)象看來是雜亂無章的,如不同的人有不同的身高、體重。大批生產的產品,其質量指標各有差異。看來毫無規(guī)則,但它們在總體上服從正態(tài)分布。這一點顯示,在紛亂中有一種秩序存在。提出正態(tài)分布的高斯,一生在多個領域里面有不少重大的貢獻,但在德國10馬克的有高斯圖像的鈔票上,只畫出了正態(tài)曲線,以此可以看出人們對他這一貢獻評價之高。
四、數(shù)理統(tǒng)計學的初步發(fā)展
20世紀以前數(shù)理統(tǒng)計學發(fā)展的一個重要成果,是19世紀后期由英國遺傳學家兼統(tǒng)計學家高爾頓發(fā)起,并經現(xiàn)代統(tǒng)計學的奠基人之一K·皮爾遜和其他一些英國學者所發(fā)展的統(tǒng)計相關與回歸理論。所謂統(tǒng)計相關,是指一種非決定性的關系,如人的身高X與體重Y,存在一種大致的關系,表現(xiàn)在X大(?。r,Y也傾向于大(小),但非決定性的:由X并不能決定Y?,F(xiàn)實生活和科技領域中,這種例子很多,如受教育年限與收入的關系,經濟發(fā)展水平與人口增長速度的關系等,都是屬于這種性質。統(tǒng)計相關的理論把這種關系的程度加以量化,而統(tǒng)計回歸則是把有統(tǒng)計相關的變量,如上文的身高X和體重Y的關系的形式作近似的估計,稱為回歸方程。現(xiàn)實世界中的現(xiàn)象往往涉及眾多變量,它們之間有錯綜復雜的關系,且許多屬于非決定性質,相關回歸理論的發(fā)明,提供了一種通過實際觀察去對這種關系進行定量研究的工具,有著重大的認識和實用意義。
到20世紀初年,數(shù)理統(tǒng)計學已積累了很豐富的成果。但是直到這時為止,我們還不能說現(xiàn)代意義下的數(shù)理統(tǒng)計學已經建立起來,其主要標志之一就是這門學問還缺乏一個統(tǒng)一的理論框架,這個任務在20世紀上半葉得以完成,狹義一點說可界定在1921—1938年。起主要作用的是幾位大師級的人物,特別是英國的費歇爾·K·皮爾遜,發(fā)展統(tǒng)計假設檢驗理論的奈曼與E·皮爾遜和提出統(tǒng)計決策函數(shù)理論的瓦爾德等。我國已故著名統(tǒng)計學家許寶祿(1910—1970)在這項工作中也卓有建樹。
自二戰(zhàn)結束迄今,數(shù)理統(tǒng)計學有了迅猛的發(fā)展,主要有以下三方面的原因:一是數(shù)理統(tǒng)計學理論框架的建立以及概率論和數(shù)學工具的進展,為統(tǒng)計理論在面上和向縱深的發(fā)展打開了門徑和提供了手段。許多在早期比較粗略的理論和方法,在理論上得到了完善與深入,并不斷提出新的研究課題;二是實用上的需要,不斷提出了復雜的問題與模型,吸引了學者們的研究興趣;三是電子計算機的發(fā)明與普及應用,一方面提供了必要的計算工具——統(tǒng)計方法的實施往往涉及大量數(shù)據(jù)的處理與運算,用人力無法在合理的時間內完成,所以在早年,一些統(tǒng)計方法人們雖然知道,但很少付諸實用,就因為是人力所難及。計算機的出現(xiàn)解決了這個問題。而賦予統(tǒng)計方法以現(xiàn)實的生命力。同時,計算機對促進統(tǒng)計理論研究也有助益,統(tǒng)計模擬是其表現(xiàn)之一。
在承認上述成就的同時,不少統(tǒng)計學家也指出這一時期發(fā)展中出現(xiàn)的一些問題或偏向。其中主要的一點是,數(shù)理統(tǒng)計學理論研究中的“數(shù)學化”氣味愈來愈重,相當一部分研究工作停留在數(shù)學的層面,早期那種理論研究與現(xiàn)實問題密切結合的優(yōu)良傳統(tǒng)有所淡化,一些學者還提出了補救的建議,對未來統(tǒng)計學發(fā)展的方向進行探討。同時,現(xiàn)實問題愈來愈涉及到大量的、結構復雜的數(shù)據(jù),按現(xiàn)行的數(shù)理統(tǒng)計學規(guī)范去處理,顯得力所不及,需要一些帶有根本性創(chuàng)新的思路,使統(tǒng)計學的發(fā)展登上一個新的臺階,以適應應用上的需要??紤]這一背景,有的統(tǒng)計學家樂觀地認為數(shù)理統(tǒng)計學正面臨一個新的突破。
另外,由于概率論的概念和方法是數(shù)理統(tǒng)計學的理論基礎,概率論的進展也必然對數(shù)理統(tǒng)計學的發(fā)展起促進作用。
五、概率論的產生
概率,又稱幾率,或然率,指一種不確定的情況出現(xiàn)可能性的大小,例如,投擲一個硬幣,“出現(xiàn)國徽”(國徽一面朝上)是一個不確定的情況。因為投擲前,我們無法確定所指情況(“出現(xiàn)國徽”)發(fā)生與否,若硬幣是均勻的且投擲有充分的高度,則兩面的出現(xiàn)機會均等,我們說“出現(xiàn)國徽”的概率是1/2。同樣,投擲一個均勻骰子,“出現(xiàn)4點”的概率是1/6,除了這些簡單情況外,概率的計算不容易,往往需要一些理論上的假定。在現(xiàn)實生活中則往往用經驗的方法確定概率,例如某地區(qū)有N人,查得其中患某種疾病者有M人,則稱該地區(qū)的人患該種疾病的概率為M/N,事實上這是使用統(tǒng)計方法對發(fā)病概率的一個估計。
概率的概念起源于中世紀以來在歐洲流行的用骰子賭博。
1654年,有一個賭徒梅累向當時著名的數(shù)學家帕斯卡提出了一個使他苦惱了很久的“分賭本問題”。這一問題曾引起熱烈的討論,并經歷了長達100多年才得到正確的解決。舉該問題的一個簡單情況:甲、乙二人賭博,各出賭注30元,共60元,每局甲、乙勝的機會均等,都是1/2。約定:誰先勝滿3局則他贏得全部賭注60元,現(xiàn)已賭完3局,甲2勝1負,而因故中斷賭博,問這60元賭注該如何分給2人,才算公平?初看覺得應按2:1分配,即甲得40元,乙得20元,還有人提出了一些另外的解法,結果都不正確。正確的分法應考慮到如在這基礎上繼續(xù)賭下去,甲、乙最終獲勝的機會如何。至多再賭2局即可分出勝負,這2局有4種可能結果:甲甲、甲乙、乙甲、乙乙。前3種情況都是甲最后取勝,只有最后一種情況才是乙取勝,二者之比為3:1,故賭注的公平分配應按3:1的比例,即甲得45元,乙15元。
當時的一些學者,如惠更斯、帕斯卡、費爾馬等人,對這類賭博問題進行了許多研究。有的出版了著作,如惠更斯的《論機會游戲的計算》,曾長期在歐洲作為概率論的教科書。這些研究使原始的概率和有關概念得到發(fā)展和深化。
不過,在這個概率論的草創(chuàng)階段,最重要的里程碑是伯努利的著作《推測術》。在他死后的1713年發(fā)表,這部著作除了總結前人關于賭博的概率問題的成果并有所提高外,還有一個極重要的內容,即如今以他的名字命名的“大數(shù)律”。大數(shù)律是關于(算術)平均值的定理,算術平均值,即若干個數(shù)X1、X2……Xn之和除以n,是最常用的一種統(tǒng)計方法,人們經常使用并深信不疑。但其理論根據(jù)何在,并不易講清楚,伯努利的大數(shù)律回答了這一問題。在某種程度上可以說,這個大數(shù)律是整個概率論最基本的規(guī)律之一,也是數(shù)理統(tǒng)計學的理論基石。
六、概率論的發(fā)展
概率論雖發(fā)端于賭博,但很快在現(xiàn)實生活中找到多方面的應用,首先是在人口、保險精算等方面,在其發(fā)展過程中出現(xiàn)了若干里程碑:《機遇的原理》,其第三版發(fā)表于1756年,法國大數(shù)學家拉普拉斯的《分析概率論》,發(fā)表于1812年,1933年蘇聯(lián)教學家柯爾莫哥洛夫完成了概率論的公理體系,在幾條簡潔的公理之下,發(fā)展出概率論整座的宏偉建筑,有如在歐幾里得公理體系之下發(fā)展出整部幾何。自那以來,概率論成長為現(xiàn)代數(shù)學的一個重要分支,使用了許多深刻和抽象的數(shù)學理論,在其影響下,數(shù)理統(tǒng)計的理論也日益向深化的方向發(fā)展。
特別是近幾十年來,隨著科技的蓬勃發(fā)展,概率論大量應用到國民經濟、工農業(yè)生產及各學科領域。許多興起的應用數(shù)學,如信息論、對策論、排隊論、控制論等,都是以概率論作為基礎的。
七、中學數(shù)學中概率與數(shù)理統(tǒng)計內容的處理
在當今信息社會中,無處不遇到受隨機影響的大量信息和數(shù)據(jù),需要人們去分析、處理,并作出明智決策。為此,各國紛紛把概率和統(tǒng)計列為中學數(shù)學的必修課程。我國的中學數(shù)學課程也為此作過長期的嘗試,在實踐過程中也經歷了一條不算短的曲折道路。新課標在認真分析和總結這些年的經驗和教訓的基礎上,對中學數(shù)學中概率與數(shù)理統(tǒng)計內容的處理提出了如下一些建議:
(1)隨機思想是認識隨機現(xiàn)象和統(tǒng)計規(guī)律的重要思想,統(tǒng)計思想主要體現(xiàn)在把握數(shù)據(jù)的能力,養(yǎng)成會用數(shù)據(jù)“說事”,收集數(shù)據(jù),整理數(shù)據(jù),分析數(shù)據(jù),從數(shù)據(jù)中提取信息,并利用這些信息說明問題,在這個過程中,形成對數(shù)據(jù)的敏感,養(yǎng)成會用數(shù)據(jù)“說事”的習慣。隨機思想滲透在統(tǒng)計的過程中,這兩部分內容聯(lián)系非常緊密,在中小學階段,統(tǒng)計的分量要更大一些。在高中階段,隨機思想和統(tǒng)計思想的介紹分為兩部分,在必修中,設計了概率初步和統(tǒng)計初步的內容;在選修1-2和選修2-2中,設計了統(tǒng)計案例;在選修2-3中,設計了對于概率的進一步理解,理解隨機變量和一些離散的隨機變量模型。
(2)必修的統(tǒng)計課程,我們希望學生對統(tǒng)計有一個初步的認識。希望學生通過案例體會統(tǒng)計的全過程:收集數(shù)據(jù)、利用圖表整理和分析數(shù)據(jù)、求出數(shù)據(jù)的數(shù)字特征、進行統(tǒng)計推斷。在這個過程中,進一步體會隨機思想和統(tǒng)計的重要性。
?。?)必修的概率課程,我們希望學生能夠通過對日常生活中的隨機現(xiàn)象,對概率的概念有一個較好的認識,例如,降水概率、彩票的中獎率等等隨機現(xiàn)象。通過古典概型和隨機模擬了解概率的意義和初步的應用。
?。?)在選修2-3中,我們能夠認識到分布列是描述隨機現(xiàn)象的規(guī)律。通過一些典型的分布列,例如二項分布、超幾何分布等,進一步體會概率在研究隨機現(xiàn)象中的作用。
?。?)在選修1-2和2-2中,介紹了幾種常見的統(tǒng)計案例。
?。?)隨機思想與傳統(tǒng)的數(shù)學思想有比較大的不同。有的方法看起來不難,但是理解起來還是有困難的,建議教師通過大量的具體案例來幫助學生理解。在統(tǒng)計課程中,案例教學是基本的教學模式,通過對案例的學習體會數(shù)據(jù)處理的過程和思想。
討論與思考:
1、數(shù)理統(tǒng)計學的起源是什么?
2、20世紀上半葉數(shù)理統(tǒng)計學迅猛發(fā)展的原因是什么?
3、概率論的起源是什么?
4、你認為應如何做好概率論與數(shù)理統(tǒng)計的教學?
聯(lián)系客服