标签:
統計是初產生於研究對國家,特別是對其經濟以及人口的描述。當時現代數學尚未形成。因此那時的統計史基本上是經濟史的範疇。現代統計主要起源於研究總體(population),變差(variation)和簡化數據(reduction of data)。
第一個經典文獻屬於John Graunt(1620-1674),其具有技巧的分析指出了把一些龐雜、令人糊塗的數據化簡為幾個說明問題的表格的價值。他注意到在非瘟疫時期,一個大城市每年死亡數有統計規律,而且出生兒的性別比為1.08,即每生13個女孩就有14個男孩。大城市的死亡率比農村地區要高。在考慮了已知原因的死亡及不知死亡年齡的情況下, Graunt估計出了六歲之前兒童的死亡率,並相當合理地估計出了母親的死亡率為1.5%。因此,他從雜亂無章的材料中得出了重要的結論。他還給出了一個新的生命表。
Edmond Halley(哈雷)(1656-1742)利用了Breslau的記有死亡年齡的數據,改進了Graunt的生命表並引進了死亡率的定義。
瑞士數學家 Leonhard Euler(歐拉)(1717-1783)提出了平穩生命表的概念。
Joha De Witt(1625-1672)等人最早討論退休金和人壽保險的方案。
ThomasRobert MalthuS(馬爾薩斯)(1766-1834),Alfred James Lotke(1881-1949),Ronald Aylmer Fisher(費歇)(189l-l962),及William Feller(費勒)(1906-1970)等人用漸趨複雜的數學來研究生命表的理論,這對人類及其它總體的動力學描述具有顯著意義。
William Petty(1623-1687)是Graunt同時代的經濟學家及朋友。他認為需要建立中央統計部來利用人口統計學的知識;由行政區利用列出記錄年齡,性別,婚姻狀況等細節的記錄表格來收集數據;要有出生,死亡,婚姻,收入,教育和商業等方面的統計數據。 當時在研究諸如死亡等時間序列時,Graunt注意到了隨機的起伏;但他僅以機械的術語加以描述一把這些與鐘錶運動的忽動忽停相聯繫。實際上,這種不規則的變化也影響賭博和天文學。因此,其後進一步導致了隨機誤差的誤差分布概念的出現。
賭博產生了第一個機會事件的模型:如果硬幣就骰子的每一面都有相同概率,則導致估計拋一個均衡的硬幣所出現的正面次數或挪一個均衡的骰子的總點數。
更一般地,Abrahamde Moivre(棣美佛)(1667-1754)導出了對二項分布的一個近似;這使每一個概率都等於正態曲線下的一塊面積,這是一種的中心極限定理。
Pierre simon Laplace(拉普拉斯)(1749-1827)導出了對男子出生比例的類似的漸近公式。
Jacob Bemonlli(伯努利)(1664-1705)以弱大數定律支持了對大樣本均值的使用。
Thomas simpson(辛普森)(1710-1761)計算了同分布隨機變數和的精確分布,同樣也支持了對大樣本均值的使用。 在天文學中,要對一些運動星體位置的未知參數進行估計,通常某種意義上「最好的」估計都是來源於一些註定不和諧的觀察值,因為只要觀察值在數量上超過參數,就會產生度量誤差。
Roger Cotes(1682-1716),Thomas Bayes(貝葉斯)(1702-1761),Euler,Johnson Tobias Mayer(1723-1762),Rudger Josif Boskovic(1711-1787),Laplace和Adrien MarieLegendre(勒讓德)(1752-1833)都在研究這個問題。後來被Friedrich Gauss(高斯)(1777-1855)解決。John Michell(米歇爾)(1724-1793)用統計方法證明了雙星的存在。
然而,認定現代統計理論是由精算科學,人口學和天文學的需要而發展來的觀點是不正確的;事實上,它是由心理學,醫學,人體測量學,遺傳學和農業的需要發展出來的。 直到1830年,幾乎所有的經驗分布都是關於一維誤差或一個非數值變數。
在1830年之後,天文學家和社會學家 Adolphe Jacques Quetelet(1796-1874)使得諸如身高體重之類的度量值的變數的經驗分布通俗化。他在生物統計研究中大量利用了理論二項分布和正太分布。
後來 Ladislaus von Bortkiewicz(1868-1931)報告了在普魯士兵團中由馬踢造成的受傷事故,發現Poisson(普阿松)分布和官方統計學有關。在計算血紅細胞數目上,Poisson分布也被Ernst Ahbe(184O-1905)所用。從那時起,該分布被大量地用於計數的試驗中,比如閃光的計數。
在生物學上,統計方法使得 JOhann Gregor Mendel(孟德爾)(1822-1884)認識到某些主要遺傳基因的存在,它們在0,l和2三個水平顯現,其中水平0(雙隱性)能和水平1和2區別開來。他能確定有相同或不相同的水平的個體之間交配的結果,而且提出了某些生物學事件等價干擲一個硬幣的模型;他能對任意交配的結果給出概率並用實驗來驗證其假設。
雖然經濟學沒有產生超出用初等理論來求解問題,但在較早的醫學統計中卻產生了有意思的問題。 Philippe Pinel(1745-1826)和 Pierre Charles alexandre Louis(1787-1872)開始了建立疾病分類的困難
課題;這些工作人員保存了精確和完整的所有病例的記錄,並且能給出和預後有關的統計數字。Louis能有利用跟蹤調查的方法反駁了當時廣泛濫用的放血療法。他的三個學生是值得一提的:Jules Gavarret(1808-1890)寫了一本醫學統計的教科書;書中有應用 Simeon-Denis Poisson(178O-1840)理論來對兩個比例進行檢驗的許多應用; Oliver Wendell Holmes(1819-1894)和他的不知名的數學顧問對一系列分娩熱病例給出了有趣的分析,證明該病是傳染的,這優於任何十九世紀的類似研究;William Farr(1807-1883)在官方統計學中建立了新的慣例。 更直接的原動力來自於遺傳學(確切地說是優生學)。
Francis Galton(1822一19ll)在 1886 年研究了兩代豌豆重量之間的
相關時發現了Y關於一個正態變數X的線性回歸及類似於橢圓的等概率線;由此 James douglas Hamilton dickson(1849-1931)導出了密度與exp(-1/2 x*TAx)成比例的聯合正態形式;按標準記號,x*TAx應為x+(y一ρxx)/(1-ρρ).ρ為y對x的回歸直線的斜率。從此,多元正態分布就經常出現在文獻之中;而兩個和三個變數的正態分布在Laplace 時就已經知道了。該聯合分布能夠由互相獨立的正態隨機變數的線性變換而構造,例如 Giovanni Antonio amedeo Plana(1781-1863)和 lrenee-Jules Bravais(1811-1863)所做,而且,反過來它能分解為互相獨立的正整隨機變數的積,如Auguste Bravais(1811 -1865)和 Ire-nee-Jules Bravais(1811- 1863)所做。
Idsaac odhunter(1820- 1884)在最小二乘理論上導出了一般形式的多元正態分布,即exp(-xTAx)乘以一個常數;Arthur Cayley(1821-1895)把 xTAx化簡為平方和並確定了該常數值。這些人都未對 A-1=v的非對角線元素感興趣,這裡 v是協方差矩陣。Galton後來說"這些誤差或偏差正是我想要研究並了解的。」 正態分布在理論統計中扮演了一個非常重要角色。有許多理由來說明這一點;一般來說成果一個模型包含著正態分布的幾個非平凡特性,則它必須具備所有的特性。
在 1895年,Karl Pearson(皮爾森)(1857-1936)認識到對更理論的統計分布的需要,並且得到作為微分方(Pearson方程組)解的密度函數;和另外一些統計學家一樣,Andrei andree-viC Markov(馬爾科夫)(1856-1922)不願用 Pearson分布方程組,因為即使得了皮爾森τ曲線作為一個極限分布,也沒有明顯的模型來產生它們。
Markov進一步證明Pearson xx統計量為樣本尺寸乘以Wihelm Hector Richard albrcht Lexis(1837-1914)的離散係數。 Walter Frank, Raphael Weldon(1860-1906)利用取獨立初第二項變數和的方法得到二項變數的聯合分布。
許多作者,比如 Alexander Claig Aitken(1895-1967),已經參與了發展該思想;但是許多其它思想已經被用來獲得聯合分布。在 Karl Pearson的方法不能產生更多的聯合分布之後,Sergei Natanovic Bernstein(1880-1968)認為一個更具有生產價值的方法可能存在於隨機過程的領域中。
FineReport報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel。官網:http://www.finereport.com/tw/
标签:
原文地址:http://www.cnblogs.com/reportingtool/p/4276114.html