女士品茶_读后感

《女士品茶》

读书心得

学 院: 国际学院 专 业 班 级: 国际金融113班 学 生 姓 名: 霍启超 学 号: 0114810

《女士品茶》读书心得

霍启超

江西财经大学国际学院国际金融专业

《女士品茶》是当代国际著名的统计学家大卫? 萨尔斯伯格的一部通俗的关于统计学原理的普及论著。本书以“女士品茶”的故事为开始,但却并非是一本女性读物或者关于品茶的书,而是以这位喝茶的英国女士的假设说法为起点,介绍并引出了近代数理统计的开创者费歇尔,以及费歇尔为解决类似问题而发明的实验设计法,并介绍了20世纪统计学的发展是如何变革了科学。全书总共29章,以时间、空间、事迹等相互穿插来讲述发生在统计这个世界里的事件,作者在书中提到的所有科学的学科调查与决策和统计之间的关联都是由一系列实例来说明的,他细数了二十世纪参与这场科学变革的代表性人物与事迹,通过生动有趣却不失严谨的实例论述了统计学原理,并使用大量的非专业语言通俗地阐述了统计学的基本概念和方法,不仅证明了统计学是一门最严格、最合理的认识论和方法学,还深刻地揭示了现代统计学发展的过程,特别是那些很深刻的理论,都是从一些非常简单实际的问题中发展起来的。在书中他平缓而幽默的叙述,让读者饱览统计学世界的风光,体验这一奇妙的认知之旅,并值得留待慢慢消化与回味,非常适合统计学入门学生和大众读者。读完本书,我有以下感受:

一、对20世纪统计学发展的了解

最初的统计学主要是在英国,而后才蔓延到世界。在这一过程中,英国浓厚的学习氛围为统计学的发展提供了肥沃的土壤,得以孕育一批又一批优秀的统计学家,发展出多元而丰富的学说。在19世纪,科学家们相信所发生的任何事情都预先地决定于两点:(1)宇宙的初始条件;(2)描绘其运动的数学公式。而对于预测值与观测值之间的差异。通通归为误差。相信只要实验数据越来越精确,这种误差是可以消除的。然而,到了19 世纪末,误差并没有消失,反倒是增加了。当测试越来越精确,误差也越来越多。机械宇宙观处于动摇之中,而统计模型作为一种新的范式在20世纪末期被科学家在各个领域越来越广泛地运用。相关、胜率、风险等统计术语也渗入到大众词汇中。年轻的费歇尔深入研究了女士品茶问题,并得出了惊人的结论。然而,这只是他丰富的统计学说的一小部分,

他对于实验设计的研究,同样为当代及后世的统计学家提供了借鉴。从对农业的研究,他得出结论:科学家需要从潜在试验结果的数据模型开始工作,这是一系列数据公式,其中一些符号代表试验中将被收集的数据,其它则代表试验的全部结果。科学家从试验数据开始,并计算与所考虑科学问题相应的结果。与费歇尔同样活跃在统计学界的K·皮尔逊,在老师高尔顿的引导下,在非常完整的意义上第一个规范地阐明了“相关系数”这个概念,发现了“偏斜分布”,而他的革命所留下来的则是这样一个观念:科学的对象并不是不可观测事物本身,而是数学分布函数,以描述与所观测事物相联系的概率。K·皮尔逊关于分布函数和参数的思想统治了20世纪的科学,并在21世纪仍保持着优势。另外,皮尔逊最伟大的成就之一就是创造出第一个“拟合优度检验”。在这一时期,他不断地深入探索,最终发明了假使优度检验,而这也为女士品茶这事件的判定起到了很好的辅助作用。随后,《生物期刊》问世,成了统计学界的权威刊物。戈赛特所写的一系列精彩的论文,几乎都是发表在该刊物上,包括著名的“学生的t检验”。这一时期也涌现出了大量杰出的统计学家,如蒂皮特、刚贝尔、耶日??在各个学说蓬勃发展的时候,难免产生出分歧与矛盾。最显著的莫过于费歇尔学派与皮尔逊学派的矛盾,两种统计观念的激烈碰撞。萨尔斯伯格把这种分歧的原因归结为哲学上的分歧,他这样写道:“哲学上的分歧使费歇尔与K·皮尔逊在研究统计分布的方法上分道扬镳。K·皮尔逊把统计分布视为对他所分析数据集合的真实描述。而按照费歇尔的观点,真实分布只是一个抽象的数学公式,搜集的数据只能用来估计这个真实分布的参数。”既然所有估计都有误差,那么费歇尔提出来的一些分析的手段,可以把这种误差的程度降到最低,或者可以更经常地得出比其他任何手段都更接近真实分布的答案。所以,在20世纪30年代,看上去是费歇尔在这场辩论中获胜了,但到了70年代,皮尔逊学派的观点东山再起。直到作者写作本书时,这两个学派的争论仍没有停止。所以统计学,抑或说科学的世界展示给我们的是它爱憎分明的一面,即使真理,也要经过质疑与检验。奈曼的置信区间也曾被人称为“置信诡计”,贝叶斯的贝叶斯定理被称为“贝叶斯异论”,挫折与磨难才能造就真理。正是在不断地对矛盾的探究与发现中,在人们不断地辩证与统一中,飞速地向前发展。

另外,在人才济济的20世纪统计学界,即使是在二战发生,学术饱受政治

干扰与破坏的这样艰苦的环境下,仍有许多统计学家和数学家为统计学发展孜孜不倦的辛勤付出,他们仍然坚持着自己的研究,决不向困难妥协。布利斯即使是在人心惶惶的列宁格勒也醉心于他的研究,斯堪的纳维亚地区、德国、法国和苏联的一批数学家则倾心于中心极限定理的研究,霍夫丁在白林创办了《德国数学》,随后威尔克斯、古达克、古德、加德纳、图基等一大批杰出的人物活跃在统计这一广阔的世界。他们高度的学术牺牲精神,令人肃然起敬。在第14章中,萨尔斯伯格称柯尔莫哥洛夫为“数学界的莫扎特”。柯尔莫哥洛夫凭借其惊人的数学才华,在数理统计与概率论方面留下了不朽的成就。他在思考了概率计算的本质之后,最后终于发现,求一个事件的概率完全就像求一个不规则形状的面积。他把新产生的数学测试理论应用到概率的计算上。有了这些工具,他就能定出一套公理,再用这些公理构建出整个概率理论。这就是柯尔莫哥洛夫的“概率论的公理化”,至今仍是学校中讲授概率论时采用的唯一方法。这种方法永久性地解决了有关概率计算有效性的所有问题。虽然柯尔莫哥洛夫和他的学生在概率和统计的数学理论上有重大的贡献,但随着20世纪30年代斯大林肃反运动的到来,苏联从这场统计革命中获益甚少,官方的观点制约了统计学的发展。 作为入门的著作,作者在每一次引入一个新的概念的时候都会有一定篇幅的背景介绍和相关奇闻异事,比如把女士品茶这个看似很简单并且从某些角度看起来仅仅是一个很无关重要的消遣的实验作为一个引子,并将这个例子作为一条线索贯穿了整本书,从第一章的纯粹的验证这位女士的结论是否正确开始,如何在这位女士没有区分能力的情况下设计实验让她无法仅凭猜测正确,如何在这位女士有区分能力的时候容忍区分出错的概率,比如十次重复实验之后区分对了九次的情况下是否值得我们相信这个女士是有区别能力。这些对于这个很简单的实验设计形象化了数理课中很多的概念化的东西,最大似然估计,假设检验,中心极限,大数定律。作者以非数学的语言描述出统计革命带来的基本哲学观念层面上的重大转变,并超越一般的观念介绍的层面而具体地展示给读者某些精彩的统计研究工作是如何进行的,就这个目的而言本书是确实达到了要求,它并未说清楚很多具体工作的基本思想,也就影响了读者对统计观念的全部力量所能理解的深度。作为一个没有系统学习过统计学的学生来说,虽然在很多的时候我不明白这些公式是怎么推出来的,也不知道这些变量是怎么求,怎么算,但能基本上明白

这些公式,这些变量的设置是要做什么用的。而书中对于真实世界的描述,我们所见的都是一个概率内发生的事情,“充满随即性的大自然里,真实性只存在分布函数之中”费歇尔大师把观测的现象认为是随即的映像,真正我们想把握的只是分布的四个参数。所以统计学具有广泛的研究领域,不论是农、工、理、文,艺,包括精算、农学、动物学、人类学、考古学、审计学、晶体学、人口统计学、牙医学、生态学、经济计量学、教育学、选举预测和策划、工程、流行病学等,几乎无所不包,甚至日常生活,几乎没有不用统计学的地方,自K·皮尔逊发现偏斜分布的100多年里,统计革命不仅扩展到大多数的科学领域中,而且其许多思想已经传播到一般的文化当中,统计是一种认知世界的方法。所以统计学是任何学科进行科学研究的工作母机,没有统计学就没有科学研究、没有创新 。现实是复杂的,是绝对不可能由一个有组织的科学模型来完全描述出来的。他认为科学就是试图模拟建立一个描述现实的模型,符合可用的数据,并且可以用来预测新实验的结果。因为没有任何一个模型是完全真实的,所以,数据越来越多,要求不断地配合新的发现去修正模型以修正对现实的认知。这样,模型因为带有特例的直觉上难以置信的延伸,变得越来越来复杂,最终,这个模型不再适用了。这时,有创新精神的人将会考虑建立一个全新的模型,一场新的革命在科学领域即将展开。统计革命就是模型变换的例子。用19世纪决定论的科学观,牛顿物理学已经成功地描述了行星、月球、小行星和彗星等天体的运动,运动都是遵守几个明确的运动和引力定律;在寻找化学规律方面也取得了一些成功;并且达尔文的自然选择学说为理解进化提供了有利的依据;甚至有些人试图将这种寻找科学规律的模型研究引入社会学、政治科学以及心理学等领域。 另外统计学不仅是科学的研究方法,还是管理工作的工具。任何科学都是研究客观规律的,规律可以在反复试验中重复,而没有重复的事物不是科学研究的对象。我们周围的事物每天都在重复,太阳每天东升西落,春夏秋冬四季更替,宏观经济每天运行,只有运行、重复,才有规律。但人不能两次踏入同一条河,事物的每一次重复决不是前一次的克隆。统计学就是变化中研究规律的科学。而统计学政治家无法脱离统计而施政,军事家无法脱离信息而指挥,企业家无法脱离统计而决策,任何管理工作都要做到心中有数。学好统计,是搞好任何工作的前提。日常生活中也充满着统计的科学与艺术,所以需要学习统计。

二、对统计学的认识

统计学是一门研究数据的科学,任务是如何有效地收集、整理、和分析这些数据,探索数据内在的数量规律性,对所观察的现象做出推断或预测,直到为采取决策提供依据。统计数据的收集是取得统计数据的过程,它是进行统计分析的基础。离开了统计数据,统计方法就失去了用武之地。统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。数据整理是介于数据收集与数据分析之间的一个必要环节。在收集和整理数据后,特别需要认清数据自身特点对其进行分析。统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程: 第一,弄清楚要分析的数据属于什么类型。是连续型,还是非连续型?对于连续型数值,均值具有实际意义,对于非连续性的数值,均值并不具备实际意义,而是频数,百分比才有意义,所以,数据属于连续型时,适用比较均值的显著性检验,若是非连续型的级数类,则适用比较频数、比例的检验方法;其实,数据也可以根据不同情况进行灵活处理,例如:对于满意度的衡量,可以根据不同的需求看为连续型分值,也可以看为几个等级的级数;第二,需要了解样本数据的分布特点,弄清楚样本数据是否服从某一分布,对于分布明确的,可以采用参数检验,而不清楚分布情况的则可以采用非参数检验法;第三,判断要检验差异的两组样本的关系,属于独立样本,还是属于配对样本。独立样本即指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本,样本之间相互独立;而配对样本可以是同一个体在前后两种状态下某种属性的两种状态,也可以是对某事物两个不同侧面或方面的描述,两样本不是相互独立,而是具有相关性。比如《女士品茶》第17章“当部分优于总体时” 中提到: 1937 年,政府想得到有关失业率的准确数据,要在全国进行有史以来第一次严肃的随机调查,同时国会授权在1937 年进行失业普查。国会通过了议案,号召失业者填写登记卡,送到当地的邮局。那时,全国失业人口数估计在300万到1500万之间,依据对整个调查所作的规划设计,普查局从邮递线路中随机选取2%,然而,即使按2%的比例抽样,普查局也被这样大量的调查问卷难住了:美国邮政服务局曾计划帮他们把问卷分类整理,并制作了一些原始的表格。问卷在最初设计时,还希望收集被调查人口统计和工作经历的详细资料,但是没有人知道该如何来处理这么大量的详细

信息。因为那时根本没有电脑,除了用“铅笔+纸张”绘制的表格之外,唯一可指望的就是手动的机械计算器。于是,他们与耶日·奈曼取得了联系,奈曼指出,“我们不必知道或去探讨所有的细节,也不必弄清具体的关系如何”,只需为最重要的问题找到答案就行了。采纳了奈曼的建议,他们抛弃了问卷中复杂而令人困惑的细节,只计算失业的人数。并且普查局作了一系列细致的分析,证实这种随机小样本调查的结论比起以前所用的判断样本要精确得多。抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。而相对于抽样调查,普查工作量大,花费大,组织工作复杂;其调查内容有限,易产生重复和遗漏现象;且由于工作量大而可能导致调查的精确度下降,调查质量不易控制。所以在现实生活中,抽样调查的优越性是全面调查无法比拟的:一是质量性高。可集中力量做深入细致调查并提高调查质量。还可用于只能观察局部单位的调查,如产品的破坏性质量检查,农作物全面成熟前的产量实割实测等;二是经济性好。只调查部分单位(如5%,1%,1? 等),可节约大量人力、物力和费用开支;三是时效性强。可大大缩短调查和整理时间,较快取得调查结果;四是适应面广。在社会经济统计中,抽样调查日益得到广泛应用,如人口普查的事后质量检查,生育率调查,农产量调查,职工和农民家计调查等;五是能够解决全面调查无法或困难解决的问题。如补充和订正全面调查的结果,应用于生产过程中产品质量的检查和控制,用于对总体的某种假设进行检验等等。在本书第11章“假设检验”中曾提到:“K·皮尔逊常常利用他的卡方拟合优度检验来‘证明’某些数据符合某些特定的分布。在费歇尔把更精确的方法引入到数理统计之后,K·皮尔逊的方法就不再为人接受了。但问题仍然存在。为了知道应该估计哪些参数,为了确定这些参数与所研究的科学问题之间有何关系,我们必须假设该数据符合某一特定的分布。统计学家们常常会利用显著性检验来证明数据符合何种分布。”在实际操作中,由于人力、物力、时间等问题,一般都用抽样调查的方法抽取一定数量的具有代表性的群体,得出样本数据来进行研究,并对总体特征进行统计推断,在这里面就会存在两个问题,一是样本的特征数量能否反映总体特征?二是两种不同的样本的数量标志参数是否存在差异?只有

解决这两个问题,才能正确的推断总体特征,也才能找出不同特征群体的需求差异,这就需要统计学中的显著性检验来解决。显著性检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。 用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。假设检验是除参数估计之外的另一类重要的统计推断问题。它的基本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。

由于显著性检验的功能在数据分析中的重大作用,显著性检验得到了广泛的应用。然而在应用之前,首先了解各检验方法的适用范围及其特点是正确使用检验方法的基本前提。许多统计检验方法的应用对总体有特殊的要求,如t检验要求总体符合正态分布,F检验要求误差呈正态分布且各组方差整齐等等。这些常用来估计或检验总体参数的方法,统称为参数统计。许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统计,相应的,统计检验总体分为参数检验和非参数检验。在选择参数与非参数检验时,首要考虑是数据的分布情况,能确定分布类型的,则可适当选用参数检验,参数检验主要包括包含的方法有:单样本T检验、两独立样本T检验、两配对样本T检验;非参数由于不限制分布,统计方法简便,适用性强,但检验效率较低,应用时应适当加以考虑,非参数检验主要涉及单样本、两独立样本、两配对样本、多独立样本、多配对样本五个方面的非参数检验。不同的检验方法,比较的统计量是不同的。T检验等检验方法都是比较均值;卡方检验、K-S检验等比较频数;曼-惠特尼U检验等是对秩进行比较;符号检验法比较的是前后变化差值的符号。因此,只有了解各检验方法的基本思想及特点,才能正确选取适当的检验方法。其

次,认清研究目的。研究目的是调研中一切实务的根本出发点,做数据分析时同样首要考虑的是研究目的,研究目的也是数据分析的方向,但此时研究目的需要细化,具体到要通过哪些数据,得到什么信息,取得何种结果。例如:希望通过对消费者购买哪些品牌的数据来得出市场占有率的信息。 具体的实际应用中,灵活运用检验方法是关键。 检验方法虽然有各自特点和适用范围,但是可以对数据做稍微的处理、变化,或是换个角度分析,便可运用不同的检验方法;且各方法有适用范围,当然也有它的局限性,有时需要多种检验方法配合使用,相互补充,才能充分地挖掘信息。例如:独立样本T检验法判断AB产品对于抗过敏的功效评价在均值上是否有差异,而卡方检验可判断他们在各评价水平上的分布有无差异,假如判断出他们功效水平无差异之后,我们还想知道他们到底是同样的好还是同样的差,这时可以再使用单样本T 检验对与均值评价水平相近的满意度水平进行差异性检验来进行定位。此外,我们还需要合理解释检验结果。不仅要正确识别检验结果,还需要结合原始数据及实际意义,并针对研究目的来分析说明。

在统计模型的数学和技术层次之外,本书花费了大量心血来表达统计革命的观念和世界图景的新思考。这方面贝叶斯层次模型对理解统计观念十分重要:理论实体是统计分布,这是变化和影响的基本实体。而理论实体是实际不能直接测量的,我们只能得到它的尽可能好的估计值。作者在本书中当然默认了实在论的认识前提,集中在作者对于物理学实验和物理学理论工作模式的理解。比如作者对混沌理论的批评,他认为混沌依然是决定论的产物,在现实中他更相信统计模型。物理学是很多套数学模型,有确定性的,如牛顿经典力学体系;有概率特征的,如量子理论。用哪个模型来描述问题完全看问题处于哪个层次从而导致问题的哪个方面更为主要从而决定使用哪个模型来进行描述。混沌理论最初是在经典力学模型中发现的内在随机性,是经典力学模型的内在性质。而后来的发展又在随机性的量子理论模型中发现了量子混沌现象,混沌不是一个理论模型,而是模型的性质,决定论的模型和随机性的模型都会出现,如果认为量子理论是随机性的模型的话。但是我认为,按照统计革命的思想,量子理论算不上随机性的模型,这个比较深层的疑问,也许后面会再谈到。所以作者关于混沌的评论和将其与统计模型的比较本身就是不适当的。混沌理论与随机性相关的另一个问题在我看来

始终是一个困惑,即多体系统的随机性与少体系统的随机性本质上如何区别,多体系统比如阿伏伽德罗常数个分子的统计行为,是统计力学处理的对象。在这种情形即使个体的行为可以精确追踪也是没有意义的,理论不需要对个体的了解,只需要大数统计行为就可以预言系统的宏观性质。在经济社会系统里统计模型的大量应用就是源于这些系统是天生的多体系统,社会学经济学等社会科学的困难尤其是应用物理学方法进行研究的困难正在于此,物理学分析多体问题的方法还不够。处理大数问题,自然要用统计,但是对于少体系统的内在随机性问题就是另一种机制了,在三体问题牛顿方程组中混沌现象的发现是一种全新的模式——高度非线性的效应,而不是大数效应导致的随机性。但是这两种机制不同的随机性的数学描述,应该完全有可能统一进行。本书涉及到许多统计观念在现实问题中应用的例子,或者说是在用统计模型处理现实问题中引起困惑的观念问题。比如对统计相关性的理解。最著名的例子是费歇尔对吸烟与肺癌关系的统计分析所持的态度。他认为吸烟与肺癌有关的统计分析都是站不住脚的,从分析的角度看,他的天才是令人惊异的,统计相关性一直受人诟病,原因一方面在于作者多次提到的大部分使用统计方法的人实际上并不真正理解统计方法的思想,误用和死板硬套的情况普遍存在;另一方面也在于统计相关性的结论与因果性的关联之间存在问题。既非充分也非必要的统计相关性意味着什么,为什么人们还是需要因果性的追寻?另外关于统计模型本性的思考,最重要的问题我认为有两个,一个是为什么它这么重要,竟能形成一个庞大的学科,这个学科的地位究竟又如何。这个问题我的理解是因为20世纪以来多体模型被普遍研究,自然需要统计学方法。作为一个学科是没有必要的,只是数学模式的一种,借由广泛的应用才如此受人热捧,这样就消解了似乎笼罩在它头上神圣的光环。这个问题很简单,是一个社会学的问题,只是有些内行学者喜欢抬高自己工作的意义,而很多外行也不懂,被一些富有煽动性的书籍和炙热的感情迷惑了。另一个问题是真的问题,一个科学和思辨的问题:统计相关性与因果相关性的关系。传统的理解,包括本书中许多统计学家也持这种观点,即认为统计相关性是唯象的,在得到统计相关之后还需要进一步分析因果性,是什么因素导致了统计相关。如果持有这个观点,很难说是真正理解了统计革命。因果性是还原论,决定论思维的特征。一个弱化的版本是统计相关与因果相关的融合——只存在统计意义上的因果性。这依然是一种

经典的思维模式,可不可能本来就不存在因果性,本质上就是统计相关性?或者更学术的表述应该是是不是统计相关性是更不建构的东西?我本人倾向于做这种理解并寻找支持这种理解的东西,不去做因果性的分析,因为那本来就没有根本的意义。另外一种可能是统计相关和因果相关是两种并行的事物之间相关的模式,但这似乎不大可能。在这一问题的基础上,我想是不是可以借由进一步的统计理解来推进突破还原论决定论的思维。如何才能学会整体论的思维呢?自然界在哪里可以给我们提供一些启示?本书除了费歇尔以外作者最推崇的天才就是柯尔莫哥洛夫和约翰图克,前者的广博才华人所共知,而后者是不可思议的高效和深刻结合的天才,强烈的好奇心和难以抑制的原创冲动。他思考了一个看起来只能存在于哲学思辨中的问题:人类思维倾向于发现模式,那么在多大程度上可以用倾向于模式的目光去检验数据,此基础上发展出探索性数据分析这一套方法。作者在书的最后一章里提出了一些很困难的有关统计和概率的哲学问题,统计可以脱离概率理论吗?概率在现实生活中是什么意义?统计理论的内在一致性问题等。作者曾说:在现代世界观的基本假设中,哪些可能在500年后看起来是很荒谬的?

三、感悟与总结 读完《女士品茶》,我大致了解统计学发展的来龙去脉,也让我知道为何要学统计学的原由,它不仅解除我心中对这些统计工具在应用上的疑问,而且极大的增加了我学习统计的兴趣与决心。它让我对统计的感觉不再那样僵化,是值得我在学习统计边学边看的好书。对于大多数本书读者,即统计学的外行来讲,本书最大的特色在于一直从问题出发,这也是统计学强大生命力和吸引力以及面临巨大困难挑战的所在。对学术知识不扎实的人来说,对书中所讲的公理化体系并不感到浓烈的兴趣,说概率是一种非负规范的测度对于很多人来讲并没有什么意义。更多人感兴趣的是统计学的广泛应用,正如前面谈到的那样,统计涉及的领域几乎无处不在。费歇尔在农场里倒弄统计,计量农作物与气候,雨量,杀虫剂,肥料之间的关系,在发表了《研究工作者的统计方法》这一系列举世著名的论文的同时,也改善了农业生产。戈赛特先生在吉尼斯酿造公司这样的化学企业,通过解决测量在麦芽浆发酵是其所用的酵母数量,确定了泊松分布在现实生活中的实例和统计分布新观念的应用,当然也解决了该公司生产上的一个重大问题。蒂

皮特在投身棉花工业研究协会之后,为找出最脆弱的纤维强度,发现了极致分度也找出了最脆弱的纤维强度,提高了棉花的产量。书中还提到许多的统计学的数理统计的运用,例如,统计应用于医学来找出同一种药物的剂量对人的反应 , 改善药物研究进行控制和提取新产品测试的方法;应用于第二次世界大战 , 来测量哪种毒气对敌人有影响;对窃听来情报的情报进行解码,应用逻辑和数学模型来解决用远程轰炸机对付潜艇的最佳使用方案,为防空武器提供设计表,决定靠近前线的军火补给站的最佳选址,甚至还要解决军队的食物补给问题,并由此产生了一门新的学科----运筹学;战争之后,由数理统计衍生而来的运筹学应用到了商业上,解决了诸如找出仓库与销售部门之间的最优关系,均衡有限资源,改进生产和提高产量等商务问题。还有比如书中介绍的:署名有争议的文章原作者的鉴定方法;划分国民经济的不同部门用矩阵模型来进行投入—产出分析;吸烟与肺癌到底是什么关系?无确定病原体的传染病与生活习惯的关系;人类活动与生物圈破坏,臭氧空洞等问题;百年一遇的洪水如何进行统计模型的预测?小样本如何有效估计总体分布的参数?监狱犯人释放后重犯率与刑期长短的关系的统计数据明显的正相关如何分析?公共住宅是否影响低收入人群的社会态度?像癌症这种性命攸关的疾病不可能随机分配治疗方案来进行随机化试验以研究新方法的疗效,这时如何办?这无穷无尽的问题出现在经济学,社会学,医药学,物理学,管理学等几乎所有科学领域,一方面让人不禁思考统计模型的本性,另一方面正是在这些问题的研究当中人们对统计模型数学和技术方面的理解日益加深,不断意识到原有理论方法的不足。对这些问题的兴趣和困惑才导致对统计学的兴趣,问题无处不在,但是有多少人意识到了?看过这本书之前,会去思索这些问题吗?更多时还是笑一笑说太复杂了。天才的一个显著特征即是进行长期连续的高强度深度心智活动,对于愚笨的人,生命没有问题。它使我充分认识到:环境愈不确定,统计的应用更显得格外重要!因此,学会统计并学会运用统计,可以使人更好地组织生活,谋划人生。而当今,正在飞速发展的中国,如果将统计概念更加普遍的运用于各个专业领域 , 中国的发展必将更加迅速。

此外,本书中介绍了许多数学和统计大师们的传奇与故事。他们的共同点除了对世界拥有巨大的贡献的之外,还有一点那就是不论处于怎样艰苦的条件,亦或怎样的巅峰,他们都始终忠于自己的一生都在追寻着的兴趣与事业。比如贯穿

全书的大师费歇尔,在以皮尔逊领导下的整个统计界不认同他的时候,他丝毫没有气馁,反而是通过不懈的研究,发表具有革命意义的论文,最终赢得了数理统计学界的认可与尊重,最终成为一代大师。只有一生的勤勤恳恳,才能造就辉煌。有的人是从小就在数理统计方面表现出非凡的才能,如俄国数学家柯尔莫哥洛夫在5岁的时候就提出了他的第一个数学发现;古德在10岁的时候就发现了2的平方根是无理数以及“佩尔方程式”的问题的解。也有的人是后天才转而对这方面产生了兴趣,例如费歇尔的女婿乔治。博克斯是在第二次世界大战的化学防御试验室又有工作的需要才开始接触,学习,最后喜欢上统计学,并以之为终生事业;布利斯起初感兴趣的是对生物学,由于参加了杀虫剂的实验,但是受到许多没法控制变量的干扰,在学习了费歇尔的《研究工作者的统计方法》之后,才对数理统计产生浓厚的兴趣,并在此基础上发明了一种称之为“概率”单位分析的方法。无论是上面提到的哪一类型人,他们的脚步始终追随着自己的兴趣与兴趣。人们常说,兴趣就是最好的老师。这句话一点都不假。

但是,如果想提高自己的统计学能力,阅读这本书是远远不够的。而且我相信如果还有机会和时间的话还会很认真的去读第二遍。这本书不仅仅是能让我明白为什么会有统计,哪些时候我是可以用到统计学的,还让我认识到统计是人类认知世界的重要方法,如何将统计知识深入浅出的应用到现实中是多么重要。

相关推荐