数理统计学习心得

数理统计学习心得

现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体甚至是无限总体的数量特征。例如民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比例如何?等等。这时只靠部分数据的描述是无法获得总体特征的知识。我们利用统计推断的方法来解决。所谓统计推断就是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断可以用于总体数量特征的估计,也可以用于对总体某些假设的检验,所以又有不同的推断方法,下面就参数估计和假设检验的基本概念及原理简单谈谈。

参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。参数估计包括点估计和区间估计两种方法。

点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。构造点估计常用的方法是:①矩估计法。用样本矩估计总体矩,如用样本均值估计总体均值。②最大似然估计法。于19xx年由英国统计学家R.A.费希尔提出,利用样本分布密度构造似然函数来求出参数的最大似然估计。③最小二乘法。主要用于线性统计模型中的参数估计问题。④贝叶斯估计法。基于贝叶斯学派(见贝叶斯统计)的观点而提出的估计法。

区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。19xx年统计学家J.奈曼创立了一种严格的区间估计理论。求置信区间常用的三种方法:①利用已知的抽样分布。②利用区间估计与假设检验的联系。③利用大样本理论。

假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样

本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。 假设检验的一般步骤

1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。H0:样本与总体或样本与样本间的差异是由抽样误差引起的; H1:样本与总体或样本与样本间存在本质差异; 预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。

2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。

3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

假设检验应注意的问题

1、做假设检验之前,应注意资料本身是否有可比性。

2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。 回归分析:应用数学的方法,通过对大量的试验数据进行处理和分析,从而得出正确的反映变量之间的相互关系的数学表达式,并判断其有效性。进而根据表达式,根据一些变量的取值去预测或控制另一变量的变化,并分析这些变量对另一变量的影响程度。(强调的是数学模型的建立,且用F检验验证所有自变量与因变量的显著性。用T检验验证模型中每个自变量单独与因变量的影响显著性。)

相关分析:在统计分析中,对两个及两个以上变量间数量关系的性质、特点、表现形式进行描述、处理的一种专门的统计分析技术。变量之间的不严格、不准确、不稳定的数量依存关系被称为相关关系,相关关系的强弱、疏密、因环境、时间的变化而呈现出一种独特的规律性。相关分析的目的就是探索相关关系的变动规律,并利用相关分析的结果,为回归分析及统计决策提供有力的依据。

相关系数只能描述变量间的关系密切程度,不能揭示现象间的本质联系。 相关系数:随机向量的各个变量之间线性关系的密切程度。

多重共线问题:当自变量之间存在一定程度的关联,即相关系数在0和1之间时,回归模型中的自变量就会削弱各自对因变量的影响,在一定程度上影响参数估计值的准确性和稳定性。

对多重共线问题的测度:

1,自变量的容忍度,以容许度指标表示。容许度=1-R平方。容许度越大,说明某个自变量X与方程中的其他自变量之间的线性关系越弱,多重共线性较低。反之,容许度接近0,说明某个自变量X与方程中的其他自变量之间的线性关系较强,多重共线性较高,应将此自变量剔除出模型。

2,方差膨胀因子。方差膨胀因子是容许度的倒数,其数值越大,说明自变量之间的多重共线越高。

3,D-W检验。检验模型中的误差项是否存在自相关的一种有效方法。D在0-4之间。D=2,残差之间独立。D<2,残差之间正相关。D>2,残差之间负相关。根据经验,D∈(1.5,2.5)之间表示没有显著自相关问题。

自变量:我们将变量中的原因变量称为自变量,即不受其他因素影响而发生变化在前的变量。

因变量:结果变量,受自变量变化影响而跟着发生变化的变量。

线性回归模型:是线性模型中的一种,变量之间的关系呈线性关系,数学基础是回归分析。(用回归分析方法建立的,变量之间的关系呈线性关系,用以揭示经济现象中的因果关系的模型)。

事件分析法:主要是分析某事件对于社会经济生活是否确实有冲击作用。需要首先界定事件发生作用的时间段,即事件窗口,然后通过事件窗口超额收益的大小来衡量事件的影响。所谓超额收益是指实际收益与假设发生该事件的期望收益之差,而期望收益是由计量经济模型计算。

事件窗口即为事件期。

配对T检验主要解决配对样本数据的两个总体均值有否显著差异的问题。主要解决来自配对样本数据的两个总体均值有否显著差异的问题。所谓配对样本,通常是指对同一观察对象在使用某种新方法前后的两组数据进行比照,用两组数据

的均值,有否显著差异来判断这种新方法的有效性。配对样本的T检验对数据的要求:1,抽取样本数据的两个总体必须服从正态分布。2,两个样本的样本容量相同。

显著性水平:假设检验中,常有=0.05,=0.01作为检验的显著水平。显著性水平是指当原假设为真时人们拒绝它的概率,亦称拒真概率。根据假设检验的原理,拒真概率应是一个小概率事件。如果在检验中发现用样本数据计算出来的实际概率小于或等于事先给定显著性水平(p≦),就可以认为这个在一次试验中不应该发生的更小概率,居然在一次试验中发生了,我们有理由怀疑原假设的真实性,所以拒绝原假设。(p>),接受原假设。 学习到连续型随机变量时已经与高中学习的相差很大,对连续型随机变量求其在去某值时的概率是无意义的,只能求变量落在某一范围内的概率。因为现实生活中的事件大多受到两个或多个因素影响,很多随机现象中,往往要涉及到多个随机变量,而且这些随机变量之间存在某种联系,因此多维随机变量的知识在生活中应用更广。随机变量的概率密度与分布直接反映出随机变量的分布情况,随机变量的数学期望,方差等在生活中可以帮助人们做出选择。比如大赛前选拔选手才赛,对某产品的质量估计等。

当一些随机变量的分布不易求出或不需要知道随机变量的概率分布,而只需要知道其数学期望,方差即可知道其大概分布情况。随机变量的数学期望反映了随机变量取值的平均值,而随机变量的方差反映了随机变量离开其平均值的平均偏离大小,反映了随机变量的稳定性。

学好数理统计这门课程,其实有很大的作用,它会让人对日常生活中一些涉及概率方面的问题有更加深刻的体会。如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。

 

第二篇:[原创]概率论与数理统计的学习心得1

概率论与数理统计的学习心得

步入大二,我们开始学习『概率论与数理统计』这门课程。如名称所述,课程内容分为两部分:概率论和数理统计。这两部分是有着紧密联系的。在概率论中,我们研究的随机变量,都是在假定分布已知的情况下研究它的性质和特点;而在数理统计中,实在随机变量分布未知的前提下通过对所研究的随机变量进行重复独立的观察,并对观察值对这些数据进行分析,从而对所研究的随机变量的分布做出推断。因此,概率论可以说是数理统计的基础。在长达一个学期的学习中,我增长了不少课程知识,同时也获得了不少对于学习数学这门课程的体会。

一、 课程的价值及作用

概率论与数理统计是一门在大学数学中极为重要的课程。以我个人的理解,如果说微积分、线性代数只是分析数学、或是说解题的工具,那么概率论才是真正把实际问题转换为数学问题的学问,因为它解决的并非纯数学问题,不是给你一个命题让你去解决,而恰恰是让你去构思命题,进而构建模型来想方设法解决实际问题。假设检验就是一个典型的例子,要解决问题,你要先建立假设,还要估计总体的分布,如果是大样本问题,可以近似看作正态分布……学习概率论和数理统计,我很大的一个感受就是和实际问题联系很紧密,对问题需要有更深层次的思考,因而学起来也比微积分和线代更吃力。 在大学中,概率论与数理统计是理工科及经管类学科的必修课之一,因其与生活实践和科学试验有着非常紧密的联系,而且是许多新

发展的前沿学科(如信息论、人工智能等)的基础。若能掌握好概率的思想和数理统计的方法,对将来解决各种专业性的问题(如金融业的风险预测、企业的产品检验及天气预报等),都能起到不可估量的作用。

通过学习这门课程,我们还可以更理性的对待生活中的一些问题。比如通过计算某些赌博赢钱机会的概率可以发现,庄家和赌博者之间看似平等,但综合对赌场的熟悉情况、出牌规定等因素,实际上庄家占有某种优势。懂得这个道理,作为赌博者就应怀有平常心,押宝不能押太大,对输赢也不要过于介怀。

二、 概率论与数理统计和生活中实际问题的联系

概率论与数理统计这门课程在现实生活中有着广泛的运用。在课堂上,老师就经常举统计成绩的例子。要衡量一个班级期末成绩的好坏,严格上来说仅看平均分是远远不够的,因为从平均分中我们无法得知分数段、不知道分数的波动有多大;光拿平均分作为比较两个班成绩优劣的标准也是不够完善的,也许A班的表现比较平均,都是中等偏上,而B班有好几个不合格,但由于有几个同学拿了很高的分数,结果反而平均分比A班还要高,难道我们能就此断言B班要优秀一点吗?再比如说像套圈、射击这种只要命中目标就能拿到奖品的游戏,乍一看似乎简单又划算,但事实上由于游戏条件比较苛刻,要在有限的次数中击中目标是个小概率事件,因此店主才能那么悠闲的任你玩。其他方面还可以举出很多例子,比如国家作一次人口普查、企业做产品满意程度调查、天气质量检测就需要充分地用到数理统计的方

法,拿到一组原始的数据,用不同的模型、不同的分布函数去分析,可以得到许多不同角度的分析结果,进而能对总体进行更为立体的分析。

三、 概率论与数理统计和其他课程之间的联系

概率论与数理统计涉及的应用面很广泛,就大学课程来说,它能与文科中的经管类、以及理工科的几乎各个专业联系起来。就我所读的经济类专业来说,这门课程就对大二下学期将要学习的计量经济学打下了良好的基础。计量经济学是用经济计量方法研究经济数学模型的实用化或探索实证经济规律,其目的在与理论检验和预测应用,从思路和方法上来看与数理统计都有着紧密的联系。而计量经济学本身又是经济分析重要的一环,故概率论与数理统计对经济学科的重要性可想而知。

相关推荐