第一章 导论
概念:
统计学:收集、处理、分析、解释数据井从数据中得出结论的科学。
统计的分类:
描述统计:研究的是数据收集,处理,汇总,图表描述,文字概括与分析等统计方法。
推断统计:是研究如何利用样木数据进行推断总体特征。
数据:
1.分类数据:对事物进行分类的结果数据,表现为类别,用文字来表述。例如,人口按性别分为男、女两类
2.顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等
3.数值型数据对事物的精确测度,结果表现为具体的数值。例如:身高为175cm,190cm,200cm
参数:描述总体特征。有总体均值(μ)、标准差()总体比例(T)
统计量:描述样本特征,样本标准差(s),样木比例(p)
第二章 数据的搜集
1. 数据来源包括直接来源(一手数据)和间接来源(二手数据)
2. 抽样方式包括概率抽样与非概率抽样
3. 概率抽样:也称随机抽样。按一定的概率以随机原则抽取样本,抽取样本时使每个单位都
有一定的机会被抽中。
4.
5.抽样误差:是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差并不是针对某个样本的检测结果与总体真是结果的差异而言,抽样误差描述的是所有样本可能的结果与总体真值之间的平均差异。
6.抽样误差的大小与样本量的大小和总体的变异程度有关。
第三章 数据的图表展示
计算机实训内容,
要求:
1. 数据筛选,自动筛选
2. 高级筛选,
3. 数据排序
4. 分类汇总-利用数据透视表
5. 对比条形图
6. 环形图
7. 累计频数图
8. 散点图
9. 雷达图
等等
频数分布图两种方法:工具-数据分析-直方图 数值型和顺序数据
数据-数据透视表 数据透视表
第四章 数据的概括性度量
集中趋势:
算数平均数:
几何平均数:指n个观察值连乘积的n次方根,计算平均发展速度时复利下的平均年利率,最常用的一种计算公式为,几何平均数≤算术平均数。
中位数:有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。(平均家庭收入)(记忆的重要性)
离散程度:
异众比率:异众比率指的是总体中非众数次数与总体全部次数之比。(了解)
四分位差:(了解)
方差:var
标准差:STDEV
平均差:
相对位置的度量:
标准分数:
离散系数:
形状:
偏态:SK>0,正值,正偏或者右偏,,小数集中
SK<0,负值,负偏或者左偏,,大数集中。
绝对值 0, 0.5, 1三个界线。
峰态:K>0,尖峰,数据分布集中,
K<0,扁平,数据分布分散。
第五章 概率与概率分布
1.概率的分类:1.概率的古典定义,概率的统计定义,概率的主观定义。
2.期望值:在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和,描述离散型随机变量取值的集中程度,记作E(X),或者μ,其实为加权平均数。
3. 二项分布的数学期望为
E ( X ) = np
方差为
D ( X ) = npq
标准差?
区别二项分布的概率值与期望值。
4. 当二项分布中n很大,p很小时,二项分布就变成为Poisson分布
计算机计算
二项分布计算时候, 已知:1,目标概率 2,实验次数 3,成功次数
公式:
二项分布换泊松分布,已知:1,入=np=1*2 2,成功的次数
(揉合在一起,因为都是那种目标概率小、实验次数多的实验)
入=数学期望值E(X)=方差D(X)=np
P119例子,P121例子
5. 正态分布
主要特点:钟型,离μ近的概率大,离μ远的概率小。
标准差小,集中;标准差大,分散。
正态曲线的最高点在均值μ,它也是分布的中位数和众数。
正态分布是一个分布族,每一特定正态分布通过均值μ和标准差σ来区分。
曲线f(x)相对于均值μ对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交
正态曲线下的总面积等于1。
计算机计算:已知:1,正态分布(的形状)(μ与σ), 2.临界值(右端值,即默认计算的是改值以左部分的面积)
6.标准正态分布:期望值μ=0,(即曲线图象对称轴为Y轴),
标准差σ=1条件下的正态分布,
记为N(0,1)。(N是正态英文的首字母)
计算:由于形状已知(N(0,1)),所以只需要知道临界值(右端值)
7.此段内容只供理解,不是知识。
概率函数:横轴表示“统计对象”,纵轴表示 ”概率”。故称概率函数。
概率密度函数:将直方图组距缩小到很密的程度,故称概率密度函数。
分布函数:分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率。(把概率函数的面积转换成分布函数的纵轴值)
所以:找一个的具体值的概率应该在密度函数上的值,范围区间(-∞,x]是在分布函数上的值,一个范围区间(X1~X2)是分布函数上X2的值-X1的值
8. 正态分布的3σ原则:只要是正态分布,不论标准与否,(可以反过来理解)
数值分布在(μ-σ,μ+σ)中的概率为0.6826
数值分布在(μ-2σ,μ+2σ)中的概率为0.9544
数值分布在(μ-3σ,μ+3σ)中的概率为0.9974
可以认为,Y 的取值几乎全部集中在(μ-3σ,μ+3σ)]区间内,超出这个范围的可能性仅占不到0.0026
9. 正态分布表
10. 其他公式:
11. 正态分布的标准化公式:Z=(X-μ)/σ~N(0,1) (EXCEL实例)
第六章 统计量及抽样分布
中心极限定理:设从均值为μ、方差为σ^2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ^2/n 的正态分布。(那么标准差呢?)
理解:m为总体个数,n为抽样时每个样本的个数,可以抽出个样本,这些样本符合正态分布。
第七章:参数估计
1.参数估计:根据统计量计算推断出总体低的参数,包括点估计和区间估计
2.点估计:点估计
3.区间估计:条件 1.均值 2.标准差 3.置信水平(区间应包括几个标准差)
置信水平越大,区间应该越长;置信水平越小,区间可以越短。
主要在求上下限(因为均值已知,知道上下限即可知道区间)
4.
第八章 假设检验
1.已知均值,标准差,上下限,求置信水平(与几个标准差相关)。
统计学实验报告与心得体会
班级: 姓名: 学号: 成绩:
一 实验报告 成绩:
实验一 数据的搜集与整理
实验目的和要求
培养学生处理数据的基本能力,熟悉Excel2003的基本操作界面,熟悉间接和直接数据的搜集方法,掌握不同类型的数据处理方法,以及数据的编码、分类、筛选、排序等整理操作的方法。
实验步骤
1、 数据的搜集:确定数据来源,主要由两种渠道,间接数据和直接数据。间接数据一种方式是直接进入专业数据库网站查询,另一种是使用搜索引擎。直接数据搜集步骤有:调查方案设计、调查问卷设计、问卷发放、问卷收回、数据初步整理等。
2、数据的编码:如果数据是由开放式的问题来获取的,那么,需要对答案进行罗列、合并、设码三个过程来完成编码工作。
3、数据的录入:Excel的数据录入操作比较简单,一般只要在工作表中,单击激活一个单元格就可以录入数据了。通过“格式-单元格格式”(Ctrl+1)菜单来实现数据的完整性。
4、数据文件的导入:导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。
5、数据的筛选:Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。
6、数据的排序:在选中需排序区域数据后,点击“升序排列”(“降序排列”)工具按钮,数据将按升序(或降序)快速排列
7、数据文件的保存:保存经过初步处理的Excel数据文件。可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。
实验二 描述数据的图标方法
实验目的和要求
通过软件辅助,将数据转换为直观的统计表和生动形象的统计图,掌握Excel的制图和制表功能,并能准确地很据不同对象的特点加以运用。
实验步骤
利用Frequency函数获取频数频率:1、将数据输入并激活分别符合条件的单元格。2、打开“插入函数”对话框,选择函数。3、点击“插入函数”对话框确定按钮进入“函数参数”对话框,选中符合条件的对话框。4、使用组合键“Ctrl+Shift+Enter”,得到频数,返回结果。5、对结果进行修饰,加入分组标志及其值,再加入频数具体名称,并且计算频数。
利用直方图:1、将数据输入到指定单元格。2、使用“工具——数据分析”菜单,选择“直方图”。3、进入“直方图”分析工具库,选中复选框。4、单击确定按钮,得到直方图分析工具扩展函数的返回结果。5、对结果进行修饰。
实验三 统计数据的描述
实验目的及要求
应用统计软件,描述统计数据的集中趋势、离散程度、分布偏态。掌握Excel 2003中描述统计指标对应的函数,包括算数平均数、调和平均数、几何平均数、众数、中位数、标准差、方差等。.熟练掌握Excel 2003“描述统计”工具进行描述统计。
实验步骤
掌握一些常用的使用函数。就Average函数进行举例,计算参数的算术平均值,简单算术平均数:1、直接将数据输入到符合条件的单元格。2、然后激活一个空白单元格,输入公式“=AVERAGE( )”,回车返回结果;加权算术平均数,Excel没有提供专门的内置函数,1、可先计算各组的组中值,作为该组一般代表2、激活一空白单元格,输入相关公式,回车返回结果。
“描述统计”分析工具扩展函数:1、使用“工具——数据分析”菜单,打开“数据分析”对话框,从分析工具下框中选择“描述统计”。2、点击数据分析对话框的确定按钮进入“描述统计”对话框,输入区域点击右侧箭头,选择需要分析描述统计结果的数据。3、点击描述统计对话框确定按钮,得到描述统计结果。
实验四 参数估计
实验目的和要求
应用统计软件,完成抽样的工作,并且在抽样数据获取的基础上,计算样本统计量,对对应总体参数进行区间估计。了解抽样组织形式以及如何抽取样本数据,掌握Excel2003中应用函数表单进行参数估计的方法和步骤。
实验步骤
“抽样”分析工具将输入区域视为总体,并使用总体来建立样本。1、使用“工具——数据分析”菜单打开“数据分析”对话框,选择“抽样”,并将其打开。2、点击输入区域右侧的箭头,鼠标拖动选择单元格。3、点击“抽样”对话框的确定按钮,返回结果。
点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值
区间估计:1、选中单元格,使用“插入——名称——指定”菜单,打开“指定名称”,选择“首行”,点击确定。2、构建函数表单框架。3、输入框架下对应的数据和函数公式。
实验五 假设检验
实验目的与要求
了解不同假设检验内容要求的不同检验统计量和检验方法;掌握利用函数表单进行假设检验的方法和步骤;掌握Excel 2003中应用分析工具库进行假设检验的方法和步骤。
实验步骤
1、创建样本数据,确定需进行假设检验的总体参数2、确定抽样样本统计量及其服从的分布3、进行假设设计(单侧,双侧)4、确定置信水平5、计算检验统计量6、计算置信水平下的检验区间(或检验临界值)7、比较检验统计量与检验区间(或检验临界值) ,得出结论。
实验六 方差分析
实验目的与要求
应用统计软件,对数据进行单因素饭方差分析和双因素方差分析。了解方差分析的假设前提,掌握Excel 2003中应用分析工具库进行方差分析的方法和步骤。
实验步骤
单因素方差分
1、使用“工具——数据分析”打开数据分析对话框,选择“方差分析:单因素方差分析”分析工具,点击确定按钮打开“方差分析:单因素方差分析”对话框。2、输入区域点击右侧箭头,选择单元格。3、分组方式选择“列”单选框。4、点击“方差分析:单因素方差分析”对话框确定按钮,返回结果。
双因素方差分析
1、使用“工具——数据分析”打开数据分析对话框,选择“方差分析:无重复双因素方差分析”分析工具,点击确定按钮打开“方差分析:无重复双因素方差分析”对话框。2、输入区域点击右侧箭头,选择单元格。3、分组方式选择“标志”复选框。4、点击“方差分析:无重复双因素方差分析”对话框确定按钮,返回结果。
二 心得体会 成绩:
统计学实验心得体会
某生产车间30名工人的日产零件数如下(单位:个),试对其一组距为10进行等距分组,第一组为100-110。
编制的频数频率表如下
一个学期的实训不知不觉的就这样过去了,在这里不敢说自己学到很多的东西,但我真的懂得了很多,也在其中明白了很多。在这学期的统计学实验学习中,我加深了对统计学原理的学习,以及对数据知识的理解和掌握,同时也对Excel操作软件的应用有了更深刻的了解,巩固了所学知识,拓展了知识面。结合以上的数据分析,以下是我这几次实验的一些心得和体会。
在统计实验中,对数据的筛选和处理是比较重要的内容和要求。同时对数据的分析也离不开相关软件的支持。比如,要求一个企业30名职工的日生产零件数,就要对数据进行导入、分析、筛选,最后得出答案。因此,Excel软件是实验所不可缺少的。例如,假设样本取自30名职工的日生产零件数,他们的平均生产数是123.1333,总体标准偏差为11.16563,则平均生产数在下列区域内的置信度为95%。。实验主要是对数据进行归类分析,所以完整准确的数据很重要,这就要求我们在进行分析的过程中,不能粗心大意。比如,生产车间30名工人的日生产零件数分别为148、116、128、125、129、140、109、123、137、119、127、132、114、107、124、120、135、108、113、130、110、129、132、123、118、104、123、124、140、107,计算30名工人的平均生产数。这就要注意将30个数据顺次输入A1至A30单元格,然后必须确认激活一个空白单元格,最后输入公式“=Geomean(A1:A30)”,回车返回结果为123.1333。这个例子其实就告诉我们一定要认真地做好每一步,否则就会出错。实验过程中,对Excel软件的安装因要求具体而变的相对简单。虽然大多数计算机都已内存此软件,但在实验中通过具体的操作亦可以提高自己的计算机操作水平。接下来的重头戏就是对统计数据的输入与分析了。按Excel对输入数据的要求将数据正确输入的过程并不轻松,既要细心又要用心。不仅仅是仔细的输入一组数据就可以,还要考虑到整个数据模型的要求,合理而正确的分配和输入数据。因此,输入正确的数据也就成为了整个统计实验的基础。假设某5名工人的生产数为A1=148,A2=116,A3=128,A4=125,A5=129,则计算所有生产零件数的标准偏差公式为:“=STDEVO(A1:A5)”,返回的结果。
通过统计学实验课的学习,培养了我处理数据的基本能力,熟悉了利用Excel搜集和整理数据,掌握了不同类型的数据整理与操作方法;基本学会了Excel的统计制图与制表功能;熟悉了描述统计指标对应的函数,应用统计软件,描述统计数据的集中趋势、离散程度,分布偏态以及峰度等分布特征;了解了抽样组织形式以及如何抽取样本数据,掌握了应用函数表单进行参数估计的方法和步骤;知道了不同假设检验内容要求的不同检验统计量和检验方法,基本懂得Excel中应用函数表单和分析工具库进行假设检验的方法和步骤;可以应用统计软件,对数据进行单因素方差和双因素方差分析、相关和回归分析、时间序列分析。就拿回归来说,示例a=471.4365524,b=3.616534,c=3.432346.所以回归方程为Y=471.4365524+3.616534X1+3.432346X2。判定系数为0.99889,自由度为6,检验统计量为2719.982等。
数据的输入很重要,但如果没有分析的数据则是一点意义都没有实验过程中,在确认Excel安装设置成功的前提下,首先进行的就是对统计数据的输入与分析。因此,统计数据的描述与分析也就成了关键的关键。对统计数据的众数,中位数,均值的描述可以让我们对其有一个初步的印象和大体的了解,在此基础上的概率分析,抽样分析,方差分析,回归问题以及时间序列分析等则更具体和深刻的向我们揭示了统计数据的内在规律性。比如,某地区粮食总产量时间序列数据分别为230、236、241、246、252、257、262、276、281、286,,首先要用“回归”分析工具对数据进行分析,构建的回归方程为:产量=221.8+6.345454545*年份,SignificanceF=1.58282*10^-8,远远小于显著性系数0.05,这说明回归方程是极高度显著的,反映了产量和时间之间的关系,可以进行预测和控制。要预测下一年或下几年的总产量,在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理起了事半功倍的作用。
实验操作当然是统计学实验的核心。 经过了几节课的实验,我发现做实验有许多需要注意的地方,掌握了这些技巧才能让实验结果变的更加准确和方便。在实践中,懂得了怎样用excel来分析和处理数据认识数据背后所隐藏的信息。c.总体方差的置信区间估计。已知总体服从正态分布,将以上数据视为样本数据,样本容量为30,求在概率为90%的保证下,总体方差的置信区间。( 1 )做实验的时候,一定要集中精神,比如我们在做 置信度置信区间的实验时,要注意观察各个数据,选取恰当的公式和计算方法,填写表格时也要注意看清楚,一旦错了一处,就处处都会错。因此集中注意力是相当重要的。( 2 )做实验时要有足够的耐心和定力。就像在计算方差的时候,每个数据都不同,而且分组很多,虽然是用计算机 EXCEL 做,但是我们一定要看清楚数字到底是多少,现在实验结果错了可以改正,但是将来走上工作岗位后,一个数据错了,后果就不堪设想,这就需要足够的耐心。比如:工人的生产零件数样本为数为A1=148,A2=116,A3=128,A4=125,A5=129,则估算所有成绩标准差的公式为“=STDEV(A1:A5)”,返回的结果。
通过实验过程的进行,对统计学的有关知识点的复习也与之同步。在将课本知识与实验过程相结合的过程中,实验步骤的操作也变的得心应手。也给了我们一个启发,在实验前应该先将所涉内容梳理一遍,带着问题和知识点去做实验可以让我们的实验过程不在那么枯燥无谓。同时在实验的同步中亦可以反馈自己的知识薄弱环节,实现自己的全面提高。通过统计学实验学习,提高了自己的动手能力和对数据的敏感度,提高了对数据的分析处理能力,学会从数据中找出隐含的信息点,作出预测和判断,同时也巩固了统计学理论知识。例如,Excel使用Varp,Var,Stdevp,Stdev四个函数分别计算总体方差,样本方差,总体标准差和样本标准差。假设车间有5名工人加班4小时,生产量为A1=88,A2=55,A3=90,A4=72,A5=85,用VARP函数计算成绩方差,则公式“=VARP(A1:A5)”返回171.6。
本次实验是我大学生活中不可或缺的重要经历,其收获和意义可见一斑。首先,我可以将自己所学的知识应用于实践中,理论和实际是不可分的,在实践中我的知识得到了巩固,解决问题的能力也受到了锻炼;其次,本次实验开阔了我的视野,使我对统计在现实中的运作有所了解,也对统计也有了进一步的掌握。 通过本次实验,不仅仅是掌握操作步骤完成实验任务而已,更重要的是在实验中验证自己的所学知识的掌握和运用。统计学的学习就是对数据的学习,而通过实验可以加强我们对统计数据的认知和运用,更好的学习统计学的知识。
这学期的统计学实验与原理课都已经结束了,虽然我并没有完全掌握统计的基本知识与方法,但我也从中学到了不少。至少了解到了统计学的一些一般原理,可以运用Excel进行基本的数据处理与分析;此外,除了关于统计学本门课的知识外,我还明白了对知识的学习不能局限于书面的文字信息,我们需要进一步的实际操作与锻炼,理论联系实际,这样才能更好地掌握一门知识,并在生活中加以运用。总之,我觉得统计学就是要在实践的基础上才能够不断巩固和发展,用理论指导实践,用实践检验理论。
以上就是我这学期统计学实验的一些心得体会,它将会对我以后的工作和学习起到至关重要的作用,帮助我不断提高和完善自己,我为在大学中有机会学习统计学而感到庆幸。在此,我也要感谢老师的辛苦教导与帮助。
统计学(Statistics):应variable):变量的观察般用希腊字母表示。用统计学的原理与方法,或检测结果,也叫变量的统计…
1、同一资料的标准差是否一定小于均数?答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料…
Chapter基本概念显著性检验(testofsignificance):计算P值医学统计工作的内容:1、实验设计:最关键最重要2…
一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐…
俄第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分…
生物统计学学习心得这学期要结束了,在老师的指导下,经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。下面是我学习这门课…
第一章1、统计学是一门具有很强的实践性与应用性的方法论学科.一般主要包括四大部分:1)描述统计,包括统计数据的收集、整理、展示和描…
通过课上学习总结如下:统计学原理知识总结统计学知识总结统计学是一门关于随机现象总体的数据资料进行收集、整理和分析的方法论科学。统计…
一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐…
俄第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分…