一、算数平均数:某一总体值总体单位平均所得的标志值的水平,是反映集中趋势最常用、最基本的平均指标。
二、中位数:把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值。
三、平均差:各变量值对其算术平均数(或中位数)离差绝对值的算术平均数。
四、标准差:各变量值对其算术平均数的离差平方的算数平均数的算数平方根,又称均方差。
五、方差:为标准差的平方。
六、众数:出现次数最多的变量值。用Mo表示。众数也是常用的反映现象集中趋势的代表性数值.
七、在社会统计中,表达相关关系的强弱,削减误差比例的概念是非常有价值的。削减误差比例的原理是,如果两变量间存在着一定的关联性,那么知道这种关联性,必然有助于我们通过一个变量去预测另一变量。其中关系密切者,在由一变量预测另一变量时,盲目性必然较关系不密切者为小。
八、皮尔逊相关系数:对于定距变量,根据其变量值的数学特征,我们自然可以引进更为精确的量化指标来反映它们之间的关程度。用来测量两个定距变量相关程度和方向的积差系数。它是由英国统计学家皮尔逊(Pearson)用积差方法推导出来,所以也称皮尔逊相关系数,用符号r表示。
九、一元回归分析:关于X为自变量、Y为不确定的因变量的变量关系,其中只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示的回归分析。
十、中心极限定理:从任意一个总体中抽取样本量为n的样本,当n充分大时(在社会现象中,指n≥50),样本均值的抽样分布近似服从正态分布。
十一、P 值(显著度):1.是一个概率值
2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率
3.被称为观察到的(或实测的)显著性水平
H0 能被拒绝的最小值
十二、置信水平:总体参数值落在样本统计值某一区间的概率,也称置信度
正态分布
1.由C.F.高斯(Carl Friedrich Gauss,1777—1855)作为描述误差相对频数分布的模型而提出
2.描述连续型随机变量的最重要的分布,许多现象都可以由正态分布来描述
3.可用于近似离散型随机变量的分布
例如: 二项分布
4.经典统计推断的基础
原假设: 待检验的假设,又称“0假设”
备择假设:与原假设对立的假设,又称研究假设
十三、否定域:不大可能出现的结果
十四、异众比率:非众数的频数与总体单位数的比值
十五、总体参数值:关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
十六、样本统计值:关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表。
十七、Z分数:原始数据与均值之间的大小,实际表达变量值距算术平均数有几个标准差。
十八、均值的标准误差:是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中习惯用样本均值来推断总体均值,那么样本均值的离散程度(标准误) 越大,抽样误差就越大。所以用样本均值的标准误来衡量抽样误差的大小。
十九、斯皮尔曼相关系数:主要用于解决称名数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。
二十、置信水平与置信区间的关系:
置信水平:总体参数值落在样本统计值某一区间的概率,也称置信度,或者说,总体参数值落在样本统计值某一区间的把握性程度。它反映的是绰约那个的可靠性程度。
置信区间:在一定的置信度下,样本值与总体值之间的误差范围。它所反映的是抽样的精确性程度。
二十一、区间估计与假设检验的关系:
1、 区间估计 立足于大概率,用已知样本统计量和标准误差,确定一个有概率意义的区间(置信区间),可理解为正向求解问题。
2、假设检验 立足于小概率,利用反证法原理,首先依据两种可能性建立两种假设,再从第一种假设出发,计算出特定统计量,判断该种假设是否成立。
3、联系:区间估计和假设检验可以看作同一个问题的不同表达方式。区间估计和假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,使用同一样本、同一统计量、同一分布,二者可以相互转换。
二十二、假设检验的理论基础: 采用逻辑上的反证法;依据统计上的小概率原理
假设检验的基本步骤:
(1)、建立虚无假设和研究假设,通常是将原假设作为
(2)、根据需要选择适当的显著性水平
(3)、根据样本数据计算出统计值,并根据显著性水平查处对应的临界值。
(4)、将临界值与统计值进行比较,若临界值大于统计值的绝对值,则接受虚无假设;反之,则接受研究假设。
二十三、中心极限定理的重要性:中心极限定理对大样本均值正态分布性质的揭示,为未知总体的研究奠定了理论基础。
二十四、标准差与标准误差的区别:1、标准差是样本数据方差的平方根,它衡量的是样本数据的离散程度;2、标准误差是样本均值的标准差,衡量的是样本均值的离散程度。
二十五、置信水平与置信区间的关系:1、置信水平表示总体参数值落在样本统计值某一区间的概率,也称置信度。用(1-α)表示。 2、置信区间指在一定的置信度下,样本值与总体值之间的误差范围,反映抽样的精确程度。
使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较小的置信水平则会得到一个较准确(较窄)的区间。
当置信水平1-α=0.90时,Zα/2=1.65;1-α=0.95时,Zα/2=1.96;1-α=0.99,Zα/2=2.58
二十六、相关关系与因果关系的联系与区别:
区别:1、相关关系是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。2、因果关系是指两个或两个以上变量在行为机制上的依赖性,结果变量由原因变量决定,原因变量的变化会引起结果变量的变化。有单向因果关系和互为因果关系之分。
联系:具有因果关系的变量一定具有数学上的相关关系,而具有相关关系的变量不一定有因果关系。
二十七、公式:
1、皮尔逊相关系数:
2、回归方程:
3、置信区间相关公式(双侧检验):
(1)、对于大样本的总体均值在1-α置信水平下的置信区间为:
σ为总体标准差,S为样本标准差,当σ未知,用S来替代。
(2)、对于小样本且σ未知时:
(3)、总体比例在1-α?置信水平下的置信区间为
(4)、在抽样分布中:
1、Z作为检验大样本统计量,σ未知时:
2、t作为小样本检验统计量时,σ未知:
当计算的Z值或t值等于或大于显著性水平下的Z值和t值,那么否定零假设。
社会统计学知识点总结
一,社会调查研究的步骤:
⑴确定课题。
⑵了解情况
⑶建立假设
⑷确立概念和测量方法
⑸设计问卷
⑹试填问卷
⑺调查实施
⑻校核与登录
⑼统计分析与命题的检验
★ 社会统计学——介绍有关社会调查资料收集,整理,分析和推论的统计方法。
二,社会调查资料的特点:
2,统计规律性
→总结上述:
抽样结果与总体性质是两个既有差别又有内在联系的两个量。
三,统计分析的前导是什么?
理论,假设,操作化,科学的收集数据,回收资料的信度和效度都是统计分析的前导。
也就是说,没有理论假设的定性研究就没有进一步定量分析的基础。而没有操作化手段就无法完成定性研究向定量研究的转化。
四,统计分析内容主要分几部分?
五,统计分析的方法→频次分布,统计图,统计表,集中趋势的测量法,离散趋势测量法等等。
会计作为经济管理的重要组成部分,是适应社会生产的发展和管理需要而不断发展和完善的。在社会生产中,会计一方面对生产过程中人力、物力的…
海南大学应用科技学院会计学会20xx20xx年度工作总结应用科技学院会计学会20xx年10月20日海南大学应用科技学院会计学会20…
会计学习总结范文两篇会计学习总结范文两篇篇一一作为一个会计人员工作中一定要就具有良好的专业素质职业操守以及敬业态度会计部门作为现代…
会计学习心得我所在的专业是会计专业,它是一门挺重要的课程,可以说我们的日常生活离不开它。会计是以货币为主要计量单位,以提高经济效益…
目录1交际应酬是否视同销售12非正常损失与非常损失的区别43在建工程试运行收入和支出51交际应酬是否视同销售增值税方面根据增值税暂…
第一章:①统计具有三大含义:统计工作、统计资料、统计学。②统计的职能:信息、咨询和监督三大职能。③一个完整的统计工作过程包括统计设…
★对称分布(特别是正态分布):均数标准差结合起来从平均水平和变异程度两方面描述变量的分布特征.★偏态分布:中位数四分位数间距结合起…
生物统计学学习心得这学期要结束了,在老师的指导下,经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。下面是我学习这门课…
第一章1、统计学是一门具有很强的实践性与应用性的方法论学科.一般主要包括四大部分:1)描述统计,包括统计数据的收集、整理、展示和描…
通过课上学习总结如下:统计学原理知识总结统计学知识总结统计学是一门关于随机现象总体的数据资料进行收集、整理和分析的方法论科学。统计…