卫生统计学学习总结

1.连续性资料

1.1 两组独立样本比较

1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据

采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。

1.2 两组配对样本的比较

1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较

1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,

则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有

统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。

1.4 多组随机区组样本比较

1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,

则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统

计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。

****需要注意的问题:

(1) 一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差

分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。

(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假

阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,

Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**

(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的

设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。

2.分类资料

2.1 四格表资料

2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。

检验或Fisher’s确切概2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的

率法检验。

2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。

2.2 2×C表或R×2表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目

的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目

检验只说明组

检验的25%,则用Fisher’s确切概率法检验。 2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。 2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson

比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.3 R×C表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目

的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目

检验只说明组的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。 2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson

间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。

2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson

检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的

Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。

2.4 配对分类资料的统计分析

2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对

检验。

2.4.1 C×C资料,(1)配对比较:用McNemar配对 检验。(2)b+c<40,则用校正的配对检验。(2)一致性检验,用Kappa检验。

 

第二篇:卫生统计学总结

卫生统计学总结

王玉林 石河子大学医学院预防医学系

(一)简答题

一.方差分析的基本思想是什么?

方差分析的基本思想就是把全部观察值间的变异(总变异)按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义,总自由度也分解成相应的几个部分,再做分析。分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。

二.标准差和标准误的区别与联系?

标准差和标准误都是变异指标,但它们之间有区别,也有联系。

1.区别:①概念不同:标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均 数的抽样误差;

②用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。 标准误用于估计参数的可信区间,进行假设检验等。

③它们与样本含量的关系不同:当样本含量 n 足够大时,标准差趋向稳定;而标 准误随n的增大而减小,甚至趋于0 。

2.联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。 三.假设检验的原理是什么?

假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异。

假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。

1.两类假设

对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。

备则假设:因变量的变化、差异确实是由于自变量的作用

往往是我们对研究结果的预期,用H1表示。

虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在 观察到的差异只是随机误差在起作用,用H0表示。

2.小概率原理

小概率原理:小概率事件在一次试验中几乎是不可能发生的

至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显著性水平α。在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率。之后将其与我们实现界定好的显著性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设。

3.两类错误

第Ⅰ类错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误 研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有”

第Ⅱ类错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误 假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”

两类检验的关系

①α+β不一定等于1

②在其他条件不变的情况下,α与β不可能同时减小或增大

4.检验的方向性

单侧检验:强调某一方向的检验,显著性的百分等级为α

双侧检验:只强调差异不强调方向性的检验,显著性百分等级为α/2

对于同样的显著性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高。

5.假设检验的步骤

①根据问题要求,提出虚无假设和备择假设

②选择适当的检验统计量

③确定检验的方向性并规定显著性水平

④计算检验统计量的值

⑤将统计量的值与临界值对比做出决策

附:假设检验基本推断原理:小概率事件在一次随机试验中不(大)可能发生。

假设检验基本逻辑:在零假设成立的情形下计算统计量和P值,把“不太可能出现的 假阳性”当做“不可能出现假阳性”,从而拒绝零假设。

四.直线相关与直线回归的区别与联系?

1.区别:①相关分析资料双变量正态分布,回归资料只要求Y为正态分布,X可是正态分布 资料,也可为一般变量。

②意义上,相关说明互相关系,回归反应依存关系。

2.联系:①同一资料,r与b的正负号相同

②r与b的假设检验等价,同一资料tb=tr

③用回归解释相关R2=SS回/SS总

五.应用相对数时的注意事项?

1.理解相对数的含义不可望文生义

2.频率型指标的解释要紧扣总体与属性

3.计算相对数时分母应有足够数量

4.正确计算合计率

5.注意资料的可比性

6.样本相对数的统计推断

六.非参数检验的特点和适用范围

1.特点:①对样本所来自的总体分布形式没有要求。

②收集资料方便,可用“等级”或“符号”来记录观察结果。

③多数非参数检验方法比较简便,易于理解和掌握。

④缺点是损失信息量,适用于参数检验的资料用非参数检验会降低检验效能。

2.适用范围:①等级资料。②偏态分布资料。③方差不齐,且不能通过变量变换达到齐性。 ④个体数据偏离过大,或一端或两端无界的资料。⑤分布类型不明。⑥初步分析。

七.卡方检验的用途?

1.单样本分布的拟合优度;

2.比较两个或多个独立样本频率或独立样本频率分布;

3.比较配对设计两样本和两频率分布。

八.均数比较的方法有哪些?

1.t检验

①单样本资料的t检验:样本均数与总体均属比较的t检验,推断样本是否来自已知总体。 应用条件:计量资料,具有独立性、正态性、方差齐性。

②两独立样本资料的t检验:推断两样本总体均数是否相等(或两样本是否来自同一总体)。 应用条件:计量资料,具有独立性、正态性、方差齐性。

③配对设计资料的t检验:配对计量资料比较的t检验,差值均数的比较,包括异体配对和 自身配对。

应用条件:计量资料,具有独立性、正态性、方差齐性。

2.方差分析

①完全随机设计资料的方差分析:多个样本均数的比较。

应用条件:计量资料,具有独立性、正态性、方差齐性。

②随机区组设计资料的方差分析:多个样本均数的比较。

应用条件:计量资料,具有独立性、正态性、方差齐性。

③析因设计资料的方差分析:分析个实验因素的单独效应、主效应和因素间的交互效应。 应用条件:计量资料,具有独立性、正态性、方差齐性。

3.非参数检验

①单样本资料的秩和检验:用于不满足t检验条件的单样本定量变量资料的比较,推断样本中位数与已知总体中位数是否相等。

应用条件:计量资料,不具有独立性、正态性、方差齐性。

②配对设计资料的秩和检验:当差值d不满足正态分布时使用,推断两个总体中位数是否相等,即两种处理效应是否相同。

应用条件:计量资料,差值具有正态性。

③两独立样本比较的秩和检验:推断连续型变量资料或有序变量资料的两个独立样本代表的两个总体分布是否有差别。

应用条件:两样本来自非正态总体或方差不齐。

④多组独立样本比较的秩和检验:推断定量变量或有序分类变量的多个总体分布有无差别。 应用条件:多个独立样本对应总体不满足正态性或方差齐性。

⑤随机区组设计的秩和检验:多个样本均数的比较。

应用条件:多个独立样本对应总体不满足正态性或方差齐性。

九.参考值范围和可信区间的区别与联系 1.从意义来看 95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。

2.从计算公式看

若指标服从正态分布,95%参考值范围的公式是:±1.96s。

总体均数95%可信区间的公式是:。 前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。

十.频率分布表(图)的用途是什么?

1.揭示资料的分布类型

2.描述分布的集中趋势和离散趋势

3.便于发现某些特大和特小的可疑值

4.便于进一步计算指标和统计分析

(二)名词解释 1.医学统计学(medical statistics)应用概率论和数理统计学原理结合医学实际解决医学科研中设计,资料收集、整理、分析的科学。

2.总体(population)是根据研究目的确定的同质研究对象的全体。

3.样本(sample)是指从研究总体中抽取的一部分有代表性的个体。

4.同质(homogeneity)是指同一总体中个体的性质、影响条件或背景相同或非常相近。

5.变异(variation)是指同质的个体之间存在的差异。

6.参数(parameter)是指反映总体特征的统计指标。

7.样本统计量(statistic)由样本观察资料计算出来的反映样本特征的两称为样本统计量。

8.频率分布表(frequency distribution table)当变量值个数较多时,对各变量值出现的频率列表即为频率分布表,简称频率表。

9.二项分布(binomial distribution)是指在只会产生两种可能结果的n次独立重复试验中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2,3...,n的一种概率分布。

10.医学参考值范围(reference range)是指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。

11.抽样误差(sampling error)由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差。

12.置信区间(confidence interval,CI)区间估计是将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。

13.统计推断(statistical inference)由样本信息对相应总体的特征进行推断称为统计推断。

14.假设检验(hypothesis testing)若对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验。

15.析因设计(factorial design)是将两个或多个实验因素的个水平进行全面组合的实验,能够分析个实验因素的单独效应、主效应和因素间的交互效应。

16.单独效应(simple effect)是指其他因素水平固定时,同一因素不同水平的效应之差。

17.主效应(main effect)是指某一因素单独效应的平均值。

18.交互效应(interaction)是指两个或多个因素间的效应互不独立的情形。

19.参数检验(parametric test)凡是以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法统称为参数检验。

20.非参数检验(nonparametric test)不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断,故又称任意分布检验(distribution-free test)。

21.线性相关系数(linear correlation coefficient)是表示两个随机变量之间线性相关强度和方

向的统计量。 22.回归系数(regression coefficient)回归分析中度量依变量对自变量的相依程度的指标,它反映当自变量每变化一个单位时,依变量所期望的变化量。(回归系数βj表示在控制其他自变量时,自变量Xj变化一个单位所引起logit(π)的改变量)

23.决定系数(coefficient of determination)回归平方和与总离均差平方和之比称为决定系数。它反映了回归贡献的相对程度,即在因变量Y的总变异中回归关系所能解释的比例。

24.生存分析(survival analysis)就是将终点事件的出现与否和达到终点所经历的时间结合起来分析的一类统计分析方法。

 

第三篇:卫生统计学学习总结

1.连续性资料

1.1 两组独立样本比较

1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据

采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。

1.2 两组配对样本的比较

1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较

1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,

则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有

统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。

1.4 多组随机区组样本比较

1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,

则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统

计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。

****需要注意的问题:

(1) 一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差

分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。

(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假

阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,

Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**

(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的

设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。

2.分类资料

2.1 四格表资料

2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。

检验或Fisher’s确切概2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的

率法检验。

2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。

2.2 2×C表或R×2表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目

的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目

检验只说明组

检验的25%,则用Fisher’s确切概率法检验。 2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。 2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson

比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.3 R×C表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目

的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目

检验只说明组的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。 2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson

间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。

2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson

检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的

Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。

2.4 配对分类资料的统计分析

2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对

检验。

2.4.1 C×C资料,(1)配对比较:用McNemar配对 检验。(2)b+c<40,则用校正的配对检验。(2)一致性检验,用Kappa检验。

相关推荐