医学统计学案例分析 (1)

案例分析—四格表确切概率法

【例1-5】　为比较中西药治疗急性心肌梗塞的疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检验，得连续性校正χ² =3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。

表1-4 两种药物治疗急性心肌梗塞的疗效比较

【问题1-5】

（1）这是什么资料？

（2）该资料属于何种设计方案？

（3）该医师统计方法是否正确？为什么？

【分析】

(1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。

(2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。

(3) 患者总例数n=27＜40，该医师用χ²检验是不正确的。当n＜40或T＜1时，不宜计算χ²值，需采用四格表确切概率法（exact probabilities in 2×2 table）直接计算概率

案例分析－卡方检验（一）

【例1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验（有效=1，无效=0）进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义检验（有效=1，无效=0）进行进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义，故认为中西药治疗胃炎的疗效有差别，中药疗效高于西药。

【问题1-1】

（1）这是什么资料？（2）该资料属于何种设计方案？

（3）该医师统计方法是否正确？为什么？（4）该资料应该用何种统计方法？

【分析】 (1) 该资料是按中西药疗效（有效、无效）分类的二分类资料，即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布的计量资料，不能用于计数资料的比较。 (4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别，应用四格表资料的 X2检验（chi-square test）。

【例1-2】 20##年某医院用中药和西药治疗非典病人40人，结果见表1-1。

表1-1 中药和西药治疗非典病人有效率的比较

某医师认为这是完全随机设计的2组二分类资料，可用四格表的检验。其步骤如下：

1．建立检验假设，确定检验水准

H₀：两药的有效率相等，即 π₁＝π₂

H₁：两药的有效率不等，即π₁≠π₂

2．计算检验统计量值

(1) 计算理论频数根据公式计算理论频数，填入表7-2的括号内。

(2) 计算χ²值

具体计算略。

3．确定P值，做出统计推断

查附表6（χ²界值表），得0.025＜P＜0.05，按α＝0.05 水准，拒绝H₀，接受H₁，差异有统计学意义，可认为两药的有效率不等，中药疗效高于西药。【问题1-2】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？

【分析】

(1) 中西药的疗效按有效和无效分类，该医师认为此资料是二分类资料即计数资料是正确的。

(2) 40例患者随机分配到西药组和中药组，属于完全随机设计方案。

(3) 该医师用四格表检验是正确的，但计算值的公式不对。因为有一个理论频数（T₂₁=4.8）小于5大于1，应用连续性校正公式计算χ²值。具体计算略。

查附表6（χ²界值表），得0.250＞P＞0.100，按α＝0.05水准，不拒绝H₀，差别无统计学意义，尚不能认为两药的有效率不相同，中药疗效与西药疗效基本相同。结论与前述相反。

案例分析－卡方检验（二）

【例1-3】　某医师用某种中草药治疗不同类型的小儿肺炎，其中病毒性肺炎60例，细菌性肺炎60例，治疗结果见表1-2。该医师对此资料采用行×列检验，得χ² =7.077，P=0.069，差异无统计学意义，故认为此种中草药对不同类型小儿肺炎的疗效分布无差别。

表1-2 某种中草药治疗不同类型小儿肺炎的疗效比较

【问题1-3】（1）该研究是什么设计？（2）统计分析的目的是什么？统计方法是否正确？

【分析】(1) 该资料为完全随机设计方案。(2) 欲比较两组的疗效是否有差别，其比较的结局变量（分析变量）是等级资料，为单向有序分类资料。用χ²检验不妥，因为如果对其中的两列不同疗效的数值进行调换，值不会有变化，但秩和检验统计量有变化，所以该资料应该采用利用等级信息较好的秩和检验或Ridit分析。（经秩和检验，结果为Z= -2.570，P=0.010，差异有统计学意义。该结论与上述结论相反。）

案例分析－卡方检验（三）

【例1-4】某医院采用甲乙两种方法测定60例恶性肿瘤患者体内ck₂₀基因表达阳性率，甲法测定阳性率为70.0％，乙法测定阳性率为38.3％，两种方法一致测定阳性率为26.7％。为比较甲乙两种方法的测定阳性率是否有差异，该医生首先将资料整理为表1-3。然后采用四格表检验进行假设检验，得χ²=12.118，P＜0.005，差异有统计学意义，故认为甲乙两种方法的测定结果有差别，甲法测定阳性率较高。

表1-3 两种方法测定结果比较

【问题1-4】（1）这是什么资料？（2）该资料属于何种设计方案？

（3）该医师统计方法是否正确？为什么？（4）该资料应采用何种统计方法？【分析】(1) 该资料是按两种方法测定结果（阳性、阴性）分类的计数资料。 (2) 该设计为同一受试对象接受两种不同的处理，属于自身配对设计方案。(3) 该医师用完全随机设计资料的四格表χ²检验分析配对设计资料，其统计表和统计方法均不正确。

(4) 比较甲乙两种方法测定结果的阳性率是否有差别，应采用配对 χ²检验（或McNemar检验）。

案例分析－t检验

【例1-1】某医生随机抽取正常人和脑病病人各11例，测定尿中类固醇排出量（mg/dl），结果如表1-1。该医生根据此资料算得正常人尿中类固醇排出量的均数=4.266mg/dl，标准差S₁=0.985mg/dl；脑病病人尿中类固醇排出量的均数=5.732mg/dl，标准差S₂=1.626mg/dl，配对t检验结果，t = –3.098，P < 0.05，故认为脑病病人尿中类固醇排出量高于正常人。

表1-1 正常人和脑病病人尿中类固醇排出量（mg/dl）测定结果

【问题1-1】 1．该资料属于何种设计方案？ 2．该医生的统计处理是否正确？为什么？

【分析】 (1) 该资料是随机从两人群（研究的两个总体）中抽取样本，测量尿中类固醇排出量，属于完全随机设计。 (2)该统计处理不正确。对完全随机设计的资料不宜用配对t检验。本资料应用完全随机设计两样本均数比较的t检验，目的是判断两样本均数分别代表的两总体均数和是否相同。

【例1-2】 20##年某县疾病预防控制中心为评价该县小学生卡介苗抗体效价，随机抽取了30名小学生，测定结果见表1-2。经完全随机设计两样本均数比较的t检验（方差齐，F=0.096，P>0.05），t = 0.014，P>0.05，故认为该县小学生卡介苗抗体效价无性别差异。

表1-2 20##年某县30名小学生卡介苗抗体滴度测定结果

【问题1-2】1．该资料属于何种设计方案? 2．统计处理是否正确？为什么？

【分析】 (1) 该资料是随机抽取当地30名小学男生和女生作为样本，测定每个观察对象的卡介苗抗体滴度，属于完全随机设计。 (2) 由于抗体滴度值是等比资料，服从对数正态分布, 各组的平均滴度应用几何均数（G）描述，其假设检验不能直接用完全随机设计两样本均数比较的t检验, 而应将观察值进行对数变换后再用t检验。

方差分析

【例6-1】某研究者为研究核黄素缺乏对尿中氨基氮的影响，将60只Wistar大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20只大白鼠。一周后测尿中氨基氮的三天排出量，结果如表6-1。该研究者对上述资料采用了两样本均数t检验进行两两比较，得出结论：三组之间均数差异均有统计学意义（P<0.05）。检验进行两两比较，得出结论：三组之间均数差异均有统计学意义（P<0.05）。

表6-1 3组大白鼠在进食一周后尿中氨基氮的三天排出量（mg）

【问题6-1】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该研究者处理方法是否正确？为什么？

【分析】(1) 由于测定的是三组大白鼠尿中氨基氮含量，属于多组计量资料。(2) 60只大白鼠随机分为三组，属于完全随机设计方案。(3) 该研究者统计处理方法不正确，因为t检验适用于完全随机设计的两组计量资料的比较，不适用于多组计量资料的比较。(4) 要比较检验多组完全随机设计计量资料的多个样本均数有无差别，需用完全随机设计计量资料的方差分析。

2.【例6-2】某医师研究A、B、C三种药物治疗肝炎的效果，将30只大白鼠感染肝炎后，按性别相同、体重接近的条件配成10个区组，然后将各配伍组中3只大白鼠随机分配到各组：分别给予A、B和C药物治疗。一定时间后，测定大白鼠血清谷丙转氨酶浓度（IU/L），如表6-7。该医师用完全随机设计资料的方差分析方法对资料进行了假设检验，F＝12.63，P＜0.001，故认为三种药物的疗效不全相同。

表6-2 A、B、C三种药物治疗后大白鼠血清谷丙转氨酶浓度（IU/L）

【问题6-2】 (1) 该资料是什么资料？ (2) 该研究是什么设计？ (3) 统计分析方法是否恰当？

【分析】 (1) 由于测定的是血清谷丙转氨酶浓度（IU/L），属于多组计量资料。 (2) 30只大白鼠，按性别相同、体重接近划分为10个区组。每个区组3只大白鼠随机采用A、B、C三种药物治疗，故属于随机区组设计方案。 (3) 该医师应用完全随机设计计量资料的方差分析进行检验是不正确的，应该选用随机区组设计的方差分析方法进行检验。

案例分析－秩和检验

例1-1】某医师用改良的Seldinger’s插管技术对8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中的HCG含量如表1-1。该医师考虑到数据相差较大，采用对数变换后进行两样本均数比较的t检验，得t =2.460，P＜0.05，差异有统计学意义，故认为治疗前后血中HCG的含量有差别。

表1-1 灌注化疗前后HCG含量测定结果（pmol/L）

【问题1-1】

1．这是什么资料?

2．该实验属于何种设计方案？

3．该医师统计方法是否正确？为什么？

【分析】

(1) 该资料为计量资料。

(2) 该实验属自身配对设计方案。

(3) 该医师统计方法不正确。首先，配对资料一般采用对每对数据求差值后进行比较，而该医师采用完全随机设计资料的检验方法，统计方法与设计类型不符；其次，该医师考虑了数据相差较大，即不满足t检验的前提条件正态分布，采用了对数变换，基本思想正确。但治疗前后的数据经对数变换后，其差值的变异仍然较大（经正态性检验，P＜0.05），因此仍不满足配对t检验的条件，故该资料宜采用非参数检验方法，即Wilcoxon配对设计的符号秩和检验，目的是推断配对资料的差值是否来自中位数为零的总体。

【例1-2】某医生用某种中药治疗I型糖尿病患者和II型糖尿病患者共45例，结果见表1-2。为评价该中药对两型糖尿病的疗效有无差异，该医生对此资料进行χ²检验，得χ²＝5.289，P＞0.05，差异无统计学意义，故认为该中药对两型糖尿病患者的疗效基本相同。

表1-2 某种中药治疗两型糖尿病的疗效比较

【问题 1-2】

1．该资料是什么资料？

2．该研究是什么设计？

3．统计分析中有无不妥之处？

【分析】

(1) 该资料的分组变量（两型糖尿病）是二分类资料，分析变量（疗效等级）是等级资料，称为单向有序分类资料。

(2) 研究设计为完全随机设计。

(3) 统计分析不正确。该医生的研究目的是比较中药治疗两型糖尿病的疗效，用χ²检验只能说明各处理组的效应在分布上有无不同，而不能说明各处理组效应的平均水平有无差别，也就是说χ²检验没有利用等级信息，因此效率较低。该资料宜用非参数检验的Wilcoxon秩和检验。

案例分析－直线相关与回归分析

【例1-1】为评价环境噪音强度对社区居民生活的影响程度，某市疾病预防控制中心监测了该市10个社区的环境噪音强度，同时调查各社区居民的失眠患病率（%），结果见表1-1。经对噪音强度数量化（+ =1，++ =2，+++ =3，++++ =4，+++++ =5）后，某医师对该资料采用Pearson直线相关分析，得r＝0.853，P＜0.005，认为环境噪音强度与居民失眠患病率之间存在正相关关系。

表1-1 某市10个社区环境噪音强度与居民失眠患病率

【问题1-2】 1．这是什么资料？ 2．该医师处理方法是否正确？为什么？ 3．该资料应该用何种统计方法分析？

【分析】 (1) 该资料包含环境噪音强度与居民失眠患病率两个变量，一个属于等级资料，一个属于计量资料。 (2) 该医师处理方法不正确，因为环境噪音强度为等级资料，不服从正态分布，因此，不能用Pearson直线相关分析。 (3) 该资料应选用非参数统计方法，可采用Spearman的等级相关（Spearman’s rank correlation）来分析两者的关系。

【例1-2】某地对血吸虫流行区进行血吸虫与大肠癌关系的调查研究，抽查39个乡的资料，各乡抽查人数相同。血吸虫感染率最低为8.9％，最高为79.3％。将血吸虫感染率（％）作x，大肠癌标化死亡率（1/10万）为y，作相关回归分析，得r＝0.6315，P＜0.01，b＝0.1344，a＝4.152。【问题1-2】

(1)能否用直线回归方程描述两者的关系，为什么？

(2)若血吸虫感染率为20％，则大肠癌标化死亡率平均是多少？

(3)若血吸虫感染率为90％，大肠癌标化死亡率平均又是多少？

【分析】

(1)能用直线回归方程描述两变量间的关系，因为回归系数的假设检验与相关系数的假设检验等价，既然r的假设检验P＜0.01，可认为两变量有直线关系，所以能用直线回归方程来描述两变量间的关系：

ｙ＝4.152+0.1344x

(2)将x=20代入方程，求得 y＝6.84，则血吸虫感染率为20％时，大肠癌标化死亡率平均是6.84/10万，因为没有提供所需的数据，不可能求大肠癌标化死亡率的容许区间，所以到此结束。

(3)由于血吸虫感染率的实测值范围是8.9％～79.3％，90％已超出此范围，不宜用该回归方程来估计大肠癌标化死亡率。

案例分析-实验设计

1.案例11-1 某医师观察某新药治疗急性气管炎的疗效，用氨苄青霉素作对照。病人入院时，体温在39℃以下分入治疗组，39℃及以上分入对照组，结果新药疗效优于氨苄青霉素。

【问题11-1】（1）该医师的结论是否正确？（2）实验设计有何缺陷？（3）应该怎样正确设计？

【分析】(1) 该医师的结论不正确。(2) 该实验设计违犯了均衡性原则和随机化原则，实验结果没有可比性。因为体温在39℃及以上者病情较重，39℃以下者病情较轻，治疗组和对照组病人的病情程度不同即病情不均衡，治疗组为轻病人，对照组为重病人，这类试验必然导致错误的试验结果。如果治疗组和对照组交换一下，对照组为轻病人，该新药可能就没有效果。(3) 正确的实验设计：随机抽取足够样本含量的急性气管炎病人，采用随机方法，将39℃及以上病人随机分成治疗组和对照组，将39℃以下病人也随机分成治疗组和对照组，两组除了治疗药物不同外，其它条件尽可能相同，采用盲法进行治疗和观察，结果进行假设检验以后再下结论。

上述分析表明：临床科研结果的好坏取决于临床试验设计的好坏，良好的实验设计才能得到较好的科研结果。

2.案例11-2 某研究者欲评价多糖铁复合物治疗儿童轻度缺铁性贫血的疗效，在城北小学抽取60名确诊为轻度缺铁性贫血的儿童，服用多糖铁复合物为实验组；在城南小学抽取60名确诊为轻度缺铁性贫血的儿童，未服用多糖铁复合物为对照组，观察指标是血红蛋白含量。结果城北小学观察对象血红蛋白均值明显上升，城南小学观察对象血红蛋白略有提高，但比城北小学低，故认为多糖铁复合物有升血红蛋白作用，能有效治疗缺铁性贫血。

【问题11-2】

（1）该研究者遵循的均衡原则是否合理？为什么？

（2）该研究的混杂因素是什么？

（3）应该怎样正确设计？

【分析】(1) 该实验设计的缺陷是违背了均衡原则，即不清楚两所小学儿童的家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近，如果明显不同，则影响血红蛋白含量的因素除药物外，也可能是儿童饮食营养条件，不能将血红蛋白量升高这一结果完全归之于多糖铁复合物的疗效。因此认为这个没计是不均衡设计。(2) 本研究的混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制，就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难的，可通过交叉均衡设计，以达到均衡目的。(3) 正确设计：将城南小学60名儿童随机分成两组，30名服用多糖铁复合物，30名不服药；城北小学60名儿童也随机分成两组，30名服药，30名不服药。观察一段时间后，对城南和城北小学分开比较试验组和对照组即服药与不服药的血红蛋白有无差别，也可将测得城南小学30名服药儿童和城北小学30名服药儿童合并，作为实验组求平均值，再将两小学各30名未服药儿童的测定结果合并，作为对照组求平均值。对实验组和对照组的平均值进行假设检验，如果实验组的血红蛋白值高于对照组，且差异有统计学意义，可认为多糖铁复合物对血红蛋白有影响，对儿童轻度缺铁性贫血有治疗作用。

3.案例11-3 为评价某种国产抗菌新药的疗效，某医生抽取患有某种疾病且符合入选条件的60例患者，按入院后床位的单双号分为两组，每组30人。试验组服用该新药，对照组服用同类公认有效的进口药，临床观察结果见表11-9。经四格表卡方检验，得卡方=3.750，P＞0.05，差异无统计学意义，故认为该国产抗菌新药与同类进口药的疗效基本相同。

表11-1　两组患者用药后有效率比较

【问题11-3】

（1）该研究属何种类型？

（2）在设计的过程中是否遵循了实验设计的基本原则？

（3）该临床试验为何种对照？

（4）该医师的结论是否可靠？为什么？

【分析】(1) 该研究属临床试验设计。(2) 在设计与实施的过程中，该医生是按照床位号码将入选的60例患者随意分组，未能按照随机化的原则分组。(3) 该临床试验为标准对照。(4) 由于该医生未遵循随机化原则，样本的代表性差，两组患者的非处理因素不均衡，可比性差，因此其结论不可靠。

4.例11-4 某研究者欲评价佳加学生钙治疗儿童轻度缺钙的疗效，在实验幼儿园抽取80名确诊为轻度缺钙的儿童，服用佳加学生钙为试验组；在该地机关幼儿园抽取80名确诊为轻度缺钙的儿童，未服用佳加学生钙为对照组，观察指标是头发中钙的含量。结果试验组实验幼儿园的儿童发钙均值明显上升，机关幼儿园的观察对象发钙略有提高，但比试验组低，故认为佳加学生钙有补钙作用，能有效治疗儿童缺钙。

佳加学生钙为试验组；在该地机关幼儿园抽取80名确诊为轻度缺钙的儿童，未服用佳加学生钙为对照组，观察指标是头发中钙的含量。结果试验组实验幼儿园的儿童发钙均值明显上升，机关幼儿园的观察对象发钙略有提高，但比试验组低，故认为佳加学生钙有补钙作用，能有效治疗儿童缺钙。

【问题11-4】

（1）该研究者遵循了均衡原则吗？为什么？

（2）该研究的混杂因素是什么？

（3）应该怎样正确设计？

【分析】

(1) 该实验设计的缺陷是违背了均衡原则，即不清楚两所幼儿园儿童的家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近，如果明显不同，则影响发钙含量的因素除药物外，也可能是儿童饮食习惯、营养条件是否相同或很相近，如果明显不同，则影响发钙含量的因素除药物外，也可能是儿童饮食营养条件，不能将发钙升高这一结果完全归之于佳加学生钙的疗效。因此认为这个没计是不均衡设计。

(2) 本研究的混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制，就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难的，可通过交叉均衡设计，以达到均衡目的。

(3) 正确设计：将实验幼儿园80名儿童随机分成两组，40名服用佳加学生钙，40名不服药；机关幼儿园80名儿童也随机分成两组，40名服药，40名不服药。观察一段时间后，对两个幼儿园分开比较试验组和对照组即服药与不服药的血清钙和发钙有无差别，也可将测得实验幼儿园40名服药儿童和机关幼儿园40名服药儿童合并，作为实验组求平均值，再将两幼儿园各40名未服药儿童的测定结果合并，作为对照组求平均值。对实验组和对照组的平均值进行假设检验，如果实验组的血清钙和发钙值高于对照组，且差异有统计学意义，可认为佳加学生钙对发钙有影响，对儿童轻度缺钙有治疗作用。

相关推荐

医学统计学案例分析 (1)

专栏推荐