搜档网
当前位置:搜档网 › 医学统计学案例分析

医学统计学案例分析

医学统计学案例分析
医学统计学案例分析

医学统计学案例分析

案例分析—四格表确切概率法

【例1-5】为比较中西药治疗急性心肌梗塞de疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检2验,得连续性校正χP,0.05,差异无统计学意义,故认为中西药治=3.134,疗急性心肌梗塞de疗效基本相同。

表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12(9.33) 2(4.67) 14 85.7 西药 6(8.67) 7(4.33) 13 46.2 合计 18 9 27 66.7

【问题1-5】

(1) 这是什么资料,

(2) 该资料属于何种设计方案,

(3) 该医师统计方法是否正确,为什么,

【分析】

(1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。

(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。

2(3) 患者总例数n=27,40,该医师用χ检验是不正确de。当n,40或T,1时,

2不宜计算χ值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率

案例分析,卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎de疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结检验(有效=1,无效=0)进行进行果t,2.848,P,0.005,差异有统计学意义

假设检验,结果t,2.848,P,0.005,差异有统计学意义,故认为中西药治疗胃炎de疗效有差别,中药疗效高于西药。

【问题1-1】

(1)这是什么资料,(2)该资料属于何种设计方案,

(3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料,即计数资料。

(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布de计量资料,不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别,应用四格表资料de 检验(chi-square test)。

【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。

表1-1 中药和西药治疗非典病人有效率de比较

药物有效无效合计有效率(,)

中药 (11.2) (16.8) 28 50.0 1414

西药 2 (4.8) 10 (7.2) 12 16.7

合计 16 24 40 40.0

某医师认为这是完全随机设计de2组二分类资料,可用四格表de检验。其步骤如下:

1(建立检验假设,确定检验水准

H:两药de有效率相等,即 0 π,π12

H:两药de有效率不等,即 1π?π12

2(计算检验统计量值

(1) 计算理论频数根据公式计算理论频数,填入表7-2de括号内。

2 (2) 计算χ值

具体计算略。

3(确定P值,做出统计推断

2查附表6(χ界值表),得0.025,P,0.05,按水准,拒绝H,0α,0.05

,差异有统计学意义,可认为两药de有效率不等,中药疗效高于西药。【问接受H1

题1-2】 (1)这是什么资料, (2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,

【分析】

中西药de疗效按有效和无效分类,该医师认为此资料是二分类资料即(1) 计数资料是正确de。

(2) 40例患者随机分配到西药组和中药组,属于完全随机设计方案。

(3) 该医师用四格表检验是正确de,但计算值de公式不对。因为有一

2个理论频数(T=4.8)小于5大于1,应用连续性校正公式计算χ值。具体计算21

略。

2 查附表6(χ界值表),得0.250,P,0.100,按α,0.05水准,不拒绝H,差别无统计学意义,尚不能认为两药de有效率不相同,中药疗效与西0 药疗效基本相同。结论与前述相反。

案例分析,卡方检验(二)

【例1-3】某医师用某种中草药治疗不同类型de小儿肺炎,其中病毒性肺炎60例,细菌性肺炎60例,治疗结果见表1-2。该医师对此资料采用行×列检验,2得χ =7.077,P=0.069,差异无统计学意义,故认为此种中草药对不同类型小儿肺炎de疗效分布无差别。

表1-2 某种中草药治疗不同类型小儿肺炎de疗效比较小儿肺炎类型治愈

显效有效无效合计病毒性肺炎 21 17 11 11 60 细菌性肺炎 11 13 17 19 60

合计 32 30 28 30 120

【问题1-3】(1)该研究是什么设计,(2)统计分析de目de是什么,统计方法是

否正确,

【分析】(1) 该资料为完全随机设计方案。(2) 欲比较两组de疗效是否有差别,其比较de结局变量(分析变量)是等级资料,为单向有序分类资料。用2 χ检验不妥,因为如果对其中de两列不同疗效de数值进行调换,值不会有变化,但秩和检验统计量有变化,所以该资料应该采用利用等级信息较好de秩和检验或Ridit分析。(经秩和检验,结果为Z= -2.570,P=0.010,差异有统计学意义。该结论与上述结论相反。)

案例分析,卡方检验(三)

【例1-4】某医院采用甲乙两种方法测定60例恶性肿瘤患者体内ck基20因

表达阳性率,甲法测定阳性率为70.0,,乙法测定阳性率为38.3,,两种方法一致测定阳性率为26.7,。为比较甲乙两种方法de测定阳性率是否有差异,该医生首

先将资料整理为表1-3。然后采用四格表检验进行假设检验,得χ2=12.118,

P,0.005,差异有统计学意义,故认为甲乙两种方法de测定结果有差别,甲法测定阳性率较高。

表1-3 两种方法测定结果比较

测定方法阳性数阴性数合计阳性率(%)

甲法 42 18 60 70.0

乙法 23 37 60 38.3

合计 65 55 120 54.2 【问题1-4】(1)这是什么资料,(2)该资料属于何种设计方案,

(3)该医师统计方法是否正确,为什么,(4)该资料应采用何种统计方法,【分析】(1) 该资料是按两种方法测定结果(阳性、阴性)分类de计数资料。 (2) 该设计为同一受试对象接受两种不同de处理,属于自身配对设计方案。(3) 该2医师用完全随机设计资料de四格表χ检验分析配对设计资料,其统计表和统计方法均不正确。

(4) 比较甲乙两种方法测定结果de阳性率是否有差别,应采用配对χ2检验(或McNemar检验)。

案例分析,t检验

【例1-1】某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量(mg/dl),结果如表1-1。该医生根据此资料算得正常人尿中类固醇排出量de均数=4.266mg/dl,标准差S=0.985mg/dl;脑病病人尿中类固醇排出量1 de均数=5.732mg/dl,标准差S=1.626mg/dl,配对t检验结果,t = –

3.098,2

P < 0.05,故认为脑病病人尿中类固醇排出量高于正常人。

表1-1 正常人和脑病病人尿中类固醇排出量(mg/dl)测定结果分组尿中类固醇排出量(mg/dl)

2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37

3.05 2.78 正常人

5.28 8.79 3.84

6.46 3.79 6.64 5.89 4.57

7.71 6.02 4.06 脑病病人

【问题1-1】 1(该资料属于何种设计方案, 2(该医生de统计处理是否正确,为什么,

【分析】 (1) 该资料是随机从两人群(研究de两个总体)中抽取样本,测量尿中类固醇排出量,属于完全随机设计。 (2)该统计处理不正确。对完全随机设计de资料不宜用配对t检验。本资料应用完全随机设计两样本均数比较det检验,目de是判断两样本均数分别代表de两总体均数和是否相同。

【例1-2】 2005年某县疾病预防控制中心为评价该县小学生卡介苗抗体效价,随机抽取了30名小学生,测定结果见表1-2。经完全随机设计两样本均数比较det检验(方差齐,F=0.096,P>0.05),t = 0.014,P>0.05,故认为该县小学生卡介苗抗体效价无性别差异。

表1-2 2005年某县30名小学生卡介苗抗体滴度测定结果分卡介苗抗体滴度(倒数) 组

男40 20 160 40 320 80 40 20 40 80 160 40 80 40 40 40 生

女80 20 160 40 40 160 40 20 40 160 160 40 80 40 生

【问题1-2】1(该资料属于何种设计方案? 2(统计处理是否正确,为什么, 【分析】 (1) 该资料是随机抽取当地30名小学男生和女生作为样本,测定每个观察对象de卡介苗抗体滴度,属于完全随机设计。 (2) 由于抗体滴度值是等比各组de平均滴度应用几何均数()描述,其假设检资料,服从对数正态分布, G 验不能直接用完全随机设计两样本均数比较det检验, 而应将观察值进行对数变换后再用检验。 t

方差分析

【例6-1】某研究者为研究核黄素缺乏对尿中氨基氮de影响,将60只

Wistar大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20只大白鼠。一周后测尿中氨基氮de三天排出量,结果如表6-1。该研究者对上述

资料采用了两样本均数t检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P<0.05)。检验进行两两比较,

得出结论:三组之间均数差异均有统计学意义(P<0.05)。

表6-1 3组大白鼠在进食一周后尿中氨基氮de三天排出量(mg)

6.02 3.70 2.46 4.71 3.82

7.04 4.73 4.77 3.93 6.56 核黄素缺乏组

8.69 3.44 5.96 3.60 2.36 4.65 3.77 6.94 4.62 4.63

3.23 3.47 2.59 3.30 2.60

4.99 3.20 4.27 3.14 8.42 限食量组 7.14 2.49 3.13 3.26 2.50 3.21 2.61 4.90 3.23 4.07

8.21 5.66 5.34 7.36 6.84 5.20 5.11 4.69 9.33 11.55 不限食量组 9.98 4.04 8.06 5.48 5.19 7.30 6.76 5.08 5.05 4.61

【问题6-1】(1)这是什么资料,(2)该资料属于何种设计方案,(3)该研究者处理方法是否正确,为什么,

【分析】(1) 由于测定de是三组大白鼠尿中氨基氮含量,属于多组计量资料。(2) 60只大白鼠随机分为三组,属于完全随机设计方案。(3) 该研究者统计处理方法不正确,因为t检验适用于完全随机设计de两组计量资料de比较,不适用于多组计量资料de比较。(4) 要比较检验多组完全随机设计计量资料de多个样本均数有无差别,需用完全随机设计计量资料de方差分析。

2.【例6-2】某医师研究A、B、C三种药物治疗肝炎de效果,将30只大白鼠感染肝炎后,按性别相同、体重接近de条件配成10个区组,然后将各配伍组中3只大白鼠随机分配到各组:分别给予A、B和C药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表6-7。该医师用完全随机设计资料de方差分析方法对资料进行了假设检验,F,12.63,P,0.001,故认为三种药物de疗效不全相同。

表6-2 A、B、C三种药物治疗后大白鼠血清谷丙转氨酶浓度(IU/L)

1 2 3 4 5 6 7 8 9 10 区组号

652.40 741.30 675.60 582.80 491.80 412.20 494.60 379.50 679.48 588.78 处理A

624.30 772.30 632.50 473.60 462.80 431.80 484.90 380.70 634.93 474.56 处理B

445.10 432.50 362.70 348.70 345.90 312.80 296.30 228.40 372.26 352.77 处理C

【问题6-2】 (1) 该资料是什么资料, (2) 该研究是什么设计, (3) 统计分析方法是否恰当,

【分析】 (1) 由于测定de是血清谷丙转氨酶浓度(IU/L),属于多组计量资料。 (2) 30只大白鼠,按性别相同、体重接近划分为10个区组。每个区组3只大白鼠随机采用A、B、C三种药物治疗,故属于随机区组设计方案。 (3) 该医师应用完全随机设计计量资料de方差分析进行检验是不正确de,应该选用随机区组设计de方差分析方法进行检验。

案例分析,秩和检验

例1-1】某医师用改良deSeldinger’s插管技术对8例经临床和病理证实de 恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中deHCG含量如表1-1。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较det检验,得t =2.460,P,0.05,差异有统计学意义,故认为治疗前后血中HCGde 含量有差别。

表1-1 灌注化疗前后HCG含量测定结果(pmol/L)

病例号灌注前(X) 灌注后(X) lgX lgX 1212

(1) (2) (3) (4) (5)

1 1280000 210000 6.107

2 5.3222

2 75500 3300 4.8779 3.5185

3 12450 2210 4.0952 3.3444

4 1500000 9.3 6.1761 0.9685

5 10000 2500 4.0000 3.3979

6 9700 1203 3.9868 3.0803

7 15588 4825 4.1928 3.6835

8 4223 914 3.6256 2.9609

【问题1-1】

1(这是什么资料?

2(该实验属于何种设计方案,

3(该医师统计方法是否正确,为什么,

【分析】

(1) 该资料为计量资料。

(2) 该实验属自身配对设计方案。

(3) 该医师统计方法不正确。首先,配对资料一般采用对每对数据求差值后进行比较,而该医师采用完全随机设计资料de检验方法,统计方法与设计类型不符;其次,该医师考虑了数据相差较大,即不满足t检验de前提条件正态分布,采用了对数变换,基本思想正确。但治疗前后de数据经对数变换后,其差值de变异仍然较大(经正态性检验,,0.05),因此仍不满足配对检验dePt条件,故该资料宜采用非参数检验方法,即Wilcoxon配对设计de符号秩和检验,目de是推断配对资料de差值是否来自中位数为零de总体。

【例1-2】某医生用某种中药治疗I型糖尿病患者和II型糖尿病患者共45例,结果见表1-2。为评价该中药对两型糖尿病de疗效有无差异,该医生对

22此资料进行χ,5.289,,0.05,差异无统计学意义,故认为该中检验,得

χP

药对两型糖尿病患者de疗效基本相同。

表1-2 某种中药治疗两型糖尿病de疗效比较

疗效等级 I型糖尿病 II型糖尿病合计

9 3 12 无效

8 9 17 好转

5 11 1

6 显效

22 23 45 合计

【问题 1-2】

1(该资料是什么资料,

2(该研究是什么设计,

3(统计分析中有无不妥之处,

【分析】

(1) 该资料de分组变量(两型糖尿病)是二分类资料,分析变量(疗效等级)是等级资料,称为单向有序分类资料。

(2) 研究设计为完全随机设计。

(3) 统计分析不正确。该医生de研究目de是比较中药治疗两型糖尿病de疗效,2用χ检验只能说明各处理组de效应在分布上有无不同,而不能说明各处理组效2应de平均水平有无差别,也就是说χ检验没有利用等级信息,因此效率较低。该资料宜用非参数检验deWilcoxon秩和检验。

案例分析,直线相关与回归分析

【例1-1】为评价环境噪音强度对社区居民生活de影响程度,某市疾病预防控制中心监测了该市10个社区de环境噪音强度,同时调查各社区居民de失眠患

病率(%),结果见表1-1。经对噪音强度数量化(+ =1,++ =2,+++ =3,++++ =4,+++++ =5)后,某医师对该资料采用Pearson直线相关分析,得r,0.853,

P,0.005,认为环境噪音强度与居民失眠患病率之间存在正相关关系。

表1-1 某市10个社区环境噪音强度与居民失眠患病率

1 2 3 4 5 6 7 8 9 10 社区编号

++++ +++ + ++ +++ +++++ + +++ ++ ++++ 噪音强度

失眠患病率21.20 23.40 11.40 16.90 17.50 26.30 13.60 25.60 11.60 25.30 (%)

【问题1-2】 1(这是什么资料, 2(该医师处理方法是否正确,为什么, 3(该资料应该用何种统计方法分析,

【分析】 (1) 该资料包含环境噪音强度与居民失眠患病率两个变量,一个属于等级资料,一个属于计量资料。 (2) 该医师处理方法不正确,因为环境噪音强度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。 (3) 该资料应选用非参数统计方法,可采用Spearmande等级相关(Spearman’s rank correlation)来分析两者de关系。

【例1-2】某地对血吸虫流行区进行血吸虫与大肠癌关系de调查研究,抽查39个乡de资料,各乡抽查人数相同。血吸虫感染率最低为8.9,,最高为79.3,。将血吸虫感染率(,)作x,大肠癌标化死亡率(1/10万)为y,作相关回归分析,得r,0.6315,P,0.01,b,0.1344,a,4.152。【问题1-2】

(1)能否用直线回归方程描述两者de关系,为什么,

(2)若血吸虫感染率为20,,则大肠癌标化死亡率平均是多少,

(3)若血吸虫感染率为90,,大肠癌标化死亡率平均又是多少,

【分析】

(1)能用直线回归方程描述两变量间de关系,因为回归系数de假设检验与相关系数de假设检验等价,既然rde假设检验,0.01,可认为两变量有直线P 关系,所以能用直线回归方程来描述两变量间de关系:

,,4.152+0.1344 x

(2)将x=20代入方程,求得y,6.84,则血吸虫感染率为20,时,大肠癌

标化死亡率平均是6.84/10万,因为没有提供所需de数据,不可能求大肠癌标化死亡率de容许区间,所以到此结束。

(3)由于血吸虫感染率de实测值范围是8.9,,79.3,,90,已超出此范围,不宜用该回归方程来估计大肠癌标化死亡率。

案例分析-实验设计

1.案例11-1 某医师观察某新药治疗急性气管炎de疗效,用氨苄青霉素作对照。病人入院时,体温在39?以下分入治疗组,39?及以上分入对照组,结果新药疗效优于氨苄青霉素。

【问题11-1】(1)该医师de结论是否正确,(2)实验设计有何缺陷,(3)应该怎样正确设计,

【分析】(1) 该医师de结论不正确。(2) 该实验设计违犯了均衡性原则和随机化原则,实验结果没有可比性。因为体温在39?及以上者病情较重,39?以下者病情较轻,治疗组和对照组病人de病情程度不同即病情不均衡,治疗组为轻病人,对照组为重病人,这类试验必然导致错误de试验结果。如果治疗组和对照组交换一下,对照组为轻病人,该新药可能就没有效果。(3) 正确de实验设计:随机抽取足够样本含量de急性气管炎病人,采用随机方法,将39?及以上病人随机分成治疗组和对照组,将39?以下病人也随机分成治疗组和对照组,两组除了治疗药物不同外,其它条件尽可能相同,采用盲法进行治疗和观察,结果进行假设检验以后再下结论。

上述分析表明:临床科研结果de好坏取决于临床试验设计de好坏,良好de实验设计才能得到较好de科研结果。

2.案例11-2 某研究者欲评价多糖铁复合物治疗儿童轻度缺铁性贫血de疗效,在城北小学抽取60名确诊为轻度缺铁性贫血de儿童,服用多糖铁复合物为实验组;在城南小学抽取60名确诊为轻度缺铁性贫血de儿童,未服用多糖铁复合物为对照组,观察指标是血红蛋白含量。结果城北小学观察对象血红蛋白均值明显上升,城南小学观察对象血红蛋白略有提高,但比城北小学低,故认为多糖铁复合物有升血红蛋白作用,能有效治疗缺铁性贫血。

【问题11-2】

(1)该研究者遵循de均衡原则是否合理,为什么,

(2)该研究de混杂因素是什么,

(3)应该怎样正确设计,

【分析】(1) 该实验设计de缺陷是违背了均衡原则,即不清楚两所小学儿童

de家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果

明显不同,则影响血红蛋白含量de因素除药物外,也可能是儿童饮食营养条件,不能将血红蛋白量升高这一结果完全归之于多糖铁复合物de疗效。因此认为这个没计是不均衡设计。(2) 本研究de混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难de,可通过交叉均衡设计,以达到均衡目de。(3) 正确设计:将城南小学60名儿童随机分成两组,30名服用多糖铁复合物,30名不服药;城北小学60名儿童也随机分成两组,30名服药,30名不服药。观察一段时间后,对城南和城北小学分开比较试验组和对照组即服药与不服药de血红蛋白有无差别,也可将测得城南小学30名服药儿童和城北小学30名服药儿童合并,作为实验组求平均值,再将两小学各30名未服药儿童de

测定结果合并,作为对照组求平均值。对实验组和对照组de平均值进行假设检验,如果实验组de血红蛋白值高于对照组,且差异有统计学意义,可认为多糖铁复合物对血红蛋白有影响,对儿童轻度缺铁性贫血有治疗作用。

3.案例11-3 为评价某种国产抗菌新药de疗效,某医生抽取患有某种疾病且符合入选条件de60例患者,按入院后床位de单双号分为两组,每组30人。试验组服用该新药,对照组服用同类公认有效de进口药,临床观察结果见表11-9。经四格表卡方检验,得卡方=3.750,P,0.05,差异无统计学意义,故认为该国产抗菌新药与同类进口药de疗效基本相同。

组例数有效有效率(%) 分

30 21 70.0 国产抗菌新药

30 27 90.0 同类进口药

表11-1 两组患者用药后有效率比较

【问题11-3】

(1)该研究属何种类型,

(2)在设计de过程中是否遵循了实验设计de基本原则,

(3)该临床试验为何种对照,

(4)该医师de结论是否可靠,为什么,

【分析】(1) 该研究属临床试验设计。(2) 在设计与实施de过程中,该医生是按照床位号码将入选de60例患者随意分组,未能按照随机化de原则分组。(3) 该临床试验为标准对照。(4) 由于该医生未遵循随机化原则,样本de代表性差,两组患者de非处理因素不均衡,可比性差,因此其结论不可靠。

4.例11-4 某研究者欲评价佳加学生钙治疗儿童轻度缺钙de疗效,在实验幼儿园抽取80名确诊为轻度缺钙de儿童,服用佳加学生钙为试验组;在该地机关幼儿园抽取80名确诊为轻度缺钙de儿童,未服用佳加学生钙为对照组,观察指标是头

发中钙de含量。结果试验组实验幼儿园de儿童发钙均值明显上升,机关幼儿园de观察对

象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。

佳加学生钙为试验组;在该地机关幼儿园抽取80名确诊为轻度缺钙de儿童,未服用佳加学生钙为对照组,观察指标是头发中钙de含量。结果试验组实验幼儿园de儿童发钙均值明显上升,机关幼儿园de观察对象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。

【问题11-4】

(1)该研究者遵循了均衡原则吗,为什么,

(2)该研究de混杂因素是什么,

(3)应该怎样正确设计,

【分析】

(1) 该实验设计de缺陷是违背了均衡原则,即不清楚两所幼儿园儿童de家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量de因素除药物外,也可能是儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量de因素除药物外,也可能是儿童饮食营养条件,不能将发钙升高这一结果完全归之于佳加学生钙de疗效。因此认为这个没计是不均衡设计。

(2) 本研究de混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难de,可通过交叉均衡设计,以达到均衡目de。

(3) 正确设计:将实验幼儿园80名儿童随机分成两组,40名服用佳加学生钙,40名不服药;机关幼儿园80名儿童也随机分成两组,40名服药,40名不服药。观

察一段时间后,对两个幼儿园分开比较试验组和对照组即服药与不服药de血清钙和发钙有无差别,也可将测得实验幼儿园40名服药儿童和机关幼儿园40名服药儿童合并,作为实验组求平均值,再将两幼儿园各40名未服药儿童de 测定结果合并,作为对照组求平均值。对实验组和对照组de平均值进行假设检

验,如果实验组de血清钙和发钙值高于对照组,且差异有统计学意义,可认为

佳加学生钙对发钙有影响,对儿童轻度缺钙有治疗作用。

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

常用医学统计学方法汇总

选择合适的统计学方法 1 连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t 检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验;(2)采用非参数检验,如Wilcoxon 检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t '检验;(2)采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t 检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon 的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果 为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe 法,SNK 法等。 1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal -Wallis 法。如 果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用成组的Wilcoxon 检验。 1.4 多组随机区组样本比较 1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。 1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman 检验法。如果 检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用符号配对的Wilcoxon 检验。 **** 需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。** 绝不能对其中的两 组直接采用t检验,这样即使得出结果也未必正确**

《医学统计学》复习题

医学统计学复习题 一、名词解释 1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。 6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。 7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 12.参数:指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学试题及答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学知识点

实用标准 文档大全第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB 等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

医学统计学案例分析

医学统计学案例分析评述 医学期刊论着:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的 【统计方法】 (1)本论着未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选 用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。

(2)文献尽管在“统计学处理”中提及了“使用软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确采用了那种统计方法,即是卡方检验还是秩和检验等。 (3)在没有提及统计方法的前提下,全文也没有表示统计结果,即具体的计算值和相对应的P值,只有P<,表述不完整。 正确的统计分析方法、具体的统计量值和P值是最终准确推断结论的重要依据,三者缺一不可。所以,具体的P值和统计量应在论文表格或文字描述中说明。 (4)统计符号书写不规范: 检验水准表述有误,原文“检验水平取P=”,应改为“检验水准ɑ=”。 【结果表达】 (1)在“不同时间段接种人数比较”中: ①原文:研究将研究对象按照2010 年1 月-2011 年4 月,2011 年5月-2012 年 5 月分为两个时间段进行研究,第一个时间段接种人数为460 6 人,第 二时间段接种人数为2264 人。第二时间段较第一时间段接种人数明显 减少,且具有显着差异性(P<)。 ②错误:结果表述有误:“第二时间段较第一时间段接种人数明显减少,且具有 显着差异性”。2个时间段研究对象数量不同,通过统计分析不能得出 “人数明显较少”的结论,应表述为:按ɑ=水准,差别有统计学意 义,可以认为2个时间段接种人数不同。 (2)在“结果和”的结论中: ①错误:均未明确具体的统计值及相对应的P值,“具有显着性差异”应改为“差 别有统计学意义”。 (3)统计表表示不正确: ①统计表为三线表,在有“合计”一项时,应加一条分隔线。

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

医学统计学公式整理 简洁版

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1 n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1)(2--∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 %100?= X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )(' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1)n S X ? ±96.1 (2)n S n t t ?±-)1(,05.0(前一个t 表示均数) 单样本t 检验: n S X t /0 μ-= 自由度为 n-1; 配对样本t 检验: 检验统计量: n S d t d /0-= 自由度为n-1(n 为对子数) 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错: Sc 的平方) 2 )()(2)1()1(21222211212 222112-+-+-= -+-+-= ∑∑n n X X X X n n S n S n S c 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量: (较小)(较大)2 2 2 1 S S F = 分子自由度为n 1-1,分母自由度为n 2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=N X X ij ij /)(22 ∑=N X C ij /)( 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示 n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np - 均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2121n n p p p p Z c c +--= 2121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率为 ∑∑==-==≤k X k X X X e X P k X P 0 ! )()(λλ 发生次数至少为k 次的概率为 )1(1)(-≤-=≥k X P k X P 总体均数的区间估计:正态近似法 95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较 正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为 λ λ-= X Z 两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

相关主题