搜档网
当前位置:搜档网 › 医学统计学案例分析

医学统计学案例分析

医学统计学案例分析
医学统计学案例分析

医学统计学案例分析

案例分析—四格表确切概率法

【例1-5】为比较中西药治疗急性心肌梗塞de疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检2验,得连续性校正χP,,差异无统计学意义,故认为中西药治=,

疗急性心肌梗塞de疗效基本相同。

表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12 2 14 西药 6 7 13 合计 18 9 27

【问题1-5】

(1) 这是什么资料,

(2) 该资料属于何种设计方案,

(3) 该医师统计方法是否正确,为什么,

【分析】

(1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。

(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。

2(3) 患者总例数n=27,40,该医师用χ检验是不正确de。当n,40或T,1时,2不宜计算χ值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率

案例分析,卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎de疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结

检验(有效=1,无效=0)进行进行果t,,P,,差异有统计学意义

假设检验,结果t,,P,,差异有统计学意义,故认为中西药治疗胃炎de疗效有差别,中药疗效高于西药。

【问题1-1】

(1)这是什么资料,(2)该资料属于何种设计方案,

(3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料,即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计

方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布de计量资料,不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别,应用四格表资料de 检

验(chi-square test)。

【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。

表1-1 中药和西药治疗非典病人有效率de比较

药物有效无效合计有效率(,)

中药 28 1414

西药 2 10 12

合计 16 24 40

某医师认为这是完全随机设计de2组二分类资料,可用四格表de检验。其步

骤如下:

1(建立检验假设,确定检验水准

[

H:两药de有效率相等,即0 π,π12

H:两药de有效率不等,即1ππ12

2(计算检验统计量值

(1) 计算理论频数根据公式计算理论频数,填入表7-2de括号内。

2 (2) 计算χ值

具体计算略。

3(确定P值,做出统计推断

2查附表6(χ界值表),得,P,,按水准,拒绝H,0α,

,差异有统计学意义,可认为两药de有效率不等,中药疗效高于西药。【问接受H1

题1-2】 (1)这是什么资料, (2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,

【分析】

中西药de疗效按有效和无效分类,该医师认为此资料是二分类资料即(1)

计数资料是正确de。

(2) 40例患者随机分配到西药组和中药组,属于完全随机设计方案。

(3) 该医师用四格表检验是正确de,但计算值de公式不对。因为有一

2个理论频数(T=小于5大于1,应用连续性校正公式计算χ值。具体计算21略。

2 查附表6(χ界值表),得,P,,按α,水准,不拒绝H,差别无统计学意义,尚不能认为两药de有效率不相同,中药疗效与西0

药疗效基本相同。结论与前述相反。

案例分析,卡方检验(二)

【例1-3】某医师用某种中草药治疗不同类型de小儿肺炎,其中病毒性肺炎

60例,细菌性肺炎60例,治疗结果见表1-2。该医师对此资料采用行×列检验,2得χ =,P=,差异无统计学意义,故认为此种中草药对不同类型小儿肺炎de

疗效分布无差别。

表1-2 某种中草药治疗不同类型小儿肺炎de疗效比较小儿肺炎类型治愈显

效有效无效合计病毒性肺炎 21 17 11 11 60 细菌性肺炎 11 13 17 19 60 合计 32 30 28 30 120

【问题1-3】(1)该研究是什么设计,(2)统计分析de目de是什么,统计方法是否正确,

【分析】(1) 该资料为完全随机设计方案。(2) 欲比较两组de疗效是否有差别,其比较de结局变量(分析变量)是等级资料,为单向有序分类资料。用2 χ检验不妥,因为如果对其中de两列不同疗效de数值进行调换,值不会有变化,但秩和

检验统计量有变化,所以该资料应该采用利用等级信息较好de秩和检验或Ridit分析。(经秩和检验,结果为Z= ,P=,差异有统计学意义。该结论与上述结论相反。) 案例分析,卡方检验(三)

【例1-4】某医院采用甲乙两种方法测定60例恶性肿瘤患者体内ck基20因表达阳性率,甲法测定阳性率为,,乙法测定阳性率为,,两种方法一致测定阳性率为,。为比较甲乙两种方法de测定阳性率是否有差异,该医生首先将资料整理为表1-3。然后采用四格表检验进行假设检验,得χ2=,P,,差异有统计学意义,故认为甲乙两种方法de测定结果有

差别,甲法测定阳性率较高。

表1-3 两种方法测定结果比较

%

测定方法阳性数阴性数合计阳性率(%)

甲法 42 18 60

乙法 23 37 60

合计 65 55 120 【问题1-4】(1)这是什么资料,(2)该资料属于何种设计方案,

(3)该医师统计方法是否正确,为什么,(4)该资料应采用何种统计方法,【分析】(1) 该资料是按两种方法测定结果(阳性、阴性)分类de计数资料。 (2) 该设计为同一受试对象接受两种不同de处理,属于自身配对设计方案。(3) 该

2医师用完全随机设计资料de四格表χ检验分析配对设计资料,其统计表和统计方法均不正确。

(4) 比较甲乙两种方法测定结果de阳性率是否有差别,应采用配对χ2检验(或McNemar检验)。

案例分析,t检验

【例1-1】某医生随机抽取正常人和脑病病人各11例,测定尿中类固醇排出量(mg/dl),结果如表1-1。该医生根据此资料算得正常人尿中类固醇排出量de均数=dl,标准差S=dl;脑病病人尿中类固醇排出量1

de均数=dl,标准差S=dl,配对t检验结果,t = –,2

P < ,故认为脑病病人尿中类固醇排出量高于正常人。

表1-1 正常人和脑病病人尿中类固醇排出量(mg/dl)测定结果分组尿中类固醇排出量(mg/dl)

正常人

脑病病人

【问题1-1】 1(该资料属于何种设计方案, 2(该医生de统计处理是否正确,为什么,

【分析】 (1) 该资料是随机从两人群(研究de两个总体)中抽取样本,测量尿中类固醇排出量,属于完全随机设计。 (2)该统计处理不正确。对完全随机设计de资料不宜用配对t检验。本资料应用完全随机设计两样本均数比较det检验,目de 是判断两样本均数分别代表de两总体均数和是否相同。

【例1-2】 2005年某县疾病预防控制中心为评价该县小学生卡介苗抗体效价,随机抽取了30名小学生,测定结果见表1-2。经完全随机设计两样本均数比较det 检验(方差齐,F=,P>,t = ,P>,故认为该县小学生卡介苗抗体效价无性别差异。

表1-2 2005年某县30名小学生卡介苗抗体滴度测定结果分卡介苗抗体滴度(倒数) 组

男40 20 160 40 320 80 40 20 40 80 160 40 80 40 40 40 生

女80 20 160 40 40 160 40 20 40 160 160 40 80 40 生

]

【问题1-2】1(该资料属于何种设计方案 2(统计处理是否正确,为什么, 【分析】(1) 该资料是随机抽取当地30名小学男生和女生作为样本,测定每个观察对象de 卡介苗抗体滴度,属于完全随机设计。 (2) 由于抗体滴度值是等比各组de平均滴度应用几何均数()描述,其假设检资料,服从对数正态分布, G 验不能直接用完全随机设计两样本均数比较det检验, 而应将观察值进行对数变换后再用检验。 t

方差分析

【例6-1】某研究者为研究核黄素缺乏对尿中氨基氮de影响,将60只Wistar 大白鼠随机分为核黄素缺乏、限食量、不限食量三组不同饲料组。每组20只大白鼠。一周后测尿中氨基氮de三天排出量,结果如表6-1。该研究者对上述资料采用了两样本均数t检验进行两两比较,得出结论:三组之间均数差异均有统计学意义(P<。检验进行两两比较,

得出结论:三组之间均数差异均有统计学意义(P<。

表6-1 3组大白鼠在进食一周后尿中氨基氮de三天排出量(mg)

核黄素缺乏组

限食量组

不限食量组

(

【问题6-1】(1)这是什么资料,(2)该资料属于何种设计方案,(3)该研究者处理方法是否正确,为什么,

【分析】(1) 由于测定de是三组大白鼠尿中氨基氮含量,属于多组计量资料。

(2) 60只大白鼠随机分为三组,属于完全随机设计方案。(3) 该研究者统计处理方法不正确,因为t检验适用于完全随机设计de两组计量资料de比较,不适用于多组计量资料de比较。(4) 要比较检验多组完全随机设计计量资料de多个样本均数有无差别,需用完全随机设计计量资料de方差分析。

2.【例6-2】某医师研究A、B、C三种药物治疗肝炎de效果,将30只大白鼠感染肝炎后,按性别相同、体重接近de条件配成10个区组,然后将各配伍组中3只大白鼠随机分配到各组:分别给予A、B和C药物治疗。一定时间后,测定大白鼠血清谷丙转氨酶浓度(IU/L),如表6-7。该医师用完全随机设计资料de方差分析方法对资料进行了假设检验,F,,P,,故认为三种药物de疗效不全相同。

表6-2 A、B、C三种药物治疗后大白鼠血清谷丙转氨酶浓度(IU/L)

1 2 3 4 5 6 7 8 9 10 区组号

处理A

处理B

处理C

【问题6-2】 (1) 该资料是什么资料, (2) 该研究是什么设计, (3) 统计分析方法是否恰当,

【分析】 (1) 由于测定de是血清谷丙转氨酶浓度(IU/L),属于多组计量资料。

(2) 30只大白鼠,按性别相同、体重接近划分为10个区组。每个区组3只大白鼠随机采用A、B、C三种药物治疗,故属于随机区组设计方案。 (3) 该医师应用完全随机设计计量资料de方差分析进行检验是不正确de,应该选用随机区组设计de 方差分析方法进行检验。

案例分析,秩和检验

例1-1】某医师用改良deSeldinger’s插管技术对8例经临床和病理证实de恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中deHCG含量如表1-1。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较det 检验,得t =,P,,差异有统计学意义,故认为治疗前后血中HCGde含量有差别。

表1-1 灌注化疗前后HCG含量测定结果(pmol/L)

病例号灌注前(X) 灌注后(X) lgX lgX 1212

(1) (2) (3) (4) (5)

1 1280000 210000

2 75500 3300

3 12450 2210

4 1500000

5 10000 2500

^

6 9700 1203

7 15588 4825

8 4223 914

【问题1-1】

1(这是什么资料

2(该实验属于何种设计方案,

3(该医师统计方法是否正确,为什么,

【分析】

(1) 该资料为计量资料。

(2) 该实验属自身配对设计方案。

(3) 该医师统计方法不正确。首先,配对资料一般采用对每对数据求差值后进行比较,而该医师采用完全随机设计资料de检验方法,统计方法与设计类型不符;其次,该医师考虑了数据相差较大,即不满足t检验de前提条件正态分布,采用了对数变换,基本思想正确。但治疗前后de数据经对数变换后,其差值de变异仍然较大(经正态性检验,,,因此仍不满足配对检验dePt条件,故该资料宜采用非参数检验方法,即Wilcoxon配对设计de符号秩和检验,目de是推断配对资料de差值是否来自中位数为零de总体。

【例1-2】某医生用某种中药治疗I型糖尿病患者和II型糖尿病患者共45例,结果见表1-2。为评价该中药对两型糖尿病de疗效有无差异,该医生对22此资料进行χ,,,,差异无统计学意义,故认为该中检验,得χP

药对两型糖尿病患者de疗效基本相同。

表1-2 某种中药治疗两型糖尿病de疗效比较

疗效等级 I型糖尿病 II型糖尿病合计

9 3 12 无效

8 9 17 好转

5 11 1

6 显效

'

22 23 45 合计

【问题 1-2】

1(该资料是什么资料,

2(该研究是什么设计,

3(统计分析中有无不妥之处,

【分析】

(1) 该资料de分组变量(两型糖尿病)是二分类资料,分析变量(疗效等级)是等级资料,称为单向有序分类资料。

(2) 研究设计为完全随机设计。

(3) 统计分析不正确。该医生de研究目de是比较中药治疗两型糖尿病de疗效,2用χ检验只能说明各处理组de效应在分布上有无不同,而不能说明各处理组效2应de平均水平有无差别,也就是说χ检验没有利用等级信息,因此效率较低。该资料宜用非参数检验deWilcoxon秩和检验。

案例分析,直线相关与回归分析

【例1-1】为评价环境噪音强度对社区居民生活de影响程度,某市疾病预防控制中心监测了该市10个社区de环境噪音强度,同时调查各社区居民de失眠患病率(%),结果见表1-1。经对噪音强度数量化(+ =1,++ =2,+++ =3,++++ =4,+++++ =5)后,某医师对该资料采用Pearson直线相关分析,得r,,P,,认为环境噪音强度与居民失眠患病率之间存在正相关关系。

表1-1 某市10个社区环境噪音强度与居民失眠患病率

1 2 3 4 5 6 7 8 9 10 社区编号

++++ +++ + ++ +++ +++++ + +++ ++ ++++ 噪音强度

失眠患病率 (%)

【问题1-2】 1(这是什么资料, 2(该医师处理方法是否正确,为什么, 3(该资料应该用何种统计方法分析,

【分析】 (1) 该资料包含环境噪音强度与居民失眠患病率两个变量,一个属于等级资料,一个属于计量资料。 (2) 该医师处理方法不正确,因为环境噪音强度为等级资料,不服从正态分布,因此,不能用Pearson直线相关分析。 (3) 该资料应选用非参数统计方法,可采用Spearmande等级相关(Spearman’s rank correlation)来分析两者de关系。

【例1-2】某地对血吸虫流行区进行血吸虫与大肠癌关系de调查研究,抽查39个乡de资料,各乡抽查人数相同。血吸虫感染率最低为,,最高为,。将血吸虫感染率(,)作x,大肠癌标化死亡率(1/10万)为y,作相关回归分析,得r,,P,,b,,a,。【问题1-2】

(1)能否用直线回归方程描述两者de关系,为什么,

@

(2)若血吸虫感染率为20,,则大肠癌标化死亡率平均是多少,

(3)若血吸虫感染率为90,,大肠癌标化死亡率平均又是多少,

【分析】

(1)能用直线回归方程描述两变量间de关系,因为回归系数de假设检验与相关系数de假设检验等价,既然rde假设检验,,可认为两变量有直线P 关系,所以能用直线回归方程来描述两变量间de关系:

,,+ x

(2)将x=20代入方程,求得y,,则血吸虫感染率为20,时,大肠癌

标化死亡率平均是10万,因为没有提供所需de数据,不可能求大肠癌标化死亡率de容许区间,所以到此结束。

(3)由于血吸虫感染率de实测值范围是,,,,90,已超出此范围,不宜用该回归方程来估计大肠癌标化死亡率。

案例分析-实验设计

!

1.案例11-1 某医师观察某新药治疗急性气管炎de疗效,用氨苄青霉素作对照。病人入院时,体温在39以下分入治疗组,39及以上分入对照组,结果新药疗效优于氨苄青霉素。

【问题11-1】(1)该医师de结论是否正确,(2)实验设计有何缺陷,(3)应该怎样正确设计,

【分析】(1) 该医师de结论不正确。(2) 该实验设计违犯了均衡性原则和随机化原则,实验结果没有可比性。因为体温在39及以上者病情较重,39以下者病情较轻,治疗组和对照组病人de病情程度不同即病情不均衡,治疗组为轻病人,对照组为重病人,这类试验必然导致错误de试验结果。如果治疗组和对照组交换一下,对照组为轻病人,该新药可能就没有效果。(3) 正确de实验设计:随机抽取足够样本含量de急性气管炎病人,采用随机方法,将39及以上病人随机分成治疗组和对照组,将39以下病人也随机分成治疗组和对照组,两组除了治疗药物不同外,其它条件尽可能相同,采用盲法进行治疗和观察,结果进行假设检验以后再下结论。

上述分析表明:临床科研结果de好坏取决于临床试验设计de好坏,良好de实验设计才能得到较好de科研结果。

2.案例11-2 某研究者欲评价多糖铁复合物治疗儿童轻度缺铁性贫血de疗效,在城北小学抽取60名确诊为轻度缺铁性贫血de儿童,服用多糖铁复合物为实验

组;在城南小学抽取60名确诊为轻度缺铁性贫血de儿童,未服用多糖铁复合物为对照组,观察指标是血红蛋白含量。结果城北小学观察对象血红蛋白均值明显上升,城南小学观察对象血红蛋白略有提高,但比城北小学低,故认为多糖铁复合物有升血红蛋白作用,能有效治疗缺铁性贫血。

【问题11-2】

(1)该研究者遵循de均衡原则是否合理,为什么,

(2)该研究de混杂因素是什么,

(3)应该怎样正确设计,

【分析】(1) 该实验设计de缺陷是违背了均衡原则,即不清楚两所小学儿童de 家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响血红蛋白含量de因素除药物外,也可能是儿童饮食营养条件,不能将血红蛋白量升高这一结果完全归之于多糖铁复合物de疗效。因此认为这个没计是不均衡设计。(2) 本研究de混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难de,可通过交叉均衡设计,以达到均衡目de。(3) 正确设计:将城南小学60名儿童随机分成两组,30名服用多糖铁复合物,30名不服药;城北小学60名儿童也随机分成两组,30名服药,30名不服药。观察一段时间后,对

城南和城北小学分开比较试验组和对照组即服药与不服药de血红蛋白有无差别,也可将测得城南小学30名服药儿童和城北小学30名服药儿童合并,作为实验组

求平均值,再将两小学各30名未服药儿童de

@

测定结果合并,作为对照组求平均值。对实验组和对照组de平均值进行假设

检验,如果实验组de血红蛋白值高于对照组,且差异有统计学意义,可认为多糖铁复合物对血红蛋白有影响,对儿童轻度缺铁性贫血有治疗作用。

3.案例11-3 为评价某种国产抗菌新药de疗效,某医生抽取患有某种疾病且符合入选条件de60例患者,按入院后床位de单双号分为两组,每组30人。试验组服用该新药,对照组服用同类公认有效de进口药,临床观察结果见表11-9。经四格表卡方检验,得卡方=,P,,差异无统计学意义,故认为该国产抗菌新药与同类进口药de疗效基本相同。

组例数有效有效率(%) 分

30 21 国产抗菌新药

30 27 同类进口药

表11-1 两组患者用药后有效率比较

【问题11-3】

(1)该研究属何种类型,

(2)在设计de过程中是否遵循了实验设计de基本原则,

(3)该临床试验为何种对照,

(4)该医师de结论是否可靠,为什么,

【分析】(1) 该研究属临床试验设计。(2) 在设计与实施de过程中,该医生是按照床位号码将入选de60例患者随意分组,未能按照随机化de原则分组。(3) 该临床试验为标准对照。(4) 由于该医生未遵循随机化原则,样本de代表性差,两组患者de非处理因素不均衡,可比性差,因此其结论不可靠。

4.例11-4 某研究者欲评价佳加学生钙治疗儿童轻度缺钙de疗效,在实验幼儿园抽取80名确诊为轻度缺钙de儿童,服用佳加学生钙为试验组;在该地机关幼儿园抽取80名确诊为轻度缺钙de儿童,未服用佳加学生钙为对照组,观察指标是头发中钙de含量。结果试验组实验幼儿园de儿童发钙均值明显上升,机关幼儿园de观察对

象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。

佳加学生钙为试验组;在该地机关幼儿园抽取80名确诊为轻度缺钙de儿童,未服用佳加学生钙为对照组,观察指标是头发中钙de含量。结果试验组实验幼儿园de儿童发钙均值明显上升,机关幼儿园de观察对象发钙略有提高,但比试验组低,故认为佳加学生钙有补钙作用,能有效治疗儿童缺钙。

【问题11-4】

(1)该研究者遵循了均衡原则吗,为什么,

(2)该研究de混杂因素是什么,

(3)应该怎样正确设计,

【分析】

(1) 该实验设计de缺陷是违背了均衡原则,即不清楚两所幼儿园儿童de家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量de因素除药物外,也可能是儿童饮食习惯、营养条件是否相同或很相近,如果明显不同,则影响发钙含量de因素除药物外,也可能是儿童饮食营养条件,不能将发钙升高这一结果完全归之于佳加学生钙de疗效。因此认为这个没计是不均衡设计。

(2) 本研究de混杂因素是饮食习惯和营养条件等。这些混杂因素得不到控制,就不能得出上述结论。但要通过改变儿童饮食习惯和营养条件来控制这些混杂因素是比较困难de,可通过交叉均衡设计,以达到均衡目de。

(3) 正确设计:将实验幼儿园80名儿童随机分成两组,40名服用佳加学生钙,40名不服药;机关幼儿园80名儿童也随机分成两组,40名服药,40名不服药。观察一段时间后,对两个幼儿园分开比较试验组和对照组即服药与不服药de血清钙和

发钙有无差别,也可将测得实验幼儿园40名服药儿童和机关幼儿园40名服药儿童合并,作为实验组求平均值,再将两幼儿园各40名未服药儿童de 测定结果合并,作为对照组求平均值。对实验组和对照组de平均值进行假设检

验,如果实验组de血清钙和发钙值高于对照组,且差异有统计学意义,可认为

佳加学生钙对发钙有影响,对儿童轻度缺钙有治疗作用。

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

医学统计学分析计算题-答案

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

医学统计学论文

医学统计学论文 【摘要】大学生是当今社会中的新鲜血液,是新生代的力量。当代大学生的道德素质的层次会直接左右我们的身心健康水平,同时也影响到社会的前进发展。对于当代大学生道德现状的分析调查可以直接的反映出当今社会所存在的问题。大学生的道德取向则是一个社会道德的风向标。所以,提高当代大学生道德素质是当今社会刻不容缓的问题,同时对于社会主义现代化建设也有很重要的意义。本文基于调查问卷所得出的严谨数据,对学校内的大学生道德现状进行客观分析,并得出相应数据。 一、调查目的 1了解现在大学生的社会道德水平。 2关注大学生的发展,以总结现大学生存在的问题。 3分析原因,找到相关的原因。 二、调查设计 1调查对象:郑州大学继续教育学院 2调查时间:2016年9月—2016年10月 3调查方法:采用问卷调查(问卷共30题) 4问卷:发放出书面问卷200份,回收问卷179份 三、数据分析 数据经整理后,采用SPSS17.0统计软件包录入数据并运用独立样本t检验、方差分析和卡方检验进行数据分析。 四、影响因素的分析 为了能更好的来参照男女性别以及年级的不同,从而对调查问卷涉及的问题所给出的不同回答,我们做了诸多的关于性别差异,年纪差异的数据分析。其中也包括了T检验,交叉表等形式,当然,对于道德素质的选材,我们也没有一个硬性的指标来衡量乃至划分层次的高低。一方面,这给我们的调查统计造成了难以精准的障碍,另一方面,在我们的论文阐述中也不易找到相似的文献资料供以参考。尽管有这些不可避免的问题存在,我们小组还是尽量在数据统计分析出的结果中找到相关性。 1,年级差异对道德水平的影响 针对我们调查问卷主要涉及大学生群体的三个年级、大一、大二、大三,我们采用了不同的交叉表等形式来进行分析。

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

医学统计学分析计算题答案

第二单元计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。 女性红细胞数的变异系数 女性血红蛋白含量的变异系数 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。未知,但足够大,故总体均数的区间估计按()计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)/L。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较,用u检验。 1) 建立检验假设,确定检验水准 H0:,即该地健康成年男、女血红蛋白含量均数无差别 H1:,即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值,作出统计推断 查t界值表(ν=∞时)得P<0.001,按水准,拒绝H0,接受H1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设,确定检验水准 H0:,即该地男性红细胞数的均数等于标准值

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下: 表1 BCG治疗组生存情况 *死亡=1;删失=0

*死亡=1;删失=0 按上述二表将数据输入SPSS软件,其中数据编号为i,列(1)即时间为t,列(3)即生存结局为status,表1为group1,表2为group2。 选择Analyze中的Survival里的Kaplan-Meier分析,将Time,Status,Factor依次选定,option 和Compare Factor依次设定完成后,得到输出结果,结果分析如下: Survival Table中: 1为BCG治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。2为药物与BCG结合治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0:两种疗法患者生存率相同 H 1:两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验,得到上面Overall Comparisons 表,其中第一行为LogRank 检验结果。即X 2=0.057,P=0.811。按α=0.05水准,不拒绝H 0,还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。 生存曲线如上图所示,其中生存时间为横轴,生存率为纵轴。

医学统计学试题及答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学案例分析

医学统计学案例分析评述 医学期刊论着:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的 【统计方法】 (1)本论着未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选 用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。

(2)文献尽管在“统计学处理”中提及了“使用软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确采用了那种统计方法,即是卡方检验还是秩和检验等。 (3)在没有提及统计方法的前提下,全文也没有表示统计结果,即具体的计算值和相对应的P值,只有P<,表述不完整。 正确的统计分析方法、具体的统计量值和P值是最终准确推断结论的重要依据,三者缺一不可。所以,具体的P值和统计量应在论文表格或文字描述中说明。 (4)统计符号书写不规范: 检验水准表述有误,原文“检验水平取P=”,应改为“检验水准ɑ=”。 【结果表达】 (1)在“不同时间段接种人数比较”中: ①原文:研究将研究对象按照2010 年1 月-2011 年4 月,2011 年5月-2012 年 5 月分为两个时间段进行研究,第一个时间段接种人数为460 6 人,第 二时间段接种人数为2264 人。第二时间段较第一时间段接种人数明显 减少,且具有显着差异性(P<)。 ②错误:结果表述有误:“第二时间段较第一时间段接种人数明显减少,且具有 显着差异性”。2个时间段研究对象数量不同,通过统计分析不能得出 “人数明显较少”的结论,应表述为:按ɑ=水准,差别有统计学意 义,可以认为2个时间段接种人数不同。 (2)在“结果和”的结论中: ①错误:均未明确具体的统计值及相对应的P值,“具有显着性差异”应改为“差 别有统计学意义”。 (3)统计表表示不正确: ①统计表为三线表,在有“合计”一项时,应加一条分隔线。

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学分析计算题-答案 (1)要点

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?= ?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

相关主题