搜档网
当前位置:搜档网 › 颜虹医学统计学分析案例选

颜虹医学统计学分析案例选

颜虹医学统计学分析案例选
颜虹医学统计学分析案例选

医学统计学案例选

第一章绪论部分

案例1-1着手撰写一份研究计划书,你所选的研究课题应该关系到人类健康。简单叙述立题依据、研究背景、研究目的、研究容、研究方法和需要什么样的资料,如何获得和分析资料,用什么方法表达与展示结果等,请保留你的这份作业,并在学习完本书后再重新翻阅。你发现了什么问题,应如何修改?你的收获是什么?

第二章实验设计部分

案例2-1《丹栀逍遥散治疗混合性焦虑抑郁障碍的临床研究》(中医2004年第24卷第8期第62页)欲观察丹栀逍遥散治疗混合性焦虑抑郁障碍的临床疗效,以某西药作为对照组。将64例符合纳入标准的病例按诊疗次序交替分组,即单号为中药组,双号为西药组。请讨论该分组方法是否随机?

案例2-2《单宫颈双子宫畸形28例人工流产分析》(中国实用妇科与产科杂志1999年3月第15卷第3期172页)通过回顾分析某医院1990年1月至1998年3月期间28例单宫颈双子宫畸形早孕流产的结果,发现人流术前先给予米索前列醇素制剂可使得流产更容易、安全,减少病人痛苦并且可避免并发症的发生。而文中两组的分组方法为:所有病例按就诊先后顺序分组,1995年10月以后的为A组,1995年10月以前的为B组。A组(米索组)于手术前3小时服米索600μg或手术前1小时后穹隆放置米索200μg,然后进行人工流产吸宫术,共14例;B组(对照字)单纯采用常规流产术机械扩宫颈后吸宫。作者认为该法“符合随机分配法则”。请讨论对照组的设置是否合适?

案例2-3《用24小时食管pH监测法诊断食管原性胸痛》(中华外科杂志1995年33卷第2期第69页)一文中,作者对30例疑为食管原性胸痛患者的24小时食管pH监测,其中16例昼夜均异常,8例白天异常,2例夜里异常,18例胸痛与酸暴露有关。得出食管pH 监测是诊断胃食管反流所致的食管原发性胸痛的有效方法的结论,请讨论该文结果是否成立?

案例2-4《强骨胶囊治疗原发性骨质疏松症的临床试验》(中药新药与临床药理,2004年15卷第4期284页)目的是观察强骨胶囊与骨松宝颗粒对骨质疏松症患者的疗效与安全性。原文共收集骨质疏松症患者307例,其中试验组612例使用强骨胶囊,对照组93例使用骨松宝颗粒,其余开放组52例。但对开放组患者的特征、所用药物、用药方法、观察方法、是否设盲等没有交代。请讨论3组之间有无可比性?

小结

1、一项研究设计的容包括:提出假说,确定研究类型,确定研究对象的围和数量,计划的

实施与质量控制,数据管理,统计分析,结果与讨论。

2、实验设计包括3个基本要素:处理因素、实验对象和实验效应。

3、实验设计必须遵循:对照、随机、重复的基本原则。研究中所设立的对照组应尽可能达

到对等、同步、专设的条件;随机包括3方面的容,及随机抽样、随机分组和随机实验顺序;重复是指研究结果的重复、观察对象的重复和观察指标的重复。

思考与练习

简答题

1、研究设计的作用是什么?

2、研究设计的基本容是什么?

3、实验设计应该遵循的基本原则是什么?

4、实验设计为什么要设立对照?设立对照要注意些什么?

5、随机化的含义是什么?目的是什么?

6、区组化的目的是什么?

第三章观察性研究设计概述

案例3-1某地(100万人口)拟开展当地中老年人非胰岛素依赖型糖尿病的现况调查,目的是了解当地糖尿病的流行状况,以及与糖尿病患病相关的危险因素。调查对象是当地居住超过5年、40岁以上的常住居民。该研究采取分层、整群随机的抽样方法,将该地区15个镇按城镇或乡村,经济发展水平分成3个层,每层随机抽取2个镇或街道,再从被抽中的镇或街道中随机抽取两个村或居委。被抽中村或居委的全部40岁以上居民包括原糖尿病患者均参加调查。调查结果男女两性比例为0.94:1,并划分为5个年龄组,性别和各年龄组构成比与当地人口性别和年龄的分布情况相符。

调查容包括:①问卷调查:被调查者的一般情况、糖尿病及其他病史、家族史、糖尿病临床表现、饮食调查、吸烟、饮酒情况及体力活动等;②体格检查:包括身高、体重、腰围、臀围及血压等;③血糖测定。

⑴该研究采用的是全面调查还是抽样调查?各有何优缺点?

⑵该研究采用的抽样方法有何优点?是否有更好的抽样方法?

⑶该研究的设计方案是否合理?请你设计一个研究的方案。

⑷该研究采用的调查表应该包括哪些项目?请你设计该调查表。

小结

1、观察性研究是有目的地观察或测量自然接触不同因素人群的结果事件发生状况,通过对

比分析发现事件的分布特点与差异,从而获得有关因果假设的启示,为进一步研究提供线索。

2、观察性研究包括描述性研究和分析性研究两大类。

3、横断面研究是按照事先制定的计划,调查特定人群特定时点某种疾病的患病情况,以及与患病有关的因素。横断面研究的设计要考虑研究目的、对象、调查方法、调查表设计、样本量、组织计划、质量控制和分析计划等。

4、问卷是调查研究中用来收集资料的一种工具,它的形式是一份精心设计好的问题表格,它的用途在于测量人们的行为、态度和特征。问卷设计的好坏是保证调查质量的关键,本章介绍问卷设计的基本原则和步骤。

5、随机抽样是抽样调查中样本具有代表性和能进行总体参数估计的保证,常用的抽样方法有单纯随机抽样、系统抽样、分层抽样和整群抽样。

简答题

1、观察性研究与实验性研究有何异同?二者能否同时使用或结合使用?

2、观察性研究主要有哪些方法?各有何优缺点?

3、为什么大多数的观察性研究是抽样调查研究?

4、根据对全国出生缺陷监测资料的统计分析,发现神经管缺陷的发生具有明显的季节性,表现为1~3月份出生的孩子的发生率比较高。今欲调查其原因,应采取什么调查方法?请做出完整的调查设计并制定出调查表。

5、欲了解某市乙型病毒性肝炎患病情况及其影响因素,请做一个调查设计。

6、现拟在大学生中进行一项吸烟习惯调查,请你考虑调查问卷应包括哪些项目,并设计出调查问卷。

第四章统计描述

案例4-1表4-24是某研究者在一项回顾性调查中收集的部分资料,其目的是研究抗生素的使用效果。

表4-24 某医院、外科25例住院病人使用抗生素的情况

2 2 7

3 36.7 5 2 1 1 10

3 2 40 37.2 12 2 2 2 6

4 2 47 36.8 4 2 2 2 11

5 2 25 36.9 11 2 2 2 5

6 1 82 36.0 6 1 2 2 14

7 1 60 37.5 8 1 1 1 30

8 2 56 37.0 7 2 2 1 11

9 2 43 36.7 7 2 2 1 17

10 1 50 36.7 12 2 1 2 3

11 2 59 36.4 7 2 1 1 9

12 1 4 36.6 3 2 2 2 3

13 2 22 37.5 11 1 2 2 8

14 2 33 36.9 14 1 1 2 8

15 2 20 36.9 11 2 1 2 5

16 1 32 37.2 9 2 2 2 5

17 1 36 37.3 6 1 2 2 7

18 1 69 36.7 6 2 2 2 4

19 1 47 36.1 5 1 2 1 3

20 1 22 36.8 6 2 2 2 7

21 1 11 36.8 10 2 2 2 9

22 2 19 37.0 14 1 2 2 11

23 2 67 36.4 4 2 2 1 11

24 2 43 37.0 5 2 2 2 9

25 2 41 36.7 5 2 2 1 4

注:性别:1=男,2=女;抗生素使用:1=是,2=否;细菌培养:1=是,2=否;

所在科室:1=科,2=外科。

试分析:

⑴构造性别的频数分布表,并绘制性别的频数分布条图;

⑵以20岁为组距,构造年龄的频数分布表,并绘制年龄的频数分布直方图;

⑶以5天为组距,构造住院时间的频数分布表,并绘制住院时间的频数分布直方图,观察其分布特征;

⑷计算住院时间的算术均数、几何均数、中位数;

⑸计算住院时间的最大值、最小值、四分位数与四分位数间距;

⑹计算住院时间的全距、方差、标准差和变异系数;

⑺构造、外科使用抗生素情况的统计表、条图和圆图;

⑻构造、外科采用细菌培养情况的统计表、条图和圆图;

⑼构造、外科使用抗生素和采用细菌培养情况的统计表、条图和圆图;

⑽绘制箱图,比较用与不用抗生素的住院患者住院天数的差异;

⑾以住院天数为纵坐标,以年龄为横坐标,绘制散点图;

小结

1、计量资料的统计描述,主要了解数据的分布围、集中位置以及分布形态等特征。大样本数据,需要编制频数分布表,通过频数分布表观察数据的分布特征。

2、频数分布表的主要作用是揭示资料的分布特征;描述其集中趋势和离散趋势,有助于发现数据中远离数据群体的离群值。

3、数据的分布形状分为对称分布与偏态分布。偏态又分为右偏态和左偏态。

4、描述计量资料集中趋势的平均指标有:算术均数、几何均数、中位数等。算术均数适合于对称分布资料,几何均数、中位数等。算术均数适合于对称分布资料,几何均数适用于2右偏态和呈现比例递增的资料,中位数适合于任意分布的资料。

5、描述计量资料离散趋势的变异指标有:全距、方差、标准差和变异系数、四分位数间距等。其中标准差是最常用的变异指标,适合于对称资料特别是正态分布资料;四分位数间距适合任意分布资料,尤其适合于大样本偏态分布资料。变异系数主要用于比较几个量纲不同的变量之间的离散程度的差异,也可以用来比较量纲相同但均数相差悬殊的几个变量之间离散程度的差异。

6、描述计数资料基本特征的指标有:比、比例和率。比可以是任意两个数值之比,包括比和比率。当分子是分母的一部分时,称为比例;当比例与观察时限有关时,称为率。比例又分为构成比和频率。而率与时间单位有关,即率有速率和强度的含义,它表示单位时间某事件发生的可能性大小。流行病学研究中常用的两个比是相对危险度和优势比(比数比)。

7、部构成不同的两个率比较时,应计算标准化率。

8、动态数列用来描述一组按照时间顺序排列起来的统计指标,如绝对数、相对数、平均数等,在时间的变化和发展趋势。

9、医学常用统计指标有:人口统计指标、出生与死亡统计指标、生育统计指标、疾病统计指标、期望寿命等。

10、表达统计结果的数表称为统计表。统计表由标题、标目、线条、数字4部分组成,必要时增加注释。

11、常用统计图有:条图、百分条图、园图、线图、半对数线图、箱图、散点图等,这些统计图所适用的数据类型,绘图目的和有关说明列在表4-25中。

第五章概率分布

案例5-1一般人群先天性心脏病的发病率为8‰,某研究者为探讨母亲吸烟是否会增大其子女的先天性心脏病发病的危险,对一群20~35岁有吸烟嗜好的孕妇进行了生育考察,在他们生育的320名子女中,经筛查有4人患先天性心脏病。

试讨论:

⑴若以X表示观察中患先天性心脏病的小孩数,X的分布是什么分布?

⑵若按人群先天性心脏病的发病率为8‰,计算320名子女中,至少有4名小孩患先天性心脏病的概率。

⑶这一研究过程是否有可改进的地方?

案例5-2 根据对青少年生长发育大样本的调查资料,计算得7岁男童的身高均数

X =119.95cm ,标准差=4.72,按身高围统计结果见表5-4.

表5-4 青少年生长发育调查资料统计结果

(1)试计算所给身高围的理论人数和百分比。

(2)实际人数和理论人数(百分数)有何不同与联系。

小结

1、随机事件、概率与随机变量是研究随机现象的基本概念。通过随机变量可用 数学手段对随机现象进行更深入的研究,随机变量分为两类,一类是连续型随机变量,另一类是离散型随机变量。

2、二项分布和Poisson 分布是离散型随机变量最为常见的分布类型。在医疗卫生领域,若研究结果只可能是两个对立结果中的一个,例如阳性、阴性,这样的观察独立、重复n 次出现阳性的次数X 服从二项分布。X 取值为0,1,2,…,n ,X=k 的概率按下式计算:

k k k n k n k X P )1()!

(!!

)(π-π-=

=

其中π为每次试验出现阳性的概率,且

∑===n

k k X P 0

1)(。

Poisson 分布主要用于描述在单位时间、面积、空间上某事件的发生数。医学和卫生领域中有些指标例如:单位时间接收到放射性物质的放射线数、某单位容积中的细菌数、野外单位空间的某种昆虫数等。服从Poisson 分布随机变量X 取值为非负整数0,1,…,其相应概率为

λ

-λ==e k k X P k !

)( 当n 大,π小时,二项分布近似Poisson 分布。此时计算而项分布概率的工作量很大,可用Poisson 分布公式作近似计算。

3、 正态分布是连续随机变量最重要的而基本的分布。其重要性体现在: (1)正态分布具有优良的性质和规律。

(2)在解决实际问题时,许多研究指标服从(或近似服从)正态分布。

(3)理论上,正态分布是许多统计方法的理论基础,一方面许多统计方法是在正态分布的基础上建立起来的;另一方面许多统计方法在一定条件下,有正态近似的方法。

4、 随机现象的规律只有在 大量重复观察的 情况下才能够出现,对随机现象的研究答多是

采用抽样研究的方法。3个基于正态分布的抽样分布入2

χ分布、t 分布、F 分布是统计推断的基础,具有重要的理论价值。

第六章 参数估计

案例6-1 某地随机抽样调查了部分健康成人的血红蛋白含量(g/L ),结果见表6-16.

性别 例数 均数 标准差 标准值 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7

*《实用科学》(1976年)所载均数(转为法定单位)

(1)有人认为该地男女性血红蛋白含量均低于上表的标准值(若测定方法相同)且男性血红蛋白含量低于女性,你是否同意该结论?

(2)如何估计男女性血红蛋白含量的总体均数和参考值围,两者有何区别?

小结

1、抽样分布是通过大量重复抽样和计算各样本统计量并作样本统计量的频数分布图来揭示样本统计量的分布规律。从同一总体反复抽取若干样本,各样本统计量之间及与总体参数之间存在差异,此差异称为抽样误差。由于总体中个体变异的客观存在,抽样误差不可避免。

2、标准误是反映抽样误差大小的指标。均数标准误的理论值是n X /σ=σ,样本估计值为

n S S X /=;率的标准误理论值为n p /)1(π-π=σ,样本估计值为n p p S p /)1(-=

。注意均数标准误与原变量的标准差之间的区别,不能混淆其含义。

3、参数估计是指用样本统计量推断总体参数。有点估计和区间估计两种方法。

第七章 假设检验

案例7-1 某医院检验科测定了30-40岁不同职业、不同性别人群的血清甘油三脂含量(见表7-2)。试分析比较工人和干部,男女的该项血脂水平有无差异? 表7-2 正常成人按不同职业、性别分类的血清甘油三脂含量

人数 均数 标准差 工人 112 1.20 0.33 干部 106 1.08 0.30 男 116 1.17 0.32 女 102 1.11 0.32

试分析:

1、 用什么方法比较工人和干部、男和女血清甘油三脂含量的差异?

2、 血清甘油三脂含量是常用的高血脂症筛查指标,血清甘油三脂含量升高常见于动脉粥样

硬化、糖尿病、脂肪肝等的病人,男略高于女,参考值围分别是男:0.45-1.81mmol/L 、女:0.40-1.53 mmol/L 。如何解释男女血清甘油三脂的差异?

3、如果工人组血清甘油三脂高于干部组,并且有统计学差异,能否说工人职业导致该人群

血清甘油三脂的升高?推论因果关联?

4、本研究工人组的血清甘油三脂平均高于干部组0.12mmol/L,是否有实际意义?

5、本研究工人组的血清甘油三脂高于干部组,男女血清甘油三脂未见有统计学差异,是否

是混杂因素影响?在比较均数之间差别时,如何根据现有资料分组计算均数,最大限度地减少性别对工人组和干部组血清甘油三脂的影响?

小结

1、假设检验采用的是反证法思想,根据“小概率事件在一次试验中不可能发生”原理,用一次试验(观察)结果发生的概率决定是否拒绝原假设。假设检验的常用方法有u、t、F、χ2检验与秩和检验。

2、假设检验的三个步骤:①建立检验假设:H0、H1,确定检验水准α。②计算检验统计量;

③确定P值并作出推断结论。

3、已知总体方差2

σ并且样本量比较大时,推断样本所代表的未知总体均数μ与已知总体均0

数μ0是否有差别,可采用Z检验。已知总体方差2

σ并且两组的样本量n1和n2比较大时,

X-推断两总体均数之差是否为零,可采用两均数比较的Z检验。

用2

1X

4、大样本率的Z检验,要求n比较大,对统计量要求可简单概括为:①如果样本率p介于0.1-0.9之间,每组例数大于60例;②如果样本率p介于0.1-0.9之外,np或n(1-p)的最小值大于5。

5、假设检验的两类错误:当H0为真时,由于抽样的偶然性而得到P≤α的检验结果,假设检验结论拒绝H0,接受了H1,称为第一类错误或Ⅰ类错误,犯一类错误的概率记为α。当真实情况不成立而H1成立时,得到P>α的检验结果,拒绝H1,接受了H0。这类错误称为第二类错误或Ⅱ类错误,其概率大小用β表示。

6、单侧检验与双侧检验:单侧检验不仅关心差别,同时关心差别的方向,备择假设为H1:μ1<μ2或H1:μ1>μ2。双侧检验只关心差别,不关心差别的方向,备择假设为H1:μ1≠μ2。两个均数或两个率的比较一般用双侧检验。采用单侧检验应该在研究设计阶段作出规定,不应当在计算出统计量后再主观决定。

7、假设检验在拒绝H0的时候可以下“有差别”的结论,在不拒绝H0的时候不能下“无差别”的结论。假设检验的的P值大小只能够说明统计学意义的“显著”,不一定有实际意义。对假设检验结果的实际意义或临床意义的判定,一定要结合专业知识。

8、检验效能1-β表示H1为真,假设检验结果拒绝H0,接受H1的概率。检验效能越高,通过样本发现总体差别的把握越大。影响检验效能的4个因素分别是总体参数的差异|δ|、个体差异的总体标准差σ,样本量n和检验水准α。

9、在同一个研究中多次重复检验,即使总体参数没有差别,重复检验100次,平均有5次是假阳性错误,或重复检验20次,平均有一次是假阳性错误。因此,在试验设计时就应该确定主要分析指标,不能事后通过大量重复检验寻找阳性指标。

10、要使假设检验的P值成为因果联系的证据,前提是要求研究设计符合“重复、对照、随机化”的3个实验设计基本原则,并且是前瞻性的研究,即试验对象随机分组后再施加干预。

第九章多个样本均数比较的方差分析

案例9-1某篇论文,研究4组病人某基因表达率的差异,结果见表9-16。

表9-16 4组病人某基因的表达率比较

X t P

组别n S

喉癌19 23.0±8.7 5.38 <

0.01

喉息肉18 16.0±10.2 6.24 <

0.01

转移癌15 9.0±4.7 2.20 >0.05

对照组22 7.0±5.0

问:(1)该资料分析是否恰当?理由是哪几方面?

(2)若该资料交给你统计分析,你的分析计划怎样?

案例9-2某医生A,B,C3种营养素喂养小白鼠,用6窝小白鼠,每窝3只,随机安排喂养这3种营养素中的一种;6周后观察小白鼠增加体重情况(g),得表9-17的资料:

表9-17 3种营养素喂养小白鼠所增加体重

窝别A B C均数

1 50 57 69 58.7

2 48 59 66 57.5

3 55 61 67 61.0

4 66 54 76 65.2

5 7

6 81 83 80.1

6 3

7 46 6

8 50.2

7 63 50 54 55.7

8 45 43 48 45.3

均数55.1 56.2 66.4 59.2

经过随机区组设计的方差分析得3种营养素间的F=6.319,P=0.011;窝别的F=6.670,P=0.001。认为营养素及窝别间两个因素均可影响增加体重,但营养素的作用不如窝别因素大。窝别常反映遗传因素,证明遗传因素对增加体重影响明显。

问:(1)所用统计方法是否正确,为什么?

(2)作者结论是否正确,表现在什么方面?

小结

1、方差分析常用于3个或3个以上均数的比较,当用于两个均数的比较时,同一资料所得

结果与t检验等价,即有如下关系:t2=F。

2、方差分析的基础是分解变异,统计量是两个均方之比。完全随机设计方差分析的基本

思想是:在多个总体均数相等的假设条件下,样本总变异及自由度可分解为处理和组两部分,由此估计出处理均方和组均方,前者反映处理作用及随机误差,后者仅为随机误差;进一步将处理均方与组均方之比值构成F统计量,查F检验界值表便可确定界值,

医学统计学 第一课绪论及基本概念(已整理完毕)

《医学统计学》颜虹主编 Fundamentals of Biostatistics(Bernasrd Rosner)孙尚拱译(2004第五版) SPSS统计分析张文彬主编 一、绪论 【统计学】应用数学的原理和方法,研究数据的搜集、整理与分析的科学,对不确定性数据做出科学的推断。 产生过程:随机现象→随机事件→样本空间→随机变量 现象:确定现象 随机现象:与确定现象相对的不确定现象,在一定的条件下,其有多种可能的结果,而究竟出现哪一种结果事先不可预言的现象。≥2种结果。 特征:随机性、规律性 两种阶段认识随机现象:1.通过观察或实验取得观测资料; 2.通过分析所得资料来认识现象。 注:无论数据分析多么先进,都要以能够代表真实情况的数据为基础。 在偶然的背后发现必然 【随机事件】随机现象的一个结果叫随机事件。 【样本空间】为了便于研究随机试验,我们将随机试验E的所有基本事件所组成的集合叫做样本空间,记为Ω。每一个基本事件为样本点,基本事件也就是集合Ω的元素。 可以把样本空间中的基本事件映射成某个变量的取值,这样就引进了随机变量的概念。 【随机变量】在样本空间中,对不同事件指定有相应概率的数值函数,此函数成为一个随机变量。P (X=x k)=p k,X泛指随机变量 如抛掷硬币: 正反 10→随机事件的选项 X k P 0.50.5→对应概率,所有加起来=1 k 特征:与普通函数相比有两点不同: 1.随机变量随着实验结果不同取不同的值,因此在实验之前只能知道取值的范围,而不能预先知 道取什么值。由于随机试验的各个结果出现有一定的概率,所以随机变量的出现也有一定的概率。 2.普通函数定义在实数轴上,而随机变量是定义在样本空间上,样本空间的元素不一定是实数 二、统计学中的基本概念 1.总体(Population)、样本(Sample) 【总体】根据研究目的确定的、全体同质个体的某个(或某些)变量值。比如:糖尿病的血红蛋白水平、高血压患者的血压 分类:无限总体→新生儿体重 有限总体→一所学校今年新生的身高 【样本】:总体中的一部分,为了保证样本的代表性,在取样时我们要求X1、X2……Xn互相独立,并且与总体X有相同的概率分布。(同分布)如总体为正态分布,则样本应该也几近于正态分布。为母体分布的缩影。 为了保证样本的可靠性与代表性,需要采用随机的方法抽取样本(在总体中每个个体具有非0的

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

《医学统计学》考试试题及答案(三)

《医学统计学》考试试题及答案 (一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数

医学统计学分析计算题-答案

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

2016年北京协和医学院流行病与卫生统计学考研复试参考书

2016年北京协和医学院流行病与卫生统计学考研复试参考书 北京协和医学院流行病与卫生统计学专业2014年考研招生简章招生目录 招生年份:2014本院系招生人数:33流行病与卫生统计学专业招生人数:3专业代码:100401 研究方向考试科目复试科目、复试参考书参考书目、参考教材 01流行病与卫生统计学(学术型)只招收推免生,不接受统考生报名 北京协和医学院流行病与卫生统计学专业2013年考研招生简章招生目录 招生年份:2013本院系招生人数:未公布流行病与卫生统计学专业招生人数:6专业代码:100401 研究方向考试科目复试科目、复试参考书参考书目、参考教材 01流行病与卫生统计学①101政治 ②201英语 ③353卫生综合 ④--无 注: 《卫生综合》:含卫生统计学、流行病学、卫生事业管理学;任选两门。复试为笔试和面试相结合,面试含外语听说能力测试 备注:推免生为2353卫生综合 一.卫生综合(卫生统计学) 1.《卫生统计学》刘桂芬协和医大出版社 2.《医学统计学》颜虹人民卫生出版社第2版 二.卫生综合(流行病学) 《流行病学》(供预防医学类专业用)李立明人民卫生出版社2007年第6版 三.卫生综合(卫生事业管理学)

《卫生事业管理学》梁万年人民卫生出版社2003.7第1版 北京协和医学院流行病与卫生统计学专业2012年考研招生简章招生目录 招生年份:2012本院系招生人数:未公布流行病与卫生统计学专业招生人数:3专业代码:100401 研究方向考试科目复试科目、复试参考书参考书目、参考教材 一、流行病与卫生统计学 01心血管病流行病学研究方法 01高血压流行病学和防治研究 01心血管流行病学和血压监测研究 ①101政治 ②201英语 ③353卫生综合 ④--无复试为笔试和面试相结合,面试含外语听说能力测试 备注:推免生为2. 353卫生综合: 1.卫生统计学: 《卫生统计学》,刘桂芬主编,协和医大出版社 《医学统计学》,颜虹主编,人民卫生出版社 2.流行病学: 《流行病学》,第六版(供预防医学类专业用),李立明主编,人民卫生出版社,2007 3.卫生事业管理:

医学统计学分析计算题答案

第二单元计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。 女性红细胞数的变异系数 女性血红蛋白含量的变异系数 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。未知,但足够大,故总体均数的区间估计按()计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)/L。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较,用u检验。 1) 建立检验假设,确定检验水准 H0:,即该地健康成年男、女血红蛋白含量均数无差别 H1:,即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值,作出统计推断 查t界值表(ν=∞时)得P<0.001,按水准,拒绝H0,接受H1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设,确定检验水准 H0:,即该地男性红细胞数的均数等于标准值

医学研究关于某样本例数选择

医学研究的样本例数 读者须知 在医学研究中样本例数的确定是一个难点,医学统计学家认为样本含量的确定有两种方法:公式法和查表法,公式法和查表法本质一样,查表法是统计学家由公式做出的,而公式法需要研究者自己做,因为医学研究中尚有不少问题还搜索不到相应的计算公式来确定样本例数,本书搜集到的公式也十分有限,那么通过搜索文献来估计样本例数也是读者需要学习的一种方法。 须知,不存在无限定条件的样本例数。现行统计教材中的样本例数没有特别强调这一点,以导致使用时,常提出如下问题:“了解吸烟是否是肺癌的危险因素,需要调查多少人?”,类似这样的问题是没人能回答出的。 医学研究中样本例数都是建立在一组限定条件之下的样本例数,若这一组限定条件改变,那么样本例数的值随之改变。简言之,样本例数是这一组限定条件的函数。这种函数关系具体由计算样本例数的公式表述。那么,确定公式等号右端的各参数就变成了计算样本例数的前提。根据此思路我们设计了一个确定样本例数的流程图(见下页),同时,这个流程图也是我们撰写本书具体内容和阅读本书的思路。这个小册子中的例题均来自各种卫生统

计学的教材和相关著作,其本质没有变化,但读起来却更加符合人们的认知习惯,你会感觉到更容易读懂了。 本书由一附院医学统计咨询室集体讨论,具体由孙奇执笔撰写和排版,几经修订,历时超过百天。尽管如此,鉴于我们知识的局限性,也只能做到抛砖引玉,而且书中错误肯定难免。欢迎读者不吝指正,我们将深表谢意!

样本例数估计流程图

目录 1.两样本率比较的样本例数 (4) 2.多个样本率比较的样本例数 (6) 3.两样本均数比较的样本例数 (8) 4.多个样本均数比较的样本例数 (10) 5.诊断试验的样本例数 (12) 6.现况研究的样本例数 (13) 7.病例对照研究的样本例数 (15) 8.队列研究的样本例数 (17) 9.多元统计的样本例数 (19) 20 10. 他····················································· 21 11. 表···························································

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

流行病学英文总结

流行病学英文版总结(精华版) 乌衣月Email:Frnbdx@https://www.sodocs.net/doc/8811564236.html, 1、Epidemiology Epidemiology is the study that is based on distribution and factors of diseases and health-related states in populations,and then makes politicies and takes measures to control heslth problems. 2、Exposure Exposure is a very common used term in epidemiology,it refers to the causal factors that may be associated with the disease,for example,contact with a harmful materials,or some characteristics ,such as the age which may put an individual at increased risk. 3、Outcome Outcome is the disease or other changes in health status.It is the possible result that may be associated with the causes,risk factors or preventive measures. 4、Descriptive epidemiology Descriptive epidemiology is concerned with the variations of morbidity and mortality in a community.It concentrates on the description of distribution of morbidity or mortality by person,place and time,and then we can pose the hyposthesis,such as case report,ecological study and cross-sectional study. 5、Ecological study Ecological study is a type of descriptive study.It is the study of the relationship between some factors and diseases in the group level, the unit of observation and analysis is group.We describe the exposure status of disease factors and the frequency of diseases in different populations and then analyse the relationship between exposure and disease,for example, ecological comparison study and ecological trend study. 6、Experimental epidemiology Experimental epidemiology is to identify a group of subjects with the same conditions,and randomizes the subjects into intervention and control groups,follows them up for a period of time,compares the outcome between the groups,so as to evaluate the efficacy of the intervention.It is also called the interventional study,includes clinical trial,field trial and community trial. 7、Observational study Observational study is a kind of epidemiology.We observe and measure the occurrence of the disease or other health-related status in different groups with various characteristics and attempt to identy the causal association between the exposure and outcome,but we do not intervene in any way,so it is called the observational study,such as cross-sectional study,cohort study and so on. 8、Three levels of prevention Primary prevention concentrates on the cause prevention or reduction of risk factors,so as to prevent the development of disease. Secondary prevention is to diagnose and treat diseases in their early stages so as to restore or improve health,such as the screening program. Tertiary prevention is to reduce complications of disease,improve the outcome,so as to improve the quality of life of the patients. 9、PYLL PYLL is measure of the socio-economic impact of the premature death of an individual.It is

医学统计学第3版,02计量资料的统计描述试题

第二章 计量资料的统计描述 一、教学大纲要求 (一)掌握内容 1. 频数分布表与频数分布图 (1)频数表的编制。 (2)频数分布的类型。 (3)频数分布表的用途。 2. 描述数据分布集中趋势的指标 掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标 掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。 (二)熟悉内容 连续型变量的频数分布图:等距分组、不等距分组。 二、 教学内容精要 计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。 (一)频数分布表的编制 频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。制作连续型数据频数表一般步骤如下: 1.求数据的极差(range )。 min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。 确定组段和组距。每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

大家评价的统计书

请写出对您有影响的统计书和统计前辈 [恳求参加讨论] 胡良平的书大家都已经说过了!! 人卫统计第四版 张文彤SPSS11统计分析教程 医学统计之星网站很不错,很大功劳属于他,而且很无私。我的很多统计软件知识来源于此。> 孙尚拱译的《生物统计学基础》,科学出版社,原英文版是《fundamentals of biostatistics》5th edtion bernard rosner,这本书不错. 其一是研究生统计教材。 徐勇勇《医学统计学》和方积乾《医学统计学与电脑实验》两位老师所编的书各有所长,因此两本书都非常好,其实勤快的话,都看看,相互弥补促进,我个人的经验很好! 其二是郭祖超主编《医用数理统计方法(第三版)》,作为国内统计专业的前辈,我认为郭老的书不是我所可以评价的。 其三是陈平雁老师编的《SPSS10.0统计分析教程》,通俗易懂,是初学者的好教材,如果想要更进一步学习,就可能要再用其他书了,目前,我还是初学者,因此还是推荐这本书。外文书Armitage,P&Berry,G.Statistical Methods in medical rearsch.3rd edition.blackwell Science,1994也不错。 刘润幸的SPSS书也很不错,很实用,我看的是SPSS 8.0统计软件使用指南, 现在有第二版,是spss10的,分上下两册。 孙振球主编,《医学统计学》第一版,人民卫生出版社,2002 徐勇勇《医学统计学》和方积乾《医学统计学与电脑实验》两位老师所编的书各有所长,因此两本书如果有能力的话都可以一学。 另外关于SPSS我认为马斌荣的教材比较浅显易懂值得大家一看,他的SPSS分为上下两部分适合各个层次的要求。 人卫第四版卫生统计学是中国卫生统计史上的一场笑话! 书名:实用统计分析方法[专著] (美)蒋庆琅原著; 方积乾等译. 北京: 北京医科大学中国协和医科大学联合出版社, 1998.12

相关主题