搜档网
当前位置:搜档网 › 住院医师培训课程-常用医学科研中的统计学方法1

住院医师培训课程-常用医学科研中的统计学方法1

住院医师培训课程-常用医学科研中的统计学方法1
住院医师培训课程-常用医学科研中的统计学方法1

1、两组数据中的每个变量值减去同一常数后做两个样本均数差异的t检验() *c

? A.t值变小

? B.t值变大

? C.t值不变

? D.t值变小或变大

2、作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是() *c

? A.A.统计量t越大,说明两总体均数差别越大

? B.B.统计量t越大,说明两总体均数差别越小

? C.C.统计量t越大,越有理由认为两总体均数不相等

? D.D.P值就是αa

3、随机区组设计的方差分析用于() *

? A.多个样本均数间的两两比较

? B.比较各个区组间的样本均数有无差别

? C.比较各个区组间的总体均数有无差别

? D.比较各个处理组间的样本均数有无差别

4、各组数据方差不齐时,可以做() *D

? A.近似检验

? B.秩和检验

? C.数据转换

? D.ABC均可

5、第I类错误的概念是() *D

? A.H0是不对的,统计检验结果未拒绝H0

? B.H0是对的,统计检验的结果未拒绝H0

? C.H0是不对的,统计检验结果拒绝H0

?

6、下列哪种说法是错误的() *B

? A.计算相对数尤其是率时应有足够数量的观察单位数或观察次数

? B.分析大样本数据时可以构成代替率

? C.应分别将分子和分母合计求合计率或平均率

? D.相对数的比较应注意其可比性

7、配对计量资料进行假设检验时() *Dd

? A.仅能用配对t检验

? B.仅能用成组t检验

? C.仅能用随机区组设计的方差分析

? D.用配比t检验和随机区组设计的方差分析均可

8、方差分析的前提条件是() *A

? A.计量资料非参数统计的

? B.正态性

? C.随机性

? D.方差齐性

9、设配对设计资料的变量为X1与X2,则配对设计的符号的秩检验() *B

? A.把X1与X2的差数军队之从小到大编秩,排好后秩次保持原差数的正负号

? B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号

? C.把X1与X2综合按绝对值从小到大编秩

? D.把X1与X2的差数从小到大编秩

10、对于配对t检验和成组t检验,下列哪一种说法是错误的() *B

? A.对于配对设计资料应作配对t检验,如果作成组t检验,不但不合理,而且平均起来统计效率降低

? B.成组设计的资料用配对t检验,不但合理,而且平均起来可以提高统计效率

? C.成组设计的资料,无法用配对t配对t检验

?

11、已知某地正常人某定量指标的总体均值u0=5,今随机测得该地特殊人群中的30人该指标的数值。若用t检验推

断该人群该指标的总体均值u与u0之间是否有差别,则自由度为() *C

? A.5

? B.28

? C.29

? D.4

12、在进行成组设计资料的t检验之前,要注意两个前提条件。一要考查各样本是否来自正态总体,二要() *B

? A.核对数据

? B.做方差齐性检验

? C.求均数,标准差,标准误

? D.做变量代换

13、反应疾病发生频度的指标是() *A

? A.患病率和发病率

? B.患病率和感染率

? C.发病率和病死率

? D.病死率和感染率

14、调查1000名女性乳腺癌患者,发现50名为孕妇,据此可推断() *C

? A.孕妇易患乳腺癌

? B.孕妇不易患乳腺癌

? C.该组乳腺癌患者中5.0%是孕妇

? D.妊娠可诱发乳腺癌

15、如果t≥t0.05/2,v可以认为再检验水准a=0.05处() *A

? A.两个总体均数不同

? B.两总体均数相同

? C.两个样本均数不同

? D.两个样本均数相同

16、多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后的HC值,则会() *C

? A.提高检验的灵敏度

? B.把一些无差别的总体推断成有差别

? C.把一些有差别的总体推断成无差别

? D.Ⅰ、Ⅱ类错误概率不变

17、增大样本含量,理论上可使其变小的是() *c

? A..样本的变异系数

? B.样本的标准差

? C.均数的抽样误差

? D.样本均数

18、随机区组设计方差分析中,SS误差等于() *B

? A.SS总-SS处理+SS区组

? B.SS总-SS处理-SS区组

? C.SS总-SS处理

? D.SS总-SS区组

19、完全随机设计方差分析中,总变异等于() *B

? A.SS组间+SS组内

? B.SS组间-SS组内

? C.MS组间+MS组内

? D.MS组间-MS组内

20、经调查,甲、乙两地冠心病的粗死亡率都为4.0‰,现以两地合并数据作为标准对年龄进行标化后,甲地冠心病

标化死亡率为4.5‰,乙地为3.8‰,因此可以认为() *A

? A.甲地老年人的比重比标准人口的老年人比重低

? B.乙地老年人的比重比标准人口的老年人比重低

? C.甲地冠心病的诊断较乙地准确

? D.乙地冠心病的诊断较甲地准确

21、在方差分析中,如果P≤α,则结论为() *b

? A.各个总体均数相等

? B.至少有两个总体均数不等

? C.至少有两个样本均数不等

? D.各个样本均数不全相等

22、两个小样本计量资料比较的假设检验,应首先考虑() *A

? A.资料符合哪种检验的条件

? B.秩和检验

? C.任选一种检验方法

? D.t检验

23、配对设计的符号秩检验的基本思想是:如果检验假设成立,则对样本来说() *C

? A.正秩和的绝对值小于负秩和的绝对值

? B.B总的秩和等于0

? C.C正秩和的绝对值与负秩和的绝对值不会相差很大

? D.D正秩和的绝对值与负秩和的绝对值相等

24、常用的变量变换的方法有() *A

? A.对数变换

? B.平方根变换

? C.平方根反正弦变换

? D.倒数变换

25、某试验者同时用A、B两种测声计在同一时间内随机测定了10个场地的噪声,现选用秩和检验,对两种测声计的

测定结果作出检验,此时,H0假设为() *B

? A.差值的总体均数为0

? B.差值的总体中位数为0

? C.UA=UB

? D.两总体分布相同

26、某研究试验用新药“胃丹灵”,对照组用公认的“胃苏冲剂”,并将胃炎患者分成3个年龄段,随机分配至新药组或

对照组,现拟采用非参数检验,此时,H0假设为() *D

? A.差值的总体均数为0

? B.差值的总体中位数为0

? C.两总体均数相等

? D.两总体分布相同

27、在死因统计分析中,死因顺位是按照()的大小由高到低排列的位次 *C

? A.发病率

? B.患病率

? C.死因构成比有两个独立的随机样本,样

? D.死因别病死率

28、多样本定量资料比较,当分布类型不清时应选择() *D

? A.方差分析

? B.检验

? C.Z检验

? D.Kruskal-Wallis检验

29、正态性检验时,为了减少第II类错误的概率,检验水准应取下列哪种为好() *B

? A.0.05

? B.0.2

? C.0.01

? D.0.1

30、针对食管癌的某大型调查,获得了几十万分资料,所选的危险因素有200余个,现对资料做初步分析,筛选出一

部分危险因素,为进一步的统计分析做准备,宜采用() *A

? A.Logistic回归

? B.多元线性回归

? C.方差分析

? D.非参数检验

31、完全随机设计多个样本均麩比较的方差分析,当p≤0.05,可认为() *C

? A.各样本均数不等或不全相等

? B.各样本方差不等或不全相等

? C.各总体均数不等或不全相等

? D.各总体方差不等或不全相等

32、两样本均属比较,经t检验,差别有统计学意义时,P值越小,说明() *C

? A.两样本均数差别越大

? B.两总体均数差别越大

? C.越有理由认为两总体均数不同

? D.越有理由认为两样本均数不同

33、在t检验分析中,P<0.05统计上可以认为() *D

? A.两样本均数相同

? B.两样本均数不同

? C.两总体均数相同

? D.两总体均数不同

34、假设检验的步骤是() *A

? A.建立假设,选择和计算统计量,确定P值和判断结果

? B.建立无效假设,建立备择假设,确定检验水准

? C.确定单侧检验或双侧检验,选择t检验或Z检验,估计Ⅰ类错误和Ⅱ类错误

? D.计算统计量,确定P值,作出推断结论

35、在进行成组设计两样本秩和检验时,一下检验假设中正确的是() *c

? A.H0:两样本对应的总体均数相同

? B.H0:两样本均数相同

? C.H0:两样本对应的总体分布位置相同

? D.H0:两样本的中位数相同

36、关于假设检验,下列说法正确的是() *B

? A.单侧检验优于双侧检验

? B.采用配对t检验还是成组t检验有实验设计方法决定

? C..检验结果若P值大于0.05,则接受H0犯错误的可能性较小

? D.用u(Z)检验进行两样本总体均数比较时,要求方差齐性

37、欲比较两地的钩虫感染率,今调查了甲、乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女。适

当的比较方法是() *D

? A.分性别进行比较

? B.两个率比较的u检验

? C.不具可比性

? D.对性别进行标准化后再比较

38、两小样本均数比较,方差不齐时,下列说法不正确的是() *C

? A.采用秩和检验

? B.采用t′检验

? C.仍用t检验

? D.变量变换后再作决定

39、当组数等于2时,对于同一资料,方差分析结果与t检验结果相比,() *C

? A.检验结果更为准确

? B.方差分析结果更为准确

? C.完全等价且

? D.不完全等价且

40、配对设计资料的符号秩检验,对差值编秩,遇有差值绝对值相等时() *B

? A.符号不同,按数值大小编秩

? B.取平均秩次

? C.符号不同,按顺序编秩

? D.不考虑符号,按顺序编秩

41、正态性检验,按α=0.10检验水准,认为其总体服从正态分布,此时若推断有错,其错误() *D

? A.大于0.10

? B.等于0.10

? C.小于0.10

? D.等于β,而β未知

42、多个样本均数间两两比较时,若用t检验,则出现() *D

? A.结果与q检验相同

? B.结果比q检验更合理

? C.可能出现假阴性的结果

? D.可能出现假阳性的结果

43、有两个独立的随机样本,样本含量分别为n1和n2,在进行成组设计资料的t检验是,自由度为() *D

? A.n1+n2

? B.n1+n2-1

? C.n1+n2+1

? D.n1+n2-2

44、非参数统计的应用条件是() *C

? A.样本数据来自正太总和

?

? C.总体分布类型未知

? D.要求样本例数很大

45、配对设计资料的符号秩检验中,H0为() *B

? A.差值的总体均数等于0

? B.差值的总体中位数等于0

? C.差值总体均数不等于0

? D.差值的总体中位数不等于0

46、配对设计的目的是() *C

? A.操作方便

? B.为了应用t检验

? C.提高组间可比性

? D.减少实验误差

47、下列指标不属于相对数的是() *D

? A.率

? B.构成比

? C.相对比

? D.百分位数

48、统计推断包括两个重要方面() *A

? A.参数估计和假设检验

? B.计算出均数和标准差

? C.统计描述和假设检验

? D.计算出均数和标准误

49、两样本均数的比较,P<0.01,可认为两总体均数() *B

? A.差别非常大

?

? C.无差别

? D.差别较大

50、描述分类资料的主要统计指标是() *B

? A.平均数

? B.相对数

? C.变异系数

? D.相关系数

51、当两总体方差相同时,以下方法中不适用于两样本均数比较的是() *B

? A.t检验

? B.t’检验

? C.Z检验

? D.方差齐性F检验

52、定量资料两样本均数的比较,可采用() *D

? A.t检验

? B.F检验

? C.Bonferroni检验

? D.t检验与F检验均可

53、在两样本均数差别的t检验时,事先估计并确定合适的样本含量的一个重要作用是() *c

? A.控制I型错误概率的大小

? B.可以消除I型错误

? C.控制II型错误概率的大小

? D.可以消除II型错误

54、两样本均数比较时,能用来说明两组总体均数间差别大小的是() *D

? A.t值

?

? C.F值

? D.两总体均数之差的95%置信区间

55、等级资料的比较宜用() *B

? A.t检验

? B.秩和检验

? C.F检验

? D.四格表卡方检验

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学题库1

绪论知识点 1. 只要增加例数就可以避免抽样误差。 A. + B. – 2. 等级资料也可认为是一种计数资料。 A. + B. - 3. 概率的取值一定在0~1范围内,频率的取值则不一定。 A. + B. - 4. 客观事物中同质是相对的,变异是绝对的。 A. + B. - 5. 观察单位数不确定的总体称为有限总体。 A. + B. - 6. 统计量针对于样本,参数针对于总体。 A. + B. - 7. 统计描述就是用样本推断总体的统计过程。 A. + B. - 8. 有序分类资料就是等级资料。

A. + B. - 9. 统计分析一般包括统计描述和统计推断。 A. + B. - 10. 如果对全部研究对象都进行了调查或测定就没有抽样误差。 A. + B. - 11. 对于统计资料的描述可用统计指标和统计图表两种手段。 A. + B. - 12. 有序变量也称连续型变量,变量值可取连续不断的实数。 A. + B. - 13. 分类资料中的各类别必须互相排斥,不能相互包含。 A. + B. - 14. 离散变量在数值很大时可以取小数值,可近似地看成连续型变量。 A. + B. - 15. 统计指标是用来综合说明总体某一特征的,而标志是说明个体某一特征的。

A. + B. - 16. 若以舒张压>90mmHg为高血压,调查某地1000人中有多少个高 血压患者, 这是________。 a.计量资料b.还不能决定是计量资料还是计数资 料 c.计数资料d.既可作计量也可作计数资料 e.等级资料 17. 某医院用一种中草药治疗9名高血压病人,治疗前后的舒张压见 下表。 病 人号 1 2 3 4 5 6 7 治疗前 11 5 11 12 9 11 11 6 10 9 10 9 治疗后 11 6 90 10 8 92 90 11 0 87 欲比较治疗前后有无差异, 这是_________。 a.计量资料b.还不能决定是计量资料还是 计数资料 c.计数资料d.既可作计量也可作计数资料e.等级资料 18. 一批病人的血球沉降率(%)是________。 a.计量资料b.还不能决定是计量资料还是

医学统计学第六版(马斌荣)课后习题答案

医学统计学第六版(马斌荣)课后习题答案 练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差

C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是: (1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定

医学统计学符号-公式-重点

第一章 医学统计中的基本概念 1、医学统计学是研究医学数据的收集、整理、分析、解释和呈现其结果的一门学科。 2、个体:研究的基本观察单位。 3、变量:用于观察研究对象的指标。 4、观察值:个体变量的数值。 5、资料:又称为数据,由变量的观察值构成。 变异:个体观察值之间具有 的差异。 变异和同质是对统计学数据 的要求! 变异是统计学研究的真正对 象! 统计学是研究变异规律的科 学! 同质:个体观察值之间的变 异在允许范围内。 异质:个体观察值之间的变 异超出允许范围。 一、总体、抽样、样本、参数、统计量 总体:同质的个体所构成的全体研究对象。总体同时具有同质和变异两个特点。 有限总体:总体中的个体 数量是有限的。 无限总体:总体中的个体 数量是无限的。 样本:从总体中随机抽取 的部分个体。 样本量:样本所包含的个

体数目。 参数:刻画总体特征的指标。 统计量:刻画样本特征的指标。 抽样:从总体中随机抽取部分个 体的过程。抽样具有代表性、随机性、可靠性、可比性; 原则:代表性:样本能充分反映 总体特征。 随机性:保证总体中每个个体都有相同的几率被抽样。 随机性是代表性的保证; 生活中随机性的例子(思考题); 计数资料计量资料 (分类资料)资料 等级资料(有序多分类资料) 二分类资料 无序多分类资料 计量资料:由连续变量的观察值构成的资料。对每个观察对象的观察指标用定量方法测定其数值大小 所得的资料,一般有度量衡单位,例如年龄、身高、 血糖。 计数资料:由离散变量的观察值构成的资料。先将 观察对象的观测指标按性 质或类别进行分组,然后 计数各组的数目所得的资料,例如性别、患病、血型。 等级分组资料:由等级变量的观测值构成的资料。具有计数资料的特征,同

研究生医学统计学上机考试习题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1. 某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录 见下表,问左、右肾重量有无不同? 表1: 20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13 例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4.某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘 进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度 城市编号肺癌标化死亡率(1/10万)苯并(a)芘(卩g/100m3) 1 5.60 0.05 2 18.50 1.17 3 16.23 1.05 4 11.40 0.10 5 13.80 0.75 6 8.13 0.50 7 18.00 0.65 8 12.10 1.20

医学统计学分析基本思路指南

医学统计学分析基本思路指南 医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。 更实际的分析思路是: (1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。 (2)明确数据您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。 (3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。 (4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择,可供读者参考。

《医学统计学》习题及答案

一、最佳选择题 1.卫生统计工作的步骤为 c A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为

医学统计学1上课例题

选择 1、假设检验中的第二类错误是指_______所犯的错误 A、拒绝了实际上成立的Ho B、不拒绝实际上成立的Ho C、拒绝了实际上不成立的Ho D、不拒绝实际上不成立的Ho 2、两样本均数比较的假设检验中,差别有统计学意义时,P 越小,说明_________ A、两样本均数差别越大 B、越有理由认为两样本均数不同 C、两总体均数差别越大 D、越有理由认为两总体均数不同 3、据以往经验,新生儿染色体异常率为0.01,在某地随机抽查400 名新生儿,只有1例异常,假设检验时,H1:π≠0.01,则假设检验的P值为_______。 (注:P(0)=0.0180,P(1)=0.0725,P(2)=0.1462,P(6)=0.1045,P(7)=0.0594,P(8)=0.0295,P(399)=0.0000) A、P (≤1)+P(≥6) B、P (≤1)+P(≥399) C、P (≤1)+P(≥7) D、P (≤0)+P(≥8)

4、三组样本均数的比较,先进行单因素方差分析,P<0.05。再进行两两比较,发现第一组与第二组差别无统计学意义,第二组与第三组差别也无统计学意义,但第一组与第三组之间差别有统计学意义,于是可认为______ A 、三组样本来自于同一总体 B 、.第一组和第三组来自于两个不同的总体,但尚无法判断第二组究竟来自于哪个总体 C 、第二组来自的总体位于第一组和第三组所来自的总体之间 D 、该两两比较为模糊结论,说明计算中发生了错误 5、为比较槟榔煎剂和阿的平的驱虫效果,有人分别用两法对绦虫患者进行治疗。槟榔煎剂治疗30人,有效23人,阿的平治疗30人,有效18人。要比较两种药物的疗效有无差 别,宜选用 。 A .四格表x 2 检验 2 2 ()A T x T -=∑ B .四格表x 2 检验 校正2 2 (||0.5)A T x T --=∑ C .配对四格表x 2 检验 2 2 ()b c x b c -= + D .配对四格表x 2 检验 校正2 2 (||1)b c x b c --=+

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

【孙振球第三版】医学统计学复习题

一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。 (2)多分类:各类间互不相容。 25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。 26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。 27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。 28、样本含量:样本中包含观察单位数称为该样本的样本含量。 29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。 30、变量值:对变量的观测值称为变量值或观察值。 31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。 33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。 34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。

医学期刊统计学错误思考

医学期刊统计学错误思考 本文作者:张巧莲郑玉建单位:新疆医科大学学报编辑部新疆医科大学公共卫生学院 在医学论文写作中,医学统计学方法应用是必不可少的,正确使用能保证科研工作顺利进行,并使科研成果更具有科学性、代表性和可靠性。反之,如果使用不当或者误用,会直接影响研究结果的质量,反而会使读者产生误解,甚至有时会导致错误的结论。近年来,医学统计学方法在医学科研中的应用越来越受到国内广大医学科研工作者的重视,统计分析结果表达已成为医学论文中一个不可缺少的重要组成部分。医学统计学是评价医学科技论文质量优劣的重要依据,然而从近年发表的论文来看,有不少作者对统计方法的使用还不熟悉,实际应用中统计方法滥用、错用和误用的情况时有发生[1]。据国外20世纪60年代到80年代对不同医学期刊发表论文的调查,有统计学错误的论文比例最高者达66%,最低者也有20%[2-4]。国内有学者对5种中华医学会系列杂志论著中统计学方法的应用状况进行了调查,结果显示,1985年统计错误的论文比例为24%,1995年为36%[5]。这些调查研究均说明统计方法误用的严重性以及正确应用的紧迫性。国外从20世纪70年代起就有针对医学论文的科研设计与统计方法应用情况的调查研究,国内学者也进行了相关研究[6]。这种研究有助于及时了解医学科研论文中统计方法的应用质量,发现存在的问题,提高医学科研工作者应用统计方法的水平。笔者总结了近年来已发表的医学科技论文中常见的统计学问题,希望能引起各位专家学者和临床医生

的共识与重视,促进我国医学期刊质量的提高。 1统计设计存在的常见问题 统计设计是整个研究中最重要的一环,是研究工作应遵循的依据。常见的统计设计问题有:忽视组间均衡性,样本缺乏代表性,样本例数不足,未设置对照组,未随机分组,未提出统计分析方法等。针对以上问题,在科研设计中一定要遵循实验设计的四大原则即“随机、对照、均衡、重复”的原则[6]。 1.1不遵循或不重视随机化原则 随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值[7]。 1.2缺少对照研究或对照组设计不合理 正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论

医学统计学公式总结

医学统计学公式总结-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一 般要求 计算95%或99%的可信区间) (五)总体率的区间估计 n x n x x x x x n ∑= ++++= 321∑∑=++++++++= f fx f f f f x f x f x f x f x k k k 3213322111 ) (22 --=∑n x x s 222()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-= n s x t μ -= x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

(六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围:s u x a ->或 s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 0μμ=:H 1 ,/00-=-=-=n n s x s x t x νμμ0 210==-μμμ:H d d d t s μ-==1-=n ν2 10μμ=:H 2 1)()(2121x x s x x t ----=μμ221-+=n n ν? ?? ?+= -2 1121s s C x x )()(2 222112∑-∑+-= x x x x s C

住院医师培训课程-常用医学科研中的统计学方法1

1、两组数据中的每个变量值减去同一常数后做两个样本均数差异的t检验() *c ? A.t值变小 ? B.t值变大 ? C.t值不变 ? D.t值变小或变大 2、作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是() *c ? A.A.统计量t越大,说明两总体均数差别越大 ? B.B.统计量t越大,说明两总体均数差别越小 ? C.C.统计量t越大,越有理由认为两总体均数不相等 ? D.D.P值就是αa 3、随机区组设计的方差分析用于() * ? A.多个样本均数间的两两比较 ? B.比较各个区组间的样本均数有无差别 ? C.比较各个区组间的总体均数有无差别 ? D.比较各个处理组间的样本均数有无差别 4、各组数据方差不齐时,可以做() *D ? A.近似检验 ? B.秩和检验 ? C.数据转换 ? D.ABC均可 5、第I类错误的概念是() *D ? A.H0是不对的,统计检验结果未拒绝H0 ? B.H0是对的,统计检验的结果未拒绝H0 ? C.H0是不对的,统计检验结果拒绝H0 ?

6、下列哪种说法是错误的() *B ? A.计算相对数尤其是率时应有足够数量的观察单位数或观察次数 ? B.分析大样本数据时可以构成代替率 ? C.应分别将分子和分母合计求合计率或平均率 ? D.相对数的比较应注意其可比性 7、配对计量资料进行假设检验时() *Dd ? A.仅能用配对t检验 ? B.仅能用成组t检验 ? C.仅能用随机区组设计的方差分析 ? D.用配比t检验和随机区组设计的方差分析均可 8、方差分析的前提条件是() *A ? A.计量资料非参数统计的 ? B.正态性 ? C.随机性 ? D.方差齐性 9、设配对设计资料的变量为X1与X2,则配对设计的符号的秩检验() *B ? A.把X1与X2的差数军队之从小到大编秩,排好后秩次保持原差数的正负号 ? B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号 ? C.把X1与X2综合按绝对值从小到大编秩 ? D.把X1与X2的差数从小到大编秩 10、对于配对t检验和成组t检验,下列哪一种说法是错误的() *B ? A.对于配对设计资料应作配对t检验,如果作成组t检验,不但不合理,而且平均起来统计效率降低 ? B.成组设计的资料用配对t检验,不但合理,而且平均起来可以提高统计效率 ? C.成组设计的资料,无法用配对t配对t检验 ?

最新医学统计学公式总结

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一般要求 计算95%或99%的可信区间) (五)总体率的区间估计 (六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围: s u x a ->或s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 其中 两样本方差齐性检验 (即为两样本方差的比值) (二)单因素方差分析 SS MS F SS MS νν= = B B B W W W (1)完全随机设计资料的方差分析 这里 (T 即为该组数据之和) (2)随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=:H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ:H d d t s μ-== 1 -=n ν210μμ=:H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内 组间总ννν+=2()/C x N =∑ij j T x = ∑

医学统计学公式整理 简洁版

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1 n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1)(2--∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 %100?= X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )(' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1)n S X ? ±96.1 (2)n S n t t ?±-)1(,05.0(前一个t 表示均数) 单样本t 检验: n S X t /0 μ-= 自由度为 n-1; 配对样本t 检验: 检验统计量: n S d t d /0-= 自由度为n-1(n 为对子数) 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错: Sc 的平方) 2 )()(2)1()1(21222211212 222112-+-+-= -+-+-= ∑∑n n X X X X n n S n S n S c 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量: (较小)(较大)2 2 2 1 S S F = 分子自由度为n 1-1,分母自由度为n 2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=N X X ij ij /)(22 ∑=N X C ij /)( 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示 n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np - 均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2121n n p p p p Z c c +--= 2121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率为 ∑∑==-==≤k X k X X X e X P k X P 0 ! )()(λλ 发生次数至少为k 次的概率为 )1(1)(-≤-=≥k X P k X P 总体均数的区间估计:正态近似法 95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较 正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为 λ λ-= X Z 两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单

相关主题