搜档网
当前位置:搜档网 › 常用医学科研中的统计学方法(1)

常用医学科研中的统计学方法(1)

常用医学科研中的统计学方法(1)
常用医学科研中的统计学方法(1)

常用医学科研中的统计

学方法(1)

-CAL-FENGHAI.-(YICAI)-Company One1

正确答案错误答案

1.从同一总体抽样,则样本标准差()

A随着样本含量增大而增大

B样本含量增大而标准差不变

C随着样本含量减少而减少

D随着样本含量增大而减小

2.用图表示某地区近30年三种疾病的发病率,在各年度的动态发展速度情况,宜绘制

()

A普通线性图

B.直方图

C.百分条图

D.半对数线图。

3.均数与标准误的关系()

A.均数越大,标准误越大

B.均数越大,标准误越小

C标准误越小,用均数推测总体均数的可靠性越大。

E标准误越大,用均数推测总体均数的可靠性越大。

4.多重线性回归分析中,度量一组自变量与应变量线性相关程度的统计量是()

A.负相关系数

B.决定系数

C.偏相关系数

D.偏回归系数

5.变异系数cv的数值()

A.一定大于1

B.一定小于1

C.可以大于1,也可以小于1

D.一定小于标准差。

6.在样本量为n,自变量个数为3的线性回归方程的假设检验中,回归变异和剩余变异

的自由度分别为()

A. 3和n-3

B. 3和n-4

C. 2和n-2

D. 2和n-3

7.比较某地区解放以来三种病的发病率在各个年度的发展速度,应该绘制()

A.半对数线图

B.圆图

C.直方图

D.普通线图

8.在同一总体中随机抽取多个样本,用样本均数估计总体均数95%的可信区间,则估计

精密度高的是()

A.均数小的样本

B.标准差小的样本

C.标准误大的样本

D.标准误小的样本

9.均数的标准误反映了()

A.个体的变异程度

B.集中趋势的位置

C.指标的分布规律

D.样本均数与总体均数的差异

10.由样本均数估计总体均数可靠性大小的指标是()

A.标准差

B.标准误

C.方差

D.变异系数

11.表示血清抗体滴度资料平均水平最常用的指标是()

A.算术平均数

B.中位数

C.几何均数

D.变异系数

12.抽样误差产生的原因是()

A.观察对象不纯

B.非正态分布资料

C.个体差异

D.非分类变量资料

13.95%置信区间的含义为()

A.此区间包含总体参数的概率是95%

B.此区间包含总体参数的可能性是95%

C.此区间包含总体参数,这句话可信的程度是95%

D.此区间包含样本统计量的概率是95%

14.各观察值乘以一个大于0的常数后,()不变

A.算数均数

B.标准差

C.中位数

D.几何均数

15.总体均数的可信区间()

A.随总体均数而变化

B.不随总体均数而变化

C.是一个固定区间

D.随样本不同而变化

16.对数正态分布资料最好计算()以表示离散趋势。

A.平均数

B.几何均数

C.中位数

D.标准差

17.若要得到残差平方和最小的回归方程,最好选用()

A.全局选择法

B.逐步回归法

C.后退法

D.前进法

18.各观察值均加(或减)同一数后()

A.均数不变,标准差改变

B.均数改变,标准差不变

C.两者均不变

D.两者均改变

19.某地区两年的三种死因别死亡率。若用统计图表示出来可能选用()

A.复式线图

B.百分条图

C.复式直条图

D.直方图

20.以下关于参数估计的说法正确的是()

A.区间估计优于点估计

B.样本含量越大,置信区间范围越大

C.样本含量越小,参数估计越精确

D.对于一个参数可以获得几个估计值

21.作多重线性回归分析时,若降低入选的F界的值,则进入方程的变量一般会()

A.增多

B.减少

C.不变

D.可增多,可减少

22.均数95%置信区间主要用于()

A.估计”正常人群”某指标95%观察值所在的范围X

B.反应总体均数有95%的可能在某范围内

C.反应某指标的可能取值范围

D.反映某指标的观察值波动范围

23.在多重线性回归中,若对某个自变量的值都增加一个常数,则相应地偏回归系数()

A.不变

B.增加相同的常数

C.减少相同的常数

D.增加但数值不定

24.描述一组偏态(偏锋)分布资料的变异程度,用()指标较好

A.全距

B.标准差

C.变异系数

D.四分位数间距

25.少数几个数据比大部分数据大几百倍,宜用()表示其平均水平

A.平均数

B.几何均数

C.中位数

D.标准差

26.多重线性回归分析中,可用来对自变量的作用大小进行比较的统计量是()

A.偏回归系数

B.标准偏回归系数

C.复相关系数

D.决定系数

27.在多重线性回归中,若对某个自变量的值都乘以一个相同的常数k,则相应地偏回归

系数()

A.不变

B.都变为1/k倍

C.变为原来的k倍

D.改变,但数值不定

28.减少均数的抽样误差的可行方法之一是()

A.严格执行随机抽样

B.增大样本含量

C.设立对照

D.选一些处于中间状态的个体

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学题库1

绪论知识点 1. 只要增加例数就可以避免抽样误差。 A. + B. – 2. 等级资料也可认为是一种计数资料。 A. + B. - 3. 概率的取值一定在0~1范围内,频率的取值则不一定。 A. + B. - 4. 客观事物中同质是相对的,变异是绝对的。 A. + B. - 5. 观察单位数不确定的总体称为有限总体。 A. + B. - 6. 统计量针对于样本,参数针对于总体。 A. + B. - 7. 统计描述就是用样本推断总体的统计过程。 A. + B. - 8. 有序分类资料就是等级资料。

A. + B. - 9. 统计分析一般包括统计描述和统计推断。 A. + B. - 10. 如果对全部研究对象都进行了调查或测定就没有抽样误差。 A. + B. - 11. 对于统计资料的描述可用统计指标和统计图表两种手段。 A. + B. - 12. 有序变量也称连续型变量,变量值可取连续不断的实数。 A. + B. - 13. 分类资料中的各类别必须互相排斥,不能相互包含。 A. + B. - 14. 离散变量在数值很大时可以取小数值,可近似地看成连续型变量。 A. + B. - 15. 统计指标是用来综合说明总体某一特征的,而标志是说明个体某一特征的。

A. + B. - 16. 若以舒张压>90mmHg为高血压,调查某地1000人中有多少个高 血压患者, 这是________。 a.计量资料b.还不能决定是计量资料还是计数资 料 c.计数资料d.既可作计量也可作计数资料 e.等级资料 17. 某医院用一种中草药治疗9名高血压病人,治疗前后的舒张压见 下表。 病 人号 1 2 3 4 5 6 7 治疗前 11 5 11 12 9 11 11 6 10 9 10 9 治疗后 11 6 90 10 8 92 90 11 0 87 欲比较治疗前后有无差异, 这是_________。 a.计量资料b.还不能决定是计量资料还是 计数资料 c.计数资料d.既可作计量也可作计数资料e.等级资料 18. 一批病人的血球沉降率(%)是________。 a.计量资料b.还不能决定是计量资料还是

医学统计学第六版(马斌荣)课后习题答案

医学统计学第六版(马斌荣)课后习题答案 练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差

C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是: (1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定

医学统计学符号-公式-重点

第一章 医学统计中的基本概念 1、医学统计学是研究医学数据的收集、整理、分析、解释和呈现其结果的一门学科。 2、个体:研究的基本观察单位。 3、变量:用于观察研究对象的指标。 4、观察值:个体变量的数值。 5、资料:又称为数据,由变量的观察值构成。 变异:个体观察值之间具有 的差异。 变异和同质是对统计学数据 的要求! 变异是统计学研究的真正对 象! 统计学是研究变异规律的科 学! 同质:个体观察值之间的变 异在允许范围内。 异质:个体观察值之间的变 异超出允许范围。 一、总体、抽样、样本、参数、统计量 总体:同质的个体所构成的全体研究对象。总体同时具有同质和变异两个特点。 有限总体:总体中的个体 数量是有限的。 无限总体:总体中的个体 数量是无限的。 样本:从总体中随机抽取 的部分个体。 样本量:样本所包含的个

体数目。 参数:刻画总体特征的指标。 统计量:刻画样本特征的指标。 抽样:从总体中随机抽取部分个 体的过程。抽样具有代表性、随机性、可靠性、可比性; 原则:代表性:样本能充分反映 总体特征。 随机性:保证总体中每个个体都有相同的几率被抽样。 随机性是代表性的保证; 生活中随机性的例子(思考题); 计数资料计量资料 (分类资料)资料 等级资料(有序多分类资料) 二分类资料 无序多分类资料 计量资料:由连续变量的观察值构成的资料。对每个观察对象的观察指标用定量方法测定其数值大小 所得的资料,一般有度量衡单位,例如年龄、身高、 血糖。 计数资料:由离散变量的观察值构成的资料。先将 观察对象的观测指标按性 质或类别进行分组,然后 计数各组的数目所得的资料,例如性别、患病、血型。 等级分组资料:由等级变量的观测值构成的资料。具有计数资料的特征,同

研究生医学统计学上机考试习题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1. 某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录 见下表,问左、右肾重量有无不同? 表1: 20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13 例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4.某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘 进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度 城市编号肺癌标化死亡率(1/10万)苯并(a)芘(卩g/100m3) 1 5.60 0.05 2 18.50 1.17 3 16.23 1.05 4 11.40 0.10 5 13.80 0.75 6 8.13 0.50 7 18.00 0.65 8 12.10 1.20

医学统计学分析基本思路指南

医学统计学分析基本思路指南 医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。 更实际的分析思路是: (1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。 (2)明确数据您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。 (3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。 (4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择,可供读者参考。

《医学统计学》习题及答案

一、最佳选择题 1.卫生统计工作的步骤为 c A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为

医学统计学1上课例题

选择 1、假设检验中的第二类错误是指_______所犯的错误 A、拒绝了实际上成立的Ho B、不拒绝实际上成立的Ho C、拒绝了实际上不成立的Ho D、不拒绝实际上不成立的Ho 2、两样本均数比较的假设检验中,差别有统计学意义时,P 越小,说明_________ A、两样本均数差别越大 B、越有理由认为两样本均数不同 C、两总体均数差别越大 D、越有理由认为两总体均数不同 3、据以往经验,新生儿染色体异常率为0.01,在某地随机抽查400 名新生儿,只有1例异常,假设检验时,H1:π≠0.01,则假设检验的P值为_______。 (注:P(0)=0.0180,P(1)=0.0725,P(2)=0.1462,P(6)=0.1045,P(7)=0.0594,P(8)=0.0295,P(399)=0.0000) A、P (≤1)+P(≥6) B、P (≤1)+P(≥399) C、P (≤1)+P(≥7) D、P (≤0)+P(≥8)

4、三组样本均数的比较,先进行单因素方差分析,P<0.05。再进行两两比较,发现第一组与第二组差别无统计学意义,第二组与第三组差别也无统计学意义,但第一组与第三组之间差别有统计学意义,于是可认为______ A 、三组样本来自于同一总体 B 、.第一组和第三组来自于两个不同的总体,但尚无法判断第二组究竟来自于哪个总体 C 、第二组来自的总体位于第一组和第三组所来自的总体之间 D 、该两两比较为模糊结论,说明计算中发生了错误 5、为比较槟榔煎剂和阿的平的驱虫效果,有人分别用两法对绦虫患者进行治疗。槟榔煎剂治疗30人,有效23人,阿的平治疗30人,有效18人。要比较两种药物的疗效有无差 别,宜选用 。 A .四格表x 2 检验 2 2 ()A T x T -=∑ B .四格表x 2 检验 校正2 2 (||0.5)A T x T --=∑ C .配对四格表x 2 检验 2 2 ()b c x b c -= + D .配对四格表x 2 检验 校正2 2 (||1)b c x b c --=+

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

【孙振球第三版】医学统计学复习题

一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。 (2)多分类:各类间互不相容。 25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。 26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。 27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。 28、样本含量:样本中包含观察单位数称为该样本的样本含量。 29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。 30、变量值:对变量的观测值称为变量值或观察值。 31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。 33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。 34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。

医学期刊统计学错误思考

医学期刊统计学错误思考 本文作者:张巧莲郑玉建单位:新疆医科大学学报编辑部新疆医科大学公共卫生学院 在医学论文写作中,医学统计学方法应用是必不可少的,正确使用能保证科研工作顺利进行,并使科研成果更具有科学性、代表性和可靠性。反之,如果使用不当或者误用,会直接影响研究结果的质量,反而会使读者产生误解,甚至有时会导致错误的结论。近年来,医学统计学方法在医学科研中的应用越来越受到国内广大医学科研工作者的重视,统计分析结果表达已成为医学论文中一个不可缺少的重要组成部分。医学统计学是评价医学科技论文质量优劣的重要依据,然而从近年发表的论文来看,有不少作者对统计方法的使用还不熟悉,实际应用中统计方法滥用、错用和误用的情况时有发生[1]。据国外20世纪60年代到80年代对不同医学期刊发表论文的调查,有统计学错误的论文比例最高者达66%,最低者也有20%[2-4]。国内有学者对5种中华医学会系列杂志论著中统计学方法的应用状况进行了调查,结果显示,1985年统计错误的论文比例为24%,1995年为36%[5]。这些调查研究均说明统计方法误用的严重性以及正确应用的紧迫性。国外从20世纪70年代起就有针对医学论文的科研设计与统计方法应用情况的调查研究,国内学者也进行了相关研究[6]。这种研究有助于及时了解医学科研论文中统计方法的应用质量,发现存在的问题,提高医学科研工作者应用统计方法的水平。笔者总结了近年来已发表的医学科技论文中常见的统计学问题,希望能引起各位专家学者和临床医生

的共识与重视,促进我国医学期刊质量的提高。 1统计设计存在的常见问题 统计设计是整个研究中最重要的一环,是研究工作应遵循的依据。常见的统计设计问题有:忽视组间均衡性,样本缺乏代表性,样本例数不足,未设置对照组,未随机分组,未提出统计分析方法等。针对以上问题,在科研设计中一定要遵循实验设计的四大原则即“随机、对照、均衡、重复”的原则[6]。 1.1不遵循或不重视随机化原则 随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值[7]。 1.2缺少对照研究或对照组设计不合理 正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论

医学统计学公式总结

医学统计学公式总结-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一 般要求 计算95%或99%的可信区间) (五)总体率的区间估计 n x n x x x x x n ∑= ++++= 321∑∑=++++++++= f fx f f f f x f x f x f x f x k k k 3213322111 ) (22 --=∑n x x s 222()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-= n s x t μ -= x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

(六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围:s u x a ->或 s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 0μμ=:H 1 ,/00-=-=-=n n s x s x t x νμμ0 210==-μμμ:H d d d t s μ-==1-=n ν2 10μμ=:H 2 1)()(2121x x s x x t ----=μμ221-+=n n ν? ?? ?+= -2 1121s s C x x )()(2 222112∑-∑+-= x x x x s C

住院医师培训课程-常用医学科研中的统计学方法1

1、两组数据中的每个变量值减去同一常数后做两个样本均数差异的t检验() *c ? A.t值变小 ? B.t值变大 ? C.t值不变 ? D.t值变小或变大 2、作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是() *c ? A.A.统计量t越大,说明两总体均数差别越大 ? B.B.统计量t越大,说明两总体均数差别越小 ? C.C.统计量t越大,越有理由认为两总体均数不相等 ? D.D.P值就是αa 3、随机区组设计的方差分析用于() * ? A.多个样本均数间的两两比较 ? B.比较各个区组间的样本均数有无差别 ? C.比较各个区组间的总体均数有无差别 ? D.比较各个处理组间的样本均数有无差别 4、各组数据方差不齐时,可以做() *D ? A.近似检验 ? B.秩和检验 ? C.数据转换 ? D.ABC均可 5、第I类错误的概念是() *D ? A.H0是不对的,统计检验结果未拒绝H0 ? B.H0是对的,统计检验的结果未拒绝H0 ? C.H0是不对的,统计检验结果拒绝H0 ?

6、下列哪种说法是错误的() *B ? A.计算相对数尤其是率时应有足够数量的观察单位数或观察次数 ? B.分析大样本数据时可以构成代替率 ? C.应分别将分子和分母合计求合计率或平均率 ? D.相对数的比较应注意其可比性 7、配对计量资料进行假设检验时() *Dd ? A.仅能用配对t检验 ? B.仅能用成组t检验 ? C.仅能用随机区组设计的方差分析 ? D.用配比t检验和随机区组设计的方差分析均可 8、方差分析的前提条件是() *A ? A.计量资料非参数统计的 ? B.正态性 ? C.随机性 ? D.方差齐性 9、设配对设计资料的变量为X1与X2,则配对设计的符号的秩检验() *B ? A.把X1与X2的差数军队之从小到大编秩,排好后秩次保持原差数的正负号 ? B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号 ? C.把X1与X2综合按绝对值从小到大编秩 ? D.把X1与X2的差数从小到大编秩 10、对于配对t检验和成组t检验,下列哪一种说法是错误的() *B ? A.对于配对设计资料应作配对t检验,如果作成组t检验,不但不合理,而且平均起来统计效率降低 ? B.成组设计的资料用配对t检验,不但合理,而且平均起来可以提高统计效率 ? C.成组设计的资料,无法用配对t配对t检验 ?

最新医学统计学公式总结

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一般要求 计算95%或99%的可信区间) (五)总体率的区间估计 (六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围: s u x a ->或s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 其中 两样本方差齐性检验 (即为两样本方差的比值) (二)单因素方差分析 SS MS F SS MS νν= = B B B W W W (1)完全随机设计资料的方差分析 这里 (T 即为该组数据之和) (2)随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=:H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ:H d d t s μ-== 1 -=n ν210μμ=:H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内 组间总ννν+=2()/C x N =∑ij j T x = ∑

医学统计学公式整理 简洁版

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1 n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1)(2--∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 %100?= X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )(' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1)n S X ? ±96.1 (2)n S n t t ?±-)1(,05.0(前一个t 表示均数) 单样本t 检验: n S X t /0 μ-= 自由度为 n-1; 配对样本t 检验: 检验统计量: n S d t d /0-= 自由度为n-1(n 为对子数) 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错: Sc 的平方) 2 )()(2)1()1(21222211212 222112-+-+-= -+-+-= ∑∑n n X X X X n n S n S n S c 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量: (较小)(较大)2 2 2 1 S S F = 分子自由度为n 1-1,分母自由度为n 2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=N X X ij ij /)(22 ∑=N X C ij /)( 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示 n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np - 均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2121n n p p p p Z c c +--= 2121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率为 ∑∑==-==≤k X k X X X e X P k X P 0 ! )()(λλ 发生次数至少为k 次的概率为 )1(1)(-≤-=≥k X P k X P 总体均数的区间估计:正态近似法 95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较 正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为 λ λ-= X Z 两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单

相关主题