搜档网
当前位置:搜档网 › 2016级安徽医科大学医学统计学重点概述

2016级安徽医科大学医学统计学重点概述

2016级安徽医科大学医学统计学重点概述
2016级安徽医科大学医学统计学重点概述

一、名词解释

1.总体population :就是根据研究目的确定的同质观察单位的全体,确切的说,是同质的所有观察单位某种变量值的集合

2.样本sample :就是从总体中随机抽取部分观察单位,其实测值的集合

3.同质homogeneity :性质相同的事物称为同质,否则称为异质

4.系统误差:是指数据搜集和测量过程中由于仪器不准确、标准不规范等人为原因,造成观察结果偏大或偏小的一种误差,是由确定原因造成的误差。

5.随机误差:是由一些非人为的偶然因素,使得结果或大或小,是不确定、不可预知的一种误差,分为随机测量误差和抽样误差

6.抽样误差sampling error :由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差

7.定量资料:是通过度量衡的方法,测定每一单个观察单位某项研究指标的量的大小得到的资料,也称计量变量或数值变量。

8.定性资料:是将全体观察单位按某种性质或特征分组,然后再分别清点各组观察单位的个数所得到的资料,称定性资料也称计数变量或分类变量。

9.等级资料:是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料,又称有序分类资料。

10.变异系数:又称变异程度,简称变异度,记为CV ,是相对数,用于比较单位不同或均数相差较大的多组资料的变异程度。公式为CV=s /X ×100%

11.小概率事件(原理):若在一次观察或试验中发生的可能性很小或几乎不可能发生,可以看做很可能不发生,则称该事件为小概率事件。

12.率rate :是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度

13.构成比:说明某一事物内部各组成部分所占的比重或分布,等于某一组成部分的观察单位数/同一事物各组成部分的观察单位总数×100%

14.医学参考值范围reference range :指医学领域中特定的“正常”人群(即排除了对所研究指标有影响的疾病和相关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据的大多数个体(一般为95%)的取值范围

15.置信区间:是对这个样本的某个总体参数的区间估计,置信区间展现的是这

n X σ

σ=

个参数的真实值有一定概率落在测量结果的周围的程度,给出的是被测量参数的测量值的可信程度

16.均数为95%的CI值(置信区间):按一定的概率或可信度(1-a)用一个区间来估计总体参数所在的范围,这个范围称作可信度为1-a的可信区间(CI)又称置信区间,95%的可信区间中的95%是可信度,即,所求的可信区间包含总体参数的可信程度为95%

17.标准误standard error:是反映均数抽样误差大小及样本统计量之间离散程度的指标

18.检验水准size of test:亦称显著性水准,用α表示,它是预先确定的概率值,即小概率事件的标准,一般情况下α取0.05

成立,从所规定的总体中随机抽样,所获得等于及大于(或等于19.P值:指H

及小于)现有样本计算获得的检验统计量值的概率

一致,仅仅因为抽样的原因,使20.Ⅰ类错误typeⅠerror:如果实际情况与H

,导致推断结论错误,这样的错误称为Ⅰ得假设检验的结论为拒绝原本正确的H

类错误。犯Ⅰ类错误的概率用α来控制(假阳性/ 弃真错误)

不一致,仅仅因为抽样的原因,21.第Ⅱ类错误typeⅡerror:如果实际情况与H

,导致推断结论错误,这样的错误称使得假设检验的结论为不拒绝原本错误的H

为Ⅱ类错误。犯Ⅱ类错误的概率用β来控制(假阴性 / 取尾错误)

22.检验效能power of a test:为1-β,即当两总体的确有差别(H

不成立),

)的能力,1-β也按照事先确定的检验水准α,假设检验能发现该差异(拒绝H

取单尾

23.配对设计:配对设计是将受试对象按配对条件配成对子,每对中的个体接受不同的处理,配对设计一般以主要的非实验因素作为配比条件,而不以实验因素作为配比条件

24.完全随机设计:又称成组设计,只有单个研究因素,该因素有多个水平,如在实验中安随机化原则将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验效能

25.随机区组设计:又称配伍设计,属于两因素方差分析,用于多个样本均属的比较

26.析因设计:当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。该设计不仅可以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析方法

27.卡方检验的基本思想:通过计算实际频数与理论频数的吻合程度来判断所给

的处理因素是否有效

28.卡方值:实际频数与理论频数的吻合程度,其大小即用卡方值来表示。

29.非参数检验:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法,称为非参数检验

30.线性相关关系:如果具有相关关系的随机变量组成的散点图在直角坐标系中呈直线趋势,就称这两个变量存在线性相关关系

31.线性相关方关系:如果两个随机变量中,一个变量有小到大变化时,另一个变量也相应的由小变大(或由大变小),并且呈直线趋势,就称这两个变量存在直线相关关系(老师给的定义)

32.相关系数:是说明两变量间线性关系的密切程度和相关方向的一个统计指标,样本的相关系数用r表示,总体的相关系数用ρ表示

33.回归系数:在回归方程中表示自变量x对因变量y影响大小的参数,正回归系数表示y随x增大而增大,负回归系数表示y随x增大而减小

34.最小二乘法原理:即各实测点到回归直线法的纵向距离的平方和最小,是回归方程可以较好的反映各实测点的分布情况

35.双盲:受试对象和实验者都不知道受试对象分在哪一组

36.调查设计的四种方法:

1)单纯随机抽样:保证总体中每一个个体都有同等的机会被抽出来作为样本的抽样方法 2)系统抽样:即先将总体的全部个体按与研究现象无关的特定排序编号,依次每隔若干号码抽取的一个个体组成样本

3)分层抽样:先将总体全部个体按某种特征分成若干层,再从每层内随机抽取一定数量的个体合起来组成样本

4)整群抽样:先将总体分成若干群体,形成一个抽样框,从中随机抽取几个群体组成样本,对抽中群体的全部个体进行调查

二、简答题

1.简述频数表的绘制方法

(1)找出最大值、最小值和极差:极差=最大值—最小值

(2)确定组距、组段、组数:频数表一般设8-15个组段,常用极差的1/10取整作组距,第一组段包括最小值,最后一个组段要包括最大值并写出其下限上限(3)列表划记:把确定的组段序列制成表的形式,得出各组段频数

2.简述应用相对数的注意事项

(1)计算相对数时分母一般不宜过小。只有当观察单位足够多时,计算出的相对数才比较稳定,且能正确反映实际情况。

(2)分析时注意构成比和率的区别。构成比说明事物内部各组成部分所占的比重,即只能说明分布,不能说明某现象发生的频率或强度。

(3)合计率的计算。对观察单位不等的几个率,不能直接相加求其平均率,而应用合计的数据来计算。

(4)比较相对数时应注意资料的可比性。除了研究因素以外,其他影响因素应尽可能相近或相同比较才有意义。

(5)对样本率、构成比的比较应作假设检验,不能凭表面数值大小下结论。

3.确定医学参考值范围的原则:

(1)制定“正常”人群的入选标准

(2)确定样本量的大小,在符合入选标准的人群中随机抽样

(3)对样本中的每个个体进行指标测量

(4)确定是否要分组制定参考值范围

(5)根据该指标X 的背景意义,确定参考值的范围是双侧还是单侧

(6)根据样本资料的分布情况确定采用正态分布法还是百多分位数法

4.检验假设的基本步骤:

(1)建立检验假设,确定检验水准

(2)选择检验方法,计算统计量

(3)确定P值,做出推断结论

5.简述假设检验应用的注意事项

(1)假设检验的前提是要有严密的抽样研究设计:应尽量从同质总体中随机抽取,尽量保证组间均衡性,以确保资料具有可比性。

(2)正确选定假设检验方法:资料性质、分布类型、设计类型、样本大小等不同,以及分析的目的不同,适用的假设检验的方法也不同。

成立可能性是小概率,也就是说两者差(3)正确理解“差异无统计学意义”:H

异存在的可能性较大,“差异统计学意义”也不一定具有临床意义。

取决于研究对象有无本质差异和抽样误差大(4)结论不能绝对化:是否拒绝H

小,以及检验水准的高低,而检验水准与实验设计密切相关。

(5)报告结论时应注意:应列出样本计算的检验统计量值,注明采用的是单侧检验还是双侧检验,写出P值。

4.简述假设检验应注意的问题:

(1)选择检验方法必须符合资料的适用条件

(2)单侧检验和双侧检验的选择

(3)正确理解P值得意义

(4)结论不能绝对化

(5)当假设检验的结果为不拒绝时,应考虑该检验的检验效能,如果检验效能较低,则此时的结论可靠性较差

5.方差分析的基本思想:

是根据资料的设计类型和研究目的,将全部观察值总的离散程度和自由度分

解为相应的几个部分,除了随机误差外,其余每个部分的变异可由某个因素的作用加以解释,如各组均数间的变异可由处理因素的作用加以解释

6.在进行双向无序行列表卡方检验时发生偏性的处理方法:P157

(1)增大样本量,当样本量增大时理论频数会增大

(2)根据专业知识对理论频数较小的行或者列进行合并或者删除

(3)改用双向无序行×列表的Fisher确切概率法

7.简述秩和检验的优缺点及应用

(1)优点:①计算简单便于掌握缺点:①损失信息

②应用范围广②检验效率低

③收集资料方便

(2)应用:①分布型未知

②能以严重程度、优劣等级、效果大小和名次先后等等级资料

③分布极度偏态

④本组内个别变量值偏离过大,远离本组其它变量值

⑤方差不齐时

⑥筛选或只需获得初步结果。

8.秩和检验编秩次的方法:

(1)按差值的绝对值大小编秩次,并根据差值的正负给秩次加上正负号

(2)若差值为0,则舍去不计,相应的对子数n随之减少

(3)若差值的绝对值相等,则取平均秩次

9.在进行双向无序行列表卡方检验时发生偏性的处理方法:P157

(4)增大样本量,当样本量增大时理论频数会增大

(5)根据专业知识对理论频数较小的行或者列进行合并或者删除

(6)改用双向无序行×列表的Fisher确切概率法

10.简述应用线性相关分析的注意事项

(1)绘散点图了解线性趋势,样本的相关系数接近零时并不意味着两变量间一定无相关性

(2)线性相关分析要求两个变量都是随机变量,且仅适用于二元正态分布资料(3)作相关分析时,应该剔除离群值,出现异常点时慎用相关

(4)相关要有实际意义,两变量相关并不代表两变量间一定存在内在联系(5)r=0表明无相关或非线性相关

(6)分层资料盲目合并易出假象

老师的更简洁:

(1)进行相关分析前应先绘制散点图,以提示是否有必要进行线性相关分析(2)样本的相关系数为0时,并不意味着两变量一定无相关性

(3)一个数值随机变动,而另一个变量的数值却是人为选定的,此时不宜做相

关分析(两变量都应是随机的,均符合正态分布)

(4)作相关分析时,应该剔除离群值,出现异常点时慎用相关

(5)相关分析要有实际意义,相关未必真有内在联系

(6)分层资料盲目合并易出现假象

11.线性回归分析的适用条件:线性独立正态方差相等

(1)因变量Y与自变量X呈线性关系

(2)每个个体观察值之间相互独立

(3)因变量Y属于正态随机变量

(4)在一定范围内,不同的X值所对应的随机变量Y的方差相等

12.简述应用线性回归的注意事项

(1)进行线性回归分析时,应先绘散点图,提示有直线趋势存在时,可作线性回归分析

(2)进行线性回归分析时,一般要求因变量Y是来自正态总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严密控制的值

(3)进行线性回归分析要有实际意义,不能把毫无关联的两个事物或现象进行进行线性回归分析

(4)进行线性回归分析必须进行假设检验,以推断两变量间的线性关系是否存在

(5)回归直线不能外延,以自变量取值范围为限

13.简述线性回归与相关的区别及联系

(1)区别:

①资料要求不同:相关:两变量均为随机变量,并服从双变量正态分布

回归:Y服从正态分布,X为选定变量

②统计意义不同:相关:只反映两变量间相互依存

回归:有一个变量推算另一个变量

回归关系与原度量衡单位有关,相关关系则无

③分析目的不同:相关:两变量间线性关系的密切程度及相关方向

回归:用函数公式定量表达因变量随自变量变化的关系(2)联系:①变量间关系的方向一致:对同一资料,其相关系数r与回归系数b

的正负号一致

②假设检验等价:实际分析中常以r的假设检验代替对b的检验

③r与b值可相互换算

④用回归解释相关:r2称决定系数,r2越接近1,回归效果越好。

三、填空题

1.统计学的研究对象是变异的数据

2.医学统计学工作的基本步骤是:设计、搜集资料、整理资料、分析资料,其中最重要的步骤是科研设计

3.SPSS主要有4大窗口:数据编辑窗口(Data Editor)、结果输出窗口(Viewer)、程序编辑窗口(Syntax Editor)、图表编辑窗口(Chart Editor)

4.SPSS能直接调用的数据文件类型常用的有:*.sav、*.xls、*.dbf、*.txt、

*.dat

5.等比资料的集中趋势常用的描述方法是几何均数G

6.定量资料的集中趋势:均数、几何均数、中位数、百分位数

7.定量资料的离散趋势:全距、四分位数间距、方差、标准差、变异系数

8.偏态分布的集中趋势常用的描述方法是中位数;偏态分布的离散趋势常用的描述方法是四分位间距

9.单位不同或均数相差较大的多组资料常用的描述方法是:变异系数CV

10.参数是指:总体的统计指标;统计量是指:样本的统计指标

11.标准正态分布是一种特殊的正态分布,标准正态分布的:μ=0,σ2=1,通常用u(或Z)表示服从标准正态分布的变量,记为:u~N(0,12)

12.正态分布函数中μ代表:总体均数(位置参数),σ代表总体标准差(变异度参数)

13.正态分布曲线区间面积为95%的范围是:(μ-1.96σ,μ+1.96σ)

99%的范围是:(μ-2.58σ,μ+2.58σ)

90%的范围是:(μ-1.64σ,μ+1.64σ)

14.正态分布数据的参数估计X±1.96S;偏态分布数据的参数估计(P25,P75)

15.二项分布的条件:每次试验只有两种结果(死亡或者存活)、实验结果之间彼此独立、每次试验结果发生概率固定不变

16.二项分布近似正态分布的条件是:当n足够大时(n≥50),只要π不太靠近0或1,尤其是nπ和n(1-π)均大于5

17.Poisson分布的条件:每次试验只有两种结果(死亡或者存活)、实验结果之间彼此独立、每次试验结果发生概率固定不变 + 总体发生概率π非常小

18.Poisson分布近似正态分布的条件是:λ≥20

19.Poisson分布的两个特性是:均数与方差相等,观察结果有可加性

20.t分布的自由度ν越小,t分布曲线越低平,尾部越高;自由度ν越大,t分布曲线越接近标准正态分布(u分布)

Z分布与自由度无关

21.医学参考值范围通常表达为X±1.96S;置信区间围通常表达为X±1.96S X;

其中范围较宽的是医学参考值范围

22.假设检验的基本原理是反证法思想和小概率事件

23.配对样本均数的t检验,配对设计主要由以下几种形式:

①两种同质受试对象分别接受两种不同的处理

②同一受试对象或者同一样本的两个部分分别接受两种不同的处理

③同一受试对象接受某种处理前后

24.t检验的应用条件有:样本例数n较小、样本均是随机样本、符合正态分布、方差齐(两样本)

有统计学意义;正态性检验P<0.05为非正态分布,25.t检验P<0.05拒绝H

通常运用秩和检验

26.做单侧检验时如果运用了双侧检验可以导致第Ⅱ类错误增大;可以同时减小第Ⅰ类错误和第Ⅱ类错误的方法是增加样本含量

27.方差分析应用条件有两观察值互相独立、服从正态分布、方差齐性

28.完全随机设计组间变异包含处理效应+随机误差;组内变异包括随机误差;

SS

总=SS

组间

+SS

组内

;ν

组间

组内

29.随机区组设计的两因素方差分析中,总变异可以分解为三个部分,

即处理效应、区组间变异和随机误差

SS

总通常可以分为SS

处理

、SS

区组

和SS

误差

SS

=SS

处理

+SS

区组

+SS

误差

v

总=v

处理

+v

区组

+v

误差

30.行 列表χ2检验,要求不能有理论数(T)小于1,且1≤T<5的格子数不超过总格子数的1/5,否则产生偏倚。处理方法有三种:①增大样本含量②对理论频数较小的行或列进行合并或者删除③改用双向无序行×列的Fisher确切概率法

31.四格表的自由度等于1;四格表的周边合计数不变时,如果某格子的实际频数有变化,则其理论频数不变

32.统计表的制作原则:重点突出、层次清楚、简单明了

33.统计表的结构包括标题、标目、线条、数字、备注

34.统计表的种类:简单表、复合表

35.统计图的结构:标题、图域、标目、刻度、图例

36. 表示相互独立的各指标的大小用直条图(单式/复式);表示全体中各部分的比重用百分条图或圆图(构成图);表示连续性资料的发展变化或一事物随另一事物变迁的情况用线图(普通线图、半对数线图);比较事物发展速度用半对数图;表示连续性资料的频数分布用直方图;表示两组或多组连续性资料的平均指标和变异指标用箱式图,表示两事物的相关关系用散点图;表示某现象的数量在地域上的分布用统计地图

37.箱式图:箱子越长,表示资料数据越分散,即变异程度越大;反之变异程度越小。横线在箱子中点处表示对称分布,否则为偏态分布

38.普通线图:横轴、纵轴均为算术尺度

半对数线图:横轴为算术尺度,纵轴为对数尺度

39.某地调查的863例恶性肿瘤死者,分别由省、市、县、乡医院最后确诊。现欲说明各级医院确诊比例,宜绘制圆图/构成图(统计图)

40.非参数检验的优点:计算简单便于掌握、应用范围广、收集资料方便;

缺点:损失信息、检验效率低

41.线性相关分析的步骤:绘制散点图→观察两变量的线性趋势→计算相关系数→相关系数的假设检验

42.回归分析的步骤:绘制散点图→求回归方程→回归系数的假设检验→线性回归方程图

43.回归系数的估计原则:最小二乘法原则

44.线性相关系数的取值范围:-1≤r≤1;r假设检验方法:r 界值表法、t检验法

45.相关系数的统计推断方法:查表法、t检验

配对设计秩和检验的统计推断方法:查表法、正态近似法

完全随机(成组)设计两样本秩和检验的统计推断方法:查表法、正态近似法

完全随机(成组)设计多样本秩和检验的统计推断方法:查表法、χ2正态近似法46.等级相关秩和检验应用范围:偏态分布、分布类型未知、等级资料

47.实验设计的基本原则:对照原则、随机化原则、重复原则、盲法原则

48.实验设计的基本要素:处理因素、受试对象、实验效应

四、计算与分析

1.表1数据如下,卡方检验如下。问:应该选择哪种方法及哪组数值?新旧防护服是否对皮肤病患病率有影响?

表1 穿新旧两种防护服工人的皮肤病患病率比较防护服种类皮肤病炎症患病率(%)

阳性例数(理论频数) 阴性例数(理论频

数)

新1(3.8) 14(11.2) 6.7

旧10(7.2) 18(20.8) 35.7

表2 卡方检验(SPSS)结果

值df 渐进 Sig. (双侧) 精确 Sig.(双

侧)

精确Sig.(单

侧)

Pearson 卡方 4.329a 1 .037

连续校正b 2.938 1 .087

似然比 5.056 1 .025

Fisher 的精确检

.065 .038

线性和线性组合 4.228 1 .040

有效案例中的 N 43

(1)由于n≥40,但有1≤T<5,所以选用χ2检验校正公式,即选择结果的第二行数据进行分析

(2)假设检验:①建立检验假设:

H 0:π

1

=π

2

,即新旧防护服对皮肤病患病率无影响

H 1:π

1,

≠π

2

,即新旧防护服对皮肤病患病率有影响

②确定假设检验水准:α=0.05

③计算检验统计量:根据表2可得χ2=2.938,ν=1

④确定P值,作出推断结论:χ2

0.05,1

=3.84,根据表2可得P=0.087>0.05,按α

=0.05水准,不拒绝H

,差异无统计学意义,尚不能认为新旧防护服对皮肤病患病率有影响。

2.对11份工业污水测定氟离子(mg/L),每份水样同时采用电极法及分光光度法测定,结果见表3。三人对两种方法测定结果有无差别进行了统计分析,(1) 甲用独立样本t检验,t=-0.072,P=0.943;(2)乙则先对每份样品的差值做正态性检验(P<0.05),然后用配对设计的符号秩和检验(Wilcoxon Signed Ranks Test),得到z=1.633,P=0.102;(3)丙用配对设计的t检验,t=0.441,P=0.669。请问哪个人统计方法运用得当,并对该结果进行恰当分析

表3 两法测定的氟离子浓度结果(mg/L)

样品号电极法分光光度法样品号电极法分光光度法

1 10.5 8.8 7 16.4 14.7

2 21.6 18.8 8 19.5 17.2

3 14.9 13.5 9 127 15.5

4 30.2 27.6 10 18.7 16.3

5 8.4 9.1 11 9.5 9.5

6 7.

7 7

(1)丙的统计方法运用得当

(2)分析:该样本属于同一样本的两个部分分别接受两种不同处理,即应该采用配对样本均数的t检验

(3)假设检验:①建立检验假设:

H 0:μ

d

=0,即两种检测方法无差异

H 1:μ

d

≠0,即两种检测方法有差异

②确定假设检验水准:α=0.05

③计算检验统计量:t=0.441,ν=10

④确定P值,作出推断结论:P=0.669>0.05,按α=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两种检测方法有差异

3.某研究者测定51名肿瘤患者蛋白激酶(PKC)水平以及某单核苷酸多态性(SNP)的3种基因型GG、GA、AA(详见下表),他欲分析男、女PKC水平间有无差别,用什么统计分析方法?又想了解3种基因型PKC水平间有无差别,用什么统计方法分析(PKC数据经正态性检验服从正态分布)

性别基因型PKC 性别基因型PKC 性别基因型PKC

男GA 65.8 男AA 67.6 女GA 70.4

男GA 71.4 男AA 68.4 女GA 74

男GA 76.6 男AA 71.8 女GA 75.2

男GA 78.2 男AA 73.5 女GA 80.2

男GA 79.8 男AA 80.6 女GA 84.5

男GA 80.2 男AA 60.8 女GA 85.4

男GA 80.4 男GG 38.2 女GA 89.2

男GA 82.4 男GG 39.2 女AA 60.5

男GA 82.8 男GG 39.4 女AA 52.6

男GA 85.6 男AA 45.8 女AA 62.6

男GA 86.8 男GA 46.8 女AA 60.4

男GA 87.2 男GG 49.6 女AA 74.2

男GA 88.6 男AA 49.6 女GG 41.2

男AA 53.2 男AA 52.4 女GA 41.4

男AA 58.2 男AA 52.8 女GA 42.6

男AA 65.5 男GA 67.8 女GA 44.5

男AA 67.4 男AA 68.8 女AA 52.4

(1)分析男女PKC水平间有无差别应该用两独立样本的t检验

①建立检验假设:

H 0:μ

1

=μ

2

,即男女PKC水平间无差别

H 1:μ

1

≠μ

2

,即男女PKC水平间有差别

②确定假设检验水准:α=0.05

③计算检验统计量:t=0.511,ν=49

④确定P值,作出推断结论:P=0.612>0.05,按α=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为男女PKC水平间有差别

Independe nt Sample s Test

.362

.550

.51149.612 2.37059 4.64115-6.9561411.69732.498

30.058

.622

2.37059

4.75966

-7.34915

12.09033

E qual variances

assumed

E qual variances not assum ed

P KC

F

Sig.Levene's Test for E quality of Variances

t df

Sig. (2-tailed)

M ean Difference Std. E rror Difference Low er Upper 95% Confidence I nterval of the Difference t-test for E quality of M eans

(2)分析3种基因型PKC 水平间有无差别应选用完全随机设计资料的方差分析,并进行3组均数间的两两比较 ①建立检验假设:

H 0:3种基因型PKC 水平总体均数水平相同

H 1:3种基因型PKC 水平总体均数水平不全相同 ②确定假设检验水准:α=0.05 ③计算检验统计量:F=16.608

④确定P 值,作出推断结论:P =0.000<0.05,按α=0.05水准,拒绝H 0,差异有统计学意义,所以可以认为3种基因型PKC 水平总体均数水平不全相同。为了进一步了解三组间均值两两比较情况,SNK 检验显示1、2组,1、3组和2、3组之间均有统计学意义,可认为3种基因型PKC 水平完全不相等。

Te st of Homogeneity of Variance s P KC 2.964

2

48

.061

Levene Statistic df1

df2

Sig.

ANOVA

P KC

4918.35322459.17616.608

.000

7107.34448148.070

12025.697

50

Betw een Groups Within Groups Total

Sum of Squares df

M ean Square

F Sig.

PKC

Student-New m an-Keuls a,b

541.5200

2161.8619

25

73.9120

1.000 1.000 1.000

gene 132Sig.

N

123Subs et for alpha = .05M eans for groups in homogeneous subsets are displayed.

U ses H armonic M ean Sample Size = 10.430.a. The group sizes are unequal. The harm onic mean of the group sizes is us ed. Type I error levels are not guaranteed.

b.

4.有28份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察两种白喉杆菌生长情况,“+”号表示生长,“-”号表示不生长,结果如下表。问两种白喉杆菌培养基的效果有无差别? 甲种 乙种

合计 + - + 11(a ) 9 (b ) 20 - 1 (c ) 7 (d ) 8 合计 12 16 28

(1)建立检验假设

H 0:总体π1=π2,即两种白喉杆菌培养基的效果相同

H 1:总体π1,≠π2,即两种白喉杆菌培养基的效果不同 (2)确定假设检验水准:α=0.05 (3)计算检验统计量:本例b=9,c=1,b+c<40, (4)确定P 值,作出推断结论:χ2=4.90>χ20.05,1=3.84,P <0.05,按α=0.05水准,拒绝H 0,接受H 1,差异有统计学意义,可认为甲、乙两种白喉杆菌培养基的效果有差别,甲培养基培养效果优于乙培养基。

四、补充知识点

1.频数分布表的用途:①描述资料的分布特征和分布类型,②便于进一步计算有关指标或进行统计分析,③发现特大、特小的可疑值,④据此绘制频数分布图

2.正态分布图形的特征:①υ 是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 x =υ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于υ;②σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高

3.正态分布的应用:①估计频数分布,②制定参考值范围,③质量控制,④正态分布是许多统计方法的理论基础

4.t 分布图形的特征:①以0为中心,左右对称的单峰分布,②t 分布是一簇曲线,其形态变化与n (确切地说与自由度ν)大小有关。自由度ν越小,t 分布曲线越低平;自由度ν越大,t 分布曲线越接近标准正态分布(u 分布)曲线

5.医学参考值范围的制定

6.标准误与标准差

90.41

9)1|19(|22

=+--=χ

7.方差分析的基本思想:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断判断各因素对各组均数有无影响。

8.卡方检验公式选择

①当n≥40,且所有格子的T≥5时,选用卡方检验基本公式或专用公式

②当n≥40,但有1≤T<5时,选用卡方检验校正公式或改用四格表资料Fisher

③当n<40,或T<1时,须用四格表资料Fisher确切概率法

9.配对设计的符号秩和检验方法

(1)假设:H

0:差值总体中位数Md=0 ,H

1

:Md≠0 ,α =0.05

(2)求差值

(3)编秩次:依差值的绝对值从小到大编秩次。编秩次时遇差数等于0,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺次编秩次,符号相反取平均秩次,且符号相反。

(4)求秩和并确定检验统计量:分别求出正负秩次之和,正秩和以 T+表示,负秩和的绝对值以T-表示。T+及T-之和应等于 n(n+1)/2,任取T+(或 T-)作检验统计量T 。

(5)确定 P 值和作出推断结论:当 n≤50 时,查 T 界值表,得出 P值。若检验统计量T值在上、下界值范围内,其 P值大于表上方相应概率水平;若 T值在上、下界值上若范围外,其 P值小于表上方相应概率水平。

10.配对设计的形式有:①两种同质受试对象分别接受两种不同的处理,②同一受试对象或同一样本的两个部分分别接受两种不同的处理,③同一受试对象接受某种处理前后。

注意:做t检验时,一定要分清是配对样本的t检验还是两独立样本的t检验;做卡方检验时,一定要注意公式的适用条件。

大纲:

t检验:单样本均数的t检验、配对样本均数的t检验、两独立样本均数的t检

方差分析:完全随机设计资料的方差分析、随机区组资料的方差分析、多组均数比较的方差齐性检验、多组均数间的两两比较

一、名解

1、小概率事件:若在一次观察或实验中某事件发生的概率很小,可以看做很可能不发生,

该事件称小概率事件。不同研究问题对小概率的要求不同,习惯上,把P≤0.05或P ≤0.01称为“小概率事件”,这种小概率事件虽然不是不可能发生,但一般认为小概率事件在一次随机试验中基本不会发生,这就是小概率原理。

2、抽样误差:由于个体差异存在造成的样本均数与样本均数之间、样本均数与总体均数

之间的差异。抽样误差是随机的、不可预知的、不可避免的,但抽样误差是有规律的可以被认识的,其大小用标准误表示,可以用适当增加样本含量来减小抽样误差。

3、同质:一个总体中包含许多个体,性质相同的事物为同质,否则称异质。

4、变异:同质事物间,各观察单位的差别。

5、标准差:反映一组数据的平均离散水平或变异程度,适用于对称分布的资料,特别对

正态分布或近似正态分布的资料。方差开平方:公式见书。

6、四分位数间距:比极差稳定,并未考虑所有变量值,常用于偏态分布资料的变异度,

Q=P75-P25

7、均数的标准误:用于表示均数抽样误差大小的指标,反映样本均数之间的离散程度,

也反映样本均数抽样误差的大小。

8、标准正态分布:正态分布经转换后变为总体均数为0,总体标准差为1的正态分布称

标准正态分布。

9、均数为95%的CI值(置信区间):按一定的概率或可信度(1-a)用一个区间来估计总

体参数所在的范围,这个范围称作可信度为1-a的可信区间(CI)又称置信区间,95%的可信区间中的95%是可信度,即,所求的可信区间包含总体参数的可信程度为95% 10、第一类错误:如实际情况与H0一致,仅仅由于抽烟的原因,使得假设检验的结论为拒绝原本正确的H0,导致推断结论错误,这样的错误称为~

第二类错误:如实际情况和H0不一致,由于抽样原因使得假设检验的结论为不拒绝原本错误的H0,则导致了另一种推断错误,这样的错误称为~

检验效能:1-b成为检验效能,即当两总体的确有差别(H0不成立),按照事先确定的检验水准a,假设检验能发现该差异(拒绝H0)的能力,1-b 也取单尾

11、P值:是指H0成立从所规定的总体中随机抽样,所获得等于及大于(或等于及小于)现有样本计算获得的检验统计量值的概率。

12、相关系数:定量描述两变量间线性关系的密切程度和相关方向的统计指标。r无单位,-1 ≤r ≤ 1,r值为正—正相关,为负,—负相关,|r|=1 ---完全相关,|r|=0 ---零相关。

13、调查设计的四种方法

1)单纯随机抽样:保证总体中每一个个体都有同等的机会被抽出来作为样本的抽样方法

2)系统抽样:即先将总体的全部个体按与研究现象无关的特定排序编号,依次每隔若干号码抽取的一个个体组成样本

3)分层抽样:先将总体全部个体按某种特征分成若干层,再从每层内随机抽取一定数量的个体合起来组成样本

4)整群抽样:先将总体分成若干群体,形成一个抽样框,从中随机抽取几个群体组成样本,对抽中群体的全部个体进行调查

14、双盲:受试对象和实验执行者都不知道受试对象分在哪一组。

二、填空

1、两独立样本t检验应用条件:小样本、随机正态、方差齐同;配对t检验应用条件差值服从正态分布;样本t 检验应用条件:小样本、随机正态

2、医学参考值范围确定的方法:正态分步法、百分位数法

3、秩和检验的应用条件等级资料、原始资料分布不明确、偏态资料

4、相关分析分类正相关、负相关、零相关

5、等级相关分析条件等级资料、原始资料分布不明确、偏态资料

6、调查设计按研究对象分类有哪些?全面调查、抽样调查、典型调查;按时间分为病例对照和队列研究。

7、等概率抽样有哪些?单纯抽样、系统抽样、整群抽样、分层抽样

8、调查表考评从哪些方面考评信度、效度、可接受度

9、实验设计三要素受试对象、处理因素、实验效果三原则重复、对照、随机

10、随机的种类随机抽样、随机分组、实验顺序随机

11、实验设计中影响样本含量因素一类错误概率、二类错误概率、容许误差、总体标准差

12.卫生统计学的研究对象是变异数据

13.统计推断包括区间估计、假设检验

14、描述正态分布集中与离散趋势分别为算数均数、标准差

15、描述偏态分布集中与离散趋势分别为中位数、四分位间距

三、选择

1、各种统计图表的选择见书第九章

2、调查设计、实验设计的应用第13和14章

3、假设检验结果的判断

4、第一类和第二类错误关系α越大,一类错误概率越大,β越小;如果想同时缩小α、β,需提高样本含量。

5、反映抽样误差大小指标为标准误

四、简答

1、编制频数表注意事项

a计算极差R(数据的最大值与最小值之差)、b确定组段数与组距(等距分组,组距=R/预计的组段数)、c确定各组段的上下限(按照“下限≤x<上限”的原则确定每一例数据x 应归属的组段)、d列表。各组段的频数之和应等于总的观察例数

2、分类数据中,应用相对数应注意哪些问题

a 防止概念混淆

b 相对数时分母应用足够的数量

c 正确的合并估计频数型指标

d 资料对比应注意可比性

e 对相对数的统计推断

f 注意几个特殊指标的应用:比如发病率、患病率、死亡率和病死率等

3、概率分布中:二项分布、person分布、正态分布关系

1)、二项分布的特征:当π =0.5时分布对称,近似对称分布。当π≠0.5时,分布呈偏态,

特别是n 较小时, π偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n 的增大,分布逐渐逼近正态。因此,π或1- π不太小,而n 足够大,特别是当n π和n (1- π )都大于5时,我们常用正态近似的原理来处理二项分布的问题。 2)、Poisson 分布可以看作是发生的概率π 很小,而观察例数很大时的二项分布。除要符合二项分布的三个基本条件外,Poisson 分布还要求π或1-π接近于0和1。理论上可以证明,随着∞→λ无限大,Poisson 分布也渐近为正态分布。当20≥λ时,Poisson 分布资料可按正态分布处理。 3)、均数为0,标准差为1的正态分布称为标准正态分布。 正态分布的特征:关于x=u 对称/正态曲线在横轴上方均数处最高/正态分布有两个参数,即均数μ和标准差σ/正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于100%或1。

4、方差分析的基本思想

根据资料设计的类型及研究目的,将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响

5、相关分析的注意问题

1)在进行相关分析前先绘制散点图,以提示是否有必要进行线性相关分析 2)样本的相关系数接近0时并不意味着两变量间一定无相关性 3)一个变量的数值人为选定时莫作相关 4)出现异常点时慎用相关 5)相关未必真有内在联系 6)分层资料盲目合并易出假象 6、制定医学参考值的注意事项 1)样本不可太小 2)注意单双侧确定

3)根据原始资料选择正确估计方法 五、分析题

为判断统计分析方法的选择是否正确,故需掌握各种统计方法应用的范围及应用条件 1、考查

如比较多组定量数据比较不可分解为两两比较,会增加一类错误概率,应先采用方差分析,再针对研究目的选择合适的研究方法。如SNK-q 、Dunnett-t 、Bonfferoni 法比较。 2、秩和检验和卡方检验

多组单向有序数据不可以使用卡方检验,而需要用秩和检验。 六、计算题

题目会给出SPSS 计算结果,大家需结合各种检验应用条件,对结果进行分析总结,并得出结论,主要考察: 1、定量数据检验 t 检验和方差分析 2、定性数据检验

卡方检验条件 卡方值结论

大家可以看看这几章的SPSS 的例题,明白结果输出栏个英文单词所代表的含义及对结果进行的分析。

医学统计学

第一单元概述 1. 研究设计应包括那几方面内容?答:包括:专业设计和统计设计。专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据 收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1. 描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?答:集中趋势的指 标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2. 变异系数和标准差有何区别和联系? 答:区别: 1.计算公式不同:CV=S/X*100% ,标准差是方差的平方根。 2.单位不同:变异系数无量纲,标准差量纲和原指标一致。 3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分 布的资料,并且由公式所知,在均数一定时,CV 与s 呈正比。 3. 频数表的用途有哪些? 答: 1.描述资料的频数分布的特征; 2.便于发现一些特大或特小的可疑值; 3.将频数表作为 陈述资料的形式,便于进一步的统计分析和处理; 4.当样本量足够大时,可以以频数表作为 概率的估计值。 4. 用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。 3.正确计算频数指 标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1. 正态分布和标准正态分布的联系和区别?答:联系:均为连续型随机变量分布。区别:标准正态 分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4. 简述二项的应用条件? 答:条件为: 1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变; 3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5. 简述Q-Q 图法的基本原理? 答:U-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,U-变换的逆变 换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q 图法实际上就是首先求的小于某个x 的积累频率,再通过该积累频率求得相应的u 值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u —变换直线),否则(u, x)不会近似在一条直线上。Q —Q图法正是根据(u, x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1. 均数的标准差和标准误的区别和联系?答:区别和联系:标准差是描述个体值变异程度的指标, 为方差的算术平方根,该变异不能 通过统计方法来控制;而标准误则是指样本统计量的标准差,均数的标准误实质上是样本均

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

武大医学统计学期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特 征进行测量或观察,这种特征称为变量 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的

预防医学及医学统计学总结

绪论 一?预防医学:是医学的一门应用学科,它以个体和确定的群体为对象,目的是保护、促进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1?工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3?采取的对策 更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质 环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2?第二级预防:在 疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发 展和恶化。3?第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 一?流行病学]:是研究人群中疾病与健康状况的分布及其影响因素,并研究防治疾病及促进健康的策略和措施的科学。流行病学定义内涵:1.流行病学的研究对象时人群。2?流行病学关注的事件包括疾病与健康 状况。3?流行病学主要研究内容是:(1)揭示现象(2)找出原因(3)评价效果。4?流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1?分布论。2.病因论。3?健康-疾病连续带。4预防控制理论(三级预防理论)5?数理模型。6?流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2?探讨疾病的病因。3?研究疾病自然史,提高临床诊断、治疗水平和预后评估。4?疾病的预防控制及其效果评价。5?流行病学分支。 第二章疾病分布 一.疾病的分布即疾病的群体现象或称疾病的三间分布,是指疾病在时间、空间和人间的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间内(一般为1年)特定群中某病新病例 出现的频率。 2?罹患率|:与发病率一样,也是测量人群新病例发生频率的指标。使用与小范围、短时间内疾病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 3患病率|:也称现患率,指某特定时间内,总人口中现患某病者(包括新、旧病例)所占的比例。患病率=发病率*病程。 4续发率I:也称二代发病率,指某传染病易感接触者中,在最短潜伏期与最长潜伏期之间发病的人数占所有易感接触者总数的百分率。 5?死亡率:指在一定时间期间(通常为1年)内,某人群中死于某病(或死于所有原因)的 频率。死亡率是测量入群死亡危险最常用的指标。 6?病死率:表示一定时期内,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1?地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2?时间分布 3?人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组中 发病率均高,并随年龄增长而上升。(2)在其他地区居住的相似的人群组中,该病的发病率 均低,甚至不发病(3)外来的健康人,到达当地一定时间后发病,其发病率逐渐与当地具名接近(4)迁出该地区的

安徽医科大学申请学位发表论文规定 - 安徽医科大学研究生学院

安徽医科大学申请学位发表论文规定 (2015年6月修订) 第一章总则 第一条为进一步提高学校办学水平和科研水平,提高学位授予质量和社会竞争力,特制定本规定。 第二条学位申请人在申请学位前应及时将研究成果整理成论文发表,方可授予学位。发表论文应为本人专业的相关内容。 第三条本规定所指论文为学位申请人在规定时间内公开发表的学术论文,不含各种期刊的“增刊”上发表的论文,不含综述、会议文献或写给编辑的信(letter)。 第二章发表论文要求 第四条论文篇数与水平要求 (一)申请学术型博士学位(含以同等学力申请博士学位) 1.博士研究生:在SCI(含SCIE,EI、SSCI,下同)收录的源期刊上发表单篇影响因子≥1.5或累计影响因子≥ 2.0的学术论文。 2.硕博连读学术型研究生:发表单篇≥2.0或累计影响因子≥ 3.0的学术论文。 (二)申请临床医学博士专业学位 1.临床医学博士专业学位研究生须发表1篇SCI收录论文,影响因子≥1.0。 2.以同等学力申请临床医学博士专业学位的在职人员须发表1篇SCI收录论文,影响因子不限。 (三)申请学术型硕士学位(含以同等学力申请硕士学位) 1.学术型研究生须在中文核心或CSCD核心期刊上至少发表1篇论文。 2.社会科学类(含哲学、法学、教育学、管理学)研究生须在中文核心或CSCD期刊(含扩展)或本科高等院校学报上至少发表1篇论文。 3.申请提前毕业的学术型硕士学位研究生须发表累计影响因子不低于 1.0的SCI收录论文,其中社会科学类(含哲学、法学、教育学、管理学)研究生必须在《中文社会科学引文索引》(CSSCI)期刊上发表1篇论文。 (四)申请硕士专业学位(含以同等学力申请硕士专业学位)

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

华中科技大学医学统计学试题

医学统计学试题(A )卷(闭卷) 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布 B.发病率的变化意味着并因因素的变化 C.发病率的高低取决于疾病报告、登记制度以及诊断的正确 D.发病率的准确性取决于疾病报告、登记制度以及诊断的正确

医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。 总体是研究目的确定的所有同质观察单位的全体。样品是从研究总体中抽取部分有代表性的观察单位。 2.简述参数和统计量的定义,并且举例说明。 描述总体特征的指标称为参数,描述样本特征的指标称为统计量。 3.变量的类型有哪几种?举例说明各种类型变量有什么特点。 ①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的 高低。 ②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。 ③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺 序上的差异。 4.请举例说明一种类型的变量如何变换为另一种类型的变量。定量数据>有序数据>定性数据 ---------------> 5.请简述什么是小概率事件? 概率是描述事件发生可能性大小的度量,P0.05事件称为小概率事件。 6.举例说明什么是配对设计。 配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。 7.非参数假设检验适合什么类型数据进行分析? ①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。 8.简述P 25 P 50 P 75 的统计学意义。(条件:明显偏态且不能转化为正态或近似对称;一端或两端无 确定数值;分布情况未知) 用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。 9.直条图、直方图、圆饼图的使用条件是什么? 直条图:各自独立的统计指标的数值大小和他们之间的对比; 直方图:连续变量频数分布情况; 圆饼图:全体中各部分所占的比例。 10.统计分析包括哪两个方面的内容?为什么要进行统计推断? 统计描述和统计分析; 统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。统计推断指由样本数据的特征推断总体特征的方法,包括参数估计(点估计和区间估计)和假设检验(判断随机波动引起差别的概率大小)。 统计推断是通过样本推断总体的统计方法/根据样本提供的信息和抽样分布的规律,以一定的概率推断总体的特征。总体是通过总体分布的数量特征即参数 (如方差) 来反映的。很多时候并不知道总体的参数,只能由样本统计量推断获得。 11.定量数据如何进行统计描述?请举例说明。通过具体数值反应高低水平。 12.定性数据如何进行统计描述?请举例说明。根据类别或属性的不同分类。 13.简述均数的抽样误差及率的抽样误差。 由抽样造成的样本统计量与总体参数的差异称为抽样误差,样本均数不等于总体均数μ,总体率参数π不等于样本率p。 14.简述正态分布和标准正态分布的关系。 (μ=0,)关系:标准正态分布是正态分布的一种,具有正态分布的所有特征。所有 正态分布都可以通过Z分数公式转换成标准正态分布。 区别:正态分布的平均数为μ,标准差为σ;不同的正态分布可能有不同的μ值和d值,正态分布曲线形态因此不同。标准正态分布平均数μ=0,标准差σ=1,μ和σ都是固定值;标准正态分布曲线形态固定。

医学统计学 (2)

第一单元概述 1.研究设计应包括那几方面内容? 答:包括:专业设计和统计设计。 专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何? 答:集中趋势的指标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。 描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2.变异系数和标准差有何区别和联系? 答:区别:1.计算公式不同:CV=S/X*100%,标准差是方差的平方根。2.单位不同:变异系数无量纲,标准差量纲和原指标一致。3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV与s呈正比。 3.频数表的用途有哪些? 答:1.描述资料的频数分布的特征;2.便于发现一些特大或特小的可疑值;3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理;4.当样本量足够大时,可以以频数表作为概率的估计值。 4.用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1.正态分布和标准正态分布的联系和区别? 答:联系:均为连续型随机变量分布。区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4.简述二项的应用条件? 答:条件为:1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变;3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5.简述Q-Q图法的基本原理? 答:u-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,u-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率,再通过该积累频率求得相应的u值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u-变换直线),否则(u,x)不会近似在一条直线上。Q-Q图法正是根据(u,x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1.均数的标准差和标准误的区别和联系? 答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

安徽医科大学硕士研究生复试面试英语英文自我介绍

Self-introduction 自我介绍 Name:William Shakespeare Graduated University:××××××××××× Major:English Literature Admission Time:20XX-09-01—20XX-06-30 Telephone:+86×××××××(MP) E-mail:520521××××@https://www.sodocs.net/doc/8c12304055.html, (后附范文5篇及10类常见问题解答,总有一个适合你!) 20XX年XX月XX日

目录 范文一(英文) (3) 范文一(中文) (4) 范文二(英文) (5) 范文二(中文) (6) 范文三(英文) (7) 范文三(中文) (9) 范文四(英文) (10) 范文四(中文) (11) 范文五(英文) (12) 范文五(中文) (16) 十类常见问题解答 (17) (一)"What can you tell me about ......?". (18) (二)"What would you like to be doing......?" . (19) (三)"What is your greatest strength ?" (19) (四)"What is your greatest weakness?" (20) (五)"How do you feel about your progress to date?" (21) (六)行为面试问题 (21) (七)压力面试问题 (22) (八)案例面试问题 (22) (九)非常规问题 (23) (十)其他常见的英语面试问题 (24)

医学统计学公式总结

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一般要求 计算95%或99%的可信区间) (五)总体率的区间估计 (六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围: s u x a ->或s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 其中 两样本方差齐性检验 (即为两样本方差的比值) (二)单因素方差分析 SS MS F SS MS νν= = B B B W W W (1)完全随机设计资料的方差分析 这里 (T 即为该组数据之和) (2)随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=:H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ:H d d t s μ-== 1 -=n ν210μμ=:H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内 组间总ννν+=2()/C x N =∑ij j T x = ∑

相关主题