搜档网
当前位置:搜档网 › 医学统计学章节重点归纳

医学统计学章节重点归纳

医学统计学章节重点归纳
医学统计学章节重点归纳

医学统计学章节重点归纳

第一节概述

1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医

学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。

2、

卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析

3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。

4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国

家等。

5、变异:是指客观事物的多样性和不确定性。

6、变量:

观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。

7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。

8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。

9、概率:事件发生的可能性大小的量度,通常以符号P表示。

10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。

第二节数值资料的统计描述

1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。

2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。

3、集中趋势指标:算术平均数(均数)、几何均数、中位数。

指标使用条件计算公式

算术平均数适用于正态或近似正态分布

的数值变量资料

几何均数①对数正态分布,即数据经

过对数变换后呈正态分布的

资料;②等比级数资料,即

观察值之间呈倍数或近似倍

数变化的资料。

中位数①非正态分布资料(对数正

态分布除外);②频数分布

的一端或两端无确切数据的

资料③总体分布不清楚的资

料。为奇数 , 为偶数,

4、离散型趋势指标:极差、标准差和变异系数

指标计算公式主要优缺点

极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映

组内其它观察值的变异度,不稳定,受样本量影响很大。

离均差平

方和

反映了各变量值之间的变异情况,但单位是原观察值单位的平方,不易理解,同时又受观察值个数的影响,不利于比较。 方差

反映了各变量值之间的变异情况,不受观察值个数的影响,但单位是原观察值单位的平方,不易理解。 标准差

反映了各变量值之间的变异情况,不受观察值个数的影响,单位与原观察值单位相同,是最常用的离散程度指标之一,但在两组合多组资料比较时,常受到计量单位不同和均数相差很大的影响而不能比较和不便于比较。 变异系数

反映了各变量值之间的变异情况,不受观察值个数的影响,没有单位,用于比较度量衡单位不同或均数相差悬殊的多组资料的变异度。

5、 正态分布下面积分布规律①标准正态分布时区间(-1,1)或正态分布时区间(μ-1σ,μ+1σ)的面积占总面积的

68.27%;②标准正态分布时区间(-1.96,1.96)或正态分布时区间(μ-1.96σ,μ+1.96σ)的面积占总面积的95%;③标准正态分布时区间(-2.58,2.58)或正态分布时区间(μ-2.58σ,μ+2.58σ)的面积占总面积的99%。 6、 正态分布的应用。a 、医学参考值范围 b 、质量控制 c 、正态分布是其他一些理论分布的极限形式。

第三节 总体均数的估计和t 检验

1、 均数的抽样误差:由抽样引起的样本均数与总体均数之差。均数的抽样误差大小用标准误来描述。标准误σ

X =n σ。一般不知道总体均数σ,可用样本标准差S 来代替:S X =n s 。

2、标准差与标准误的区别与联系: 区别:⑴标准差S (σ):①意义:描述个体观察值变异程度的大小。标准差小,均数对一组观察值得代表性好;②应用:与X 结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n 的关系:n 越大,S 越趋于稳定;⑵标准误S X (σX ):①意义:描述样本均数变异程度及抽样误差的大小。标准误小,用样本均数推断总体均数的可靠性大;②应用于X 结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n 的关系:n 越大,S 越小。联系:①都是描述变异程度的指标;②由S X =n s 可知,S X 与S 正比。n 一定时,s 越大,S X 越大。

3、t 分布:当X 服从均数为μ的正态分布时,统计量 n s X t μ

-=服从自由度为v=n-1的t 分布,是小样本总体均

数的区间估计及假设检验的理论基础。

4、t 分布的图形特征:t 值得分布于自由度有关。t 分布只有一个参数即v 。特征:①单峰分布,以0为中心,左右对称;②v 越小,t 值越分散,曲线的峰部越矮,尾部越高;③随着v 逐渐增大,t 分布逐渐接近标准正态分布;当v 趋向∞时,t 分布趋近标准正态分布,故标准正态分布是t 分布的特例;④t 分布是一簇曲线。

5、一般正态分布转化为标准正态分布就是将变量X 转变为标准正态变量Z 值。Z=(X-X )/S 。

6、小样本均数可信区间:总体均数μ的双侧(1-α)置信区间为X ±t v ,α2/S X ;单侧(X -t v ,αS X ,∞)或(-∞,X + t v ,αS X )。μ95%的可信区间:X ±t 0.05,v S X ;μ99%的可信区间:X ±t 0.01,v S X

7、大样本均数可信区间估计:μ95%的可信区间:X ±1.96S X ;μ99%的可信区间:X ±2.58 S X

8、t 检验主要用于两组均属的比较,它能够判断进行比较的两个均数的差别是由于抽样误差引起,还是来自不

同总体。

9、t 检验应用条件:①资料是数值资料②分析目的是对两均数进行比较③样本例数较少时,资料服从正态分布,做两样本均数比较时,要求两总体方差齐。

10、样本均数与总体均数比较的t

11、配对设计的t

12、两样本均数比较的u 检验,两样本均数比较时,如n 1和n 2均大于100,可用Z 检验。2221212

1n S n S X X Z +-=

第四节 方差分析

1、方差分析应用:a 、两个或多个样本均数的比较b 、分离各有关因素并分别估计其效应c 、分析两因素或多因素的交互作用d 、方差齐性检验

2、方差分析包括:a 、完全随机设计的方差分析b 、随机区组(配伍组)设计资料的方差分析c 、均数间的两两比较。

C=(∑∑Xij )/n i

1、 方差分析基本条件:a 、独立性各样本是相互独立的随机样本b 、方差齐性各组实验结果变异程度一致c 、正

态性各组实验结果都服从正态分布

第四节 分类资料的统计描述

1、常用相对数包括:率、构成比、相对比

2、率:

率又称频率指标,说明某现象发生的频率或强度,常以100%、1000‰等表示。

3、构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常以百分数表示。

4、相对比,是A 、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比=甲指标 / 乙指标(或100%)

5、动态数列常用指标:绝对增减量、发展速度、增减速度、平均发展速度、平均增减速度。

6、标化率:在进行几个总率比较时,由于内部构成不同并影响了相互比较的结论时,采用统一的标准对几个总率的内部构成进行矫正后在比较。校正后的总率称标化率或调整率。

第六节 二项分布及其应用

1、二项分布是一种离散型随机变量的分布类型。如果每个观察对象阳性结果的发生概率为π,阴性结果的发生概率为(1-π);而且每个观察对象的结果是相互对立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为而二项分布,记作B (n ,π)。

2、二项分布的概率函数P (X )=C n x πx (1-π)n-x

3、二项分布适用条件:①每次实验只有两种互斥的结果;②各次实验互相独立;③发生成功事件的概率恒定。

4、分布特征:二项分布的特征由二项分布的参数π以及观察的次数n 决定。

图形分布特征:二项分布图的高峰在μ=n π处或附近;π=0.5时,图形对称;

π≠0.5时,分布不对称,且对同一n ,π离0.5愈远,对称性愈差。对于同一π,随着n 的增大,分布趋于对称。%100?=单位总数可能发生某现象的观察数发生某现象的观察单位率%100?=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比

当n→∞时,只要π不太靠近0或1(特别是当nπ和n(1-π)均大于5时),二项分布趋于对称。

5、二项分布的均数和标准差:若X服从二项分布B(n,π),则X的总体均数为μ=nπ,总体方差为σ2=n π(1-π)

第七节泊松分布及其应用

1、Poisson分布:是一种离散型随机变量的分布类型,是二项分布的特例,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。一般记作P(λ),λ是Poisson分布的唯一参数。总体均数为λ=nπ。前提条件:互斥、独立、恒定。

2、概率函数为:P(X)=e-λ,X为观察单位内稀有事件的发生次数,e=2.71828。

3、分布特性:Poisson分布是非对称的,总体参数λ值越小,分布越偏;随着λ→∞,分布趋于对称,当λ≥20时,Poisson分布资料可按正态分布处理。

4、Poisson分布总体均数与总体方差相等,均为λ

5、Poisson分布的观察结果可加性,即对于服从Poisson分布的m歌互相独立的随机变量X1、X2…Xm,它们的和也服从Poisson分布,其均数为这个m随机变量的均数之和。

6、三种常用分布之间的关系:

①二项分布与Poisson分布的关系:当n很大,发生概率π(或1-π)很小,二项分布B(n,π)近似于Poisson 分布P(nπ);

②二项分布与正态分布的关系:当n较大,π不接近0或1(特别是当nπ和n(1-π)均大于5时),二项分布B(n,π)近似于正态分布N(nπ,nπ(1-π));

③Poisson分布与正态分布的关系:当λ≥20时,Poisson分布渐进正态分布N(λ,λ)。

7、二项分布与Poisson分布的区别:

⑴相同点:都是离散型随机变量的常见分布;

⑵区别:a、取值不同。服从二项分布的随机变量有n+1个不同的取值;Poisson分布的随机变量的可能去只有无限多个,即非负整数0,1,2……;b、随机变量的概率不同:二项分布P(X=k)= ,Poisson分布P(X=k)=e-λ;

c、描述的随机变量不同。二项分布描述的是一次试验只会出现两种对立的结果之一,n次独立重复试验中某种结果出现次数的概率分布。Poisson分布描述的是在单位时间、面积、空间等范围中某种事件发生数的概率分布。第八节卡方检验

1、检验用途:常用于分类变量资料的统计推断,主要用途包括:①单样本分布的拟合优度;②比较两个或多个独立样本频率分布;③比较配对设计两样本频率和两频率分布;④推断两个变量或特征之间有无关联性。分为四格表卡方检验、行*列表卡方检验、配对资料卡方检验。

2、四格表资料的卡方检验:公式:

3、四格表次来哦在下列情况①四格表资料中有任何一个格子的理论数T<1或n<40;②四格表卡方检验,所得P值十分临近检验水准时,可以直接计算其概率做出判断。

4、行*列表卡方检验要求:理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或不宜有一个理论频数小于1,否则可能会产生偏性。如果不满足此要求,处理方法有:①增加样本含量(首选);②结合专业知识考虑是否可以将该格所在行或列与别的行和列合并,要根据样本特性来确定,但会损失信息;③改用R×C 表Fisher精确概率法,可以用计算机软件实现。

5、配对设计资料的X2检验:

公式:

第九节非参数统计

1、非参数统计使用:a、资料不服从正态分布或分布未知b、只能以严重程度、优劣等级、效果大小、名词先后来综合判断的有序分类资料。

2、秩和检验目的:是推断连续型变量资料或有序变量资料的两个独立样本代表的两个总体分布是否有差别。

3、方法要点:①将两组数据由小到大同一编秩,以样本列数小者为n1,其秩和为T,查T界值表确定P值;②正态近似法:当n1>10或n2- n1>10时,T分布接近均数为n1(N+1)/2,方差为n1 n2(N+1)/2的正态分布,可用Z检验。

4、注意事项:①编秩中若有相同的数据在同一组则依次编秩;若相同数值在不同组内,求平均秩次;②当相持出现较多时(超过25%),需使用校正公式。

5、基本思想:假设含量为n1与n2的两个样本(且n1≤n2),来自同一总体或分布相同的两个总体,则n1样本的秩和T1与其理论秩和n1(N+1)/2相差不大,即[T- n1(N+1)/2]仅为抽样误差所致。当二者相差悬殊,超

出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。

第十节直线相关与回归

1、直线相关又称简单相关,用于双变量正态分布资料,它是从数量上研究两随机变量间相互关系密切程度的一种统计方法。

2、相关系数是线性相关条件下用来说明两个变量间相关关系的密切程度和方向的一个统计指标。

R=

3、直线回归又称简单回归,它是描述与分析两变量间线性依存关系的一种统计方法。

4、直线回归方程:F=a+bX

5、回归系数假设检验:F=

6、回归剩余标准差:S y,x=

7、回归系数标准误:S b=

8、不要把相关关系都说成是因果关系。(伴随关系)

9、不要把相关的显著性程度误解为密切程度。

10、线性回归模型的适用条件:①线性:因变量Y与自变量X称线性关系;②独立:每个个体观察值之间互相独立;③正态性:任意给定X值,对应的随机变量Y都服从正态分布;④等方差性:在一定范围内不同的X值所对应的随机变量Y的方差相等。简记为LINE。

11、线性回归的应用:①用于计算总体条件均数的置信区间以及总体回归线的置信带;②用于计算个体Y预测值及其预测区间。线性回归常用于统计预测和统计推断。

12、线性回归与线性相关的区别与联系:

⑴区别:

①单位:相关系数r没有单位,回归系数b有单位;所以,相关系数与单位无关,回归系数与单位有关;

②应用目的:说明两变量间的关联性用相关分析,说明两者依存变化的数量关系则用回归分析;

③对资料的要求不同:线性回归要求应变量Y是服从正态分布的随机变量;线性相关要求两个变量X和Y为服从双变量正态分布的随机变量。

④取值范围:-∞

⑵联系:

①方向一致: r与b的正负号一致;②假设检验等价: tr=tb;③;④用回归解释相关决定系数(coefficient of determination):,回归平方和越接近总平方和,则r2越接近1,相关性越好。

第十二节调查设计

1、调查设计是对调查研究所作的周密计划,包括资料收集、整理和分析全过程的设想和安排。

2、调查设计包括内容:确定调查目的和指标、确定调查对象和观察单位、确定调查方法、确定资料收集方式、拟定调查项目和调查表、估计样本含量。

3、组织计划:调查员的挑选和调查员的培训。

4、整理计划步骤:问卷接受、问卷核查、数据编码、数据录入、拟定整理表、归纳汇总等。

5、常用的调查方法有:直接观察法、采访法、报告法等。

6、各种抽样方法的抽样误差一般是:整群抽样≥单纯抽样≥系统抽样≥分层抽样。

第十三节实验设计

1、根据研究者是否人为地设置处理因素,即是否给予干预措施,可将医学研究分为调查研究和实验研究两类。

①调查研究:又称观察性研究或非实验性研究,确切的说应是非随机化对比研究。它对研究对象不施加任何干预措施,是在完全“自然状态”下对研究对象的特征进行观察、记录,并对观察结果进行描述和对比研究。②实验研究:又称干预性研究,是对研究对象人为给予干预措施的研究。

2、实验设计的基本要素:受试对象、实验因素、实验效应。①受试对象:是处理因素作用的客体,根据受试对象不同,实验可以分为三类:动物实验、临床试验、现场试验。②实验因素:是研究者根据研究目的而施加的特定的实验措施,又称为受试因素。③实验效应:是处理因素作用下,受试对象的反应或结局,它通过观察指标来体现。

3、选择观察指标时,应当注意:a客观性:客观指标具有较好的真实性和可靠性;b精确性:包括准确度和精密度两层含义。准确度指观察值与真值的接近程度,主要受系统误差的影响。精密度指相同条件下对同一对象的同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。c灵敏性和特异性:指标的灵

敏度反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应更好地显示出来;指标的特异度反映其鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。

4、实验设计的基本原则:对照、随机化和重复。

⑴对照的形式:①安慰剂对照:目的:在于克服研究者、受试对象等由心理因素导致的偏倚。②空白对照:即对照组不接受任何处理,在动物实验和实验方法研究中最常见,常用于评价测量方法的准确度,评价实验是否处于正常状态等。③实验对照;④标准对照:用现有标准方法或常规方法作为对照;⑤自身对照:对照与实验在同一受试对象身上进行。

⑵a随机化体现在三方面:①随机抽样:总体中每一个体都有相同机会被抽到样本中来;②随机分配:每个受试对象被分配到各组的机会相等,保证大量难以控制的非处理因素在对比组间尽可能均衡,以提高组间的可比性;

③实验顺序随机:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。b在实验设计中常通过随机数来实现随机化。获得随机数的常用方法有:随机数字表和计算机的伪随机数发生器。随机数字表常用于抽样研究及随机分组。c常用的两种随机化分组的方法:完全随机化和分层随机化(配对随机化和区组随机化可看成是分层随机化的实际应用)。

⑶重复包括三种情形:①整个实验的重复;②用多个受试对象进行重复;③同一受试对象的重复观察。重复的主要作用:①估计变异的大小;②降低变异大小。

5、常用的实验设计方案:

⑴完全随机设:又称简单随机设计,是最为常见的一种考察单因素两水平或多水平效应的实验设计的方法,它是采用完全随机分组的方法将同质的受试对象分配到各处理组,观察其实验效应。

⑵配对设计:是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同的处理组。据以配对的因素应为可能影响实验结果的主要混杂因素。配对设计主要有以下情形:①将两个条件相同或相近的受试对象配成对子,通过随机化,使对子内个体分别接受两种不同的处理;②同一受试对象的两个部分配成对子,分别速记地接受两种不同的处理;③自身前后配对,即同一受试对象,接受某种处理之前和接受该处理后视为配对。

⑶配伍组设计:实际上是配对设计的扩展。通常是将受试对象按性质相同或相近分为b个区组(或称单位组、配伍组),再将每个区组中的k个受试对象随机分配到k个处理组。设计应遵循“区组间差别越大越好,区组内差别越小越好”的原则。

6、样本含量的估算:

⑴确定样本含量的原则:在保证研究结论有一定可靠性的前提下,估算最少需要多少受试对象。

⑵假设检验所需样本含量取决于四个要素:

①第一类错误概率α的大小:α越小,所需样本量越大;②第二类错误概率β或检验功效(1-β)的大小:

第二类错误的概率越小,检验功效越大,所需样本含量越多;③容许误差δ:即两总体参数的的差值,δ越大,所需样本含量越小;④总体标准差σ和总体概率π:σ越大,所需样本含量越多;总体概率π越接近50%,变异性越大,所需样本含量越多。

第十四节居民健康统计

1、反映生育水平的指标包括:粗出生率、总生育率、年龄组生育率。a、粗出生率是指某地某年平均每千人口中的出生数,说明一个地区人口的生育水平。b、总生育率是指某地平均每千名育龄妇女(15-49岁妇女)的活产总数。c、是按年龄别计算的育龄妇女生育率,它消除了年龄构成对生育水平的影响,可了解计划生育控制的重点人群,但不能反映某一时空范围的总生育率情况。

2、人口死亡统计指标:粗死亡率、年龄别死亡率、标准化死亡率、婴儿死亡率、新生儿死亡率。a、粗死亡率:某地某年死亡总人数/同年平均人口数×K 反映一个地区居民死亡水平,但受当地人口、年龄、性别构成影响,须标化后才能进行比较b、年龄别死亡率:某年某年龄组死亡人数/同年同年龄组平均人口数×K 可与他地相应年龄别死亡率直接比较,但也受性别构成影响。一般以5岁为一组距,不满一岁者归0~组,1~4组又为一组,以此为据推算寿命表c、标准化死亡率:消除了年龄结构对死亡水平的影响,可用于比较年龄结构不同的人群整体死亡水平d、婴儿死亡率:某年平均每千名活产数中不满周岁婴儿的死亡数。e、新生儿死亡数:是某年平均每千名活产数中未满28天新生儿的死亡数。

3、寿命表是描述特定人群生命过程的一种统计表,分为定群寿命表和现实寿命表。用于评价人群健康状况和社会卫生水平;用于评价某种(类)疾病对于居民寿命的影响。

4、发病率是指在一定时期内,在可能发生某病的一定人群中新发某病的频率指标。

5、患病率也称现患率,指某时点上受检人群中患某种疾病的人数,通常用于描述病程较长或发病时间不宜明确的疾病的患病情况。

6、某病死亡率又称疾病别死亡率,指某年每10万人中因某病死亡的人数。

7、生存率:指病人能活到某一时点的概率。(直接法和寿命表法)

8、n年生存率=活满n年的合计病人数/随访满n年的累计病人数*100%

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学

第一单元概述 1. 研究设计应包括那几方面内容?答:包括:专业设计和统计设计。专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据 收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1. 描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?答:集中趋势的指 标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2. 变异系数和标准差有何区别和联系? 答:区别: 1.计算公式不同:CV=S/X*100% ,标准差是方差的平方根。 2.单位不同:变异系数无量纲,标准差量纲和原指标一致。 3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分 布的资料,并且由公式所知,在均数一定时,CV 与s 呈正比。 3. 频数表的用途有哪些? 答: 1.描述资料的频数分布的特征; 2.便于发现一些特大或特小的可疑值; 3.将频数表作为 陈述资料的形式,便于进一步的统计分析和处理; 4.当样本量足够大时,可以以频数表作为 概率的估计值。 4. 用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。 3.正确计算频数指 标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1. 正态分布和标准正态分布的联系和区别?答:联系:均为连续型随机变量分布。区别:标准正态 分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4. 简述二项的应用条件? 答:条件为: 1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变; 3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5. 简述Q-Q 图法的基本原理? 答:U-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,U-变换的逆变 换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q 图法实际上就是首先求的小于某个x 的积累频率,再通过该积累频率求得相应的u 值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u —变换直线),否则(u, x)不会近似在一条直线上。Q —Q图法正是根据(u, x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1. 均数的标准差和标准误的区别和联系?答:区别和联系:标准差是描述个体值变异程度的指标, 为方差的算术平方根,该变异不能 通过统计方法来控制;而标准误则是指样本统计量的标准差,均数的标准误实质上是样本均

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

武大医学统计学期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

预防医学及医学统计学总结

绪论 一?预防医学:是医学的一门应用学科,它以个体和确定的群体为对象,目的是保护、促进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1?工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3?采取的对策 更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质 环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2?第二级预防:在 疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发 展和恶化。3?第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 一?流行病学]:是研究人群中疾病与健康状况的分布及其影响因素,并研究防治疾病及促进健康的策略和措施的科学。流行病学定义内涵:1.流行病学的研究对象时人群。2?流行病学关注的事件包括疾病与健康 状况。3?流行病学主要研究内容是:(1)揭示现象(2)找出原因(3)评价效果。4?流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1?分布论。2.病因论。3?健康-疾病连续带。4预防控制理论(三级预防理论)5?数理模型。6?流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2?探讨疾病的病因。3?研究疾病自然史,提高临床诊断、治疗水平和预后评估。4?疾病的预防控制及其效果评价。5?流行病学分支。 第二章疾病分布 一.疾病的分布即疾病的群体现象或称疾病的三间分布,是指疾病在时间、空间和人间的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间内(一般为1年)特定群中某病新病例 出现的频率。 2?罹患率|:与发病率一样,也是测量人群新病例发生频率的指标。使用与小范围、短时间内疾病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 3患病率|:也称现患率,指某特定时间内,总人口中现患某病者(包括新、旧病例)所占的比例。患病率=发病率*病程。 4续发率I:也称二代发病率,指某传染病易感接触者中,在最短潜伏期与最长潜伏期之间发病的人数占所有易感接触者总数的百分率。 5?死亡率:指在一定时间期间(通常为1年)内,某人群中死于某病(或死于所有原因)的 频率。死亡率是测量入群死亡危险最常用的指标。 6?病死率:表示一定时期内,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1?地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2?时间分布 3?人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组中 发病率均高,并随年龄增长而上升。(2)在其他地区居住的相似的人群组中,该病的发病率 均低,甚至不发病(3)外来的健康人,到达当地一定时间后发病,其发病率逐渐与当地具名接近(4)迁出该地区的

相关主题