搜档网
当前位置:搜档网 › 医学统计知识点整理

医学统计知识点整理

医学统计知识点整理
医学统计知识点整理

医学统计学知识点整理

第一节统计学中基本概念

一、同质与变异

同质:统计研究中,给观察单位规定一些相同的因素情况。

如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。

变异:同质的基础上个体间的差异。

“同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的

二、总体与样本

1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。

2、样本:是从总体中随机抽取的部分观察单位变量值的集合。

三、参数与统计量

总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验

四、误差:实测值与真值之差★

1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。

2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。

3.非系统误差:过失误差,可以避免或清除。

五、概率

是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。

统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。

第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。

一、数值变量资料

又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值

大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。

二、无序分类变量资料

又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。

分类:二分类:+ -;有效,无效;多分类:ABO血型系统

特点:没有度量衡单位,多为间断性资料

【例题单选】某地A、B、O、AB血型人数分布的数据资料是( )

A.定量资料

B.计量资料

C.计数资料

D.等级资料

【答案】C

【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。

【例题单选】测量正常人的脉搏数所得的变量是()

A.二分类变量

B.多分类变量

C.定量变量

D.定性变量

【答案】C

【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。

三、有序分类变量资料

半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。

特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同

举例:- + ++ +++

第三节统计工作的基本步骤★

1.统计设计

2.收集资料

3.整理资料

4.分析资料:

统计描述:是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。统计推断:是使用样本信息来推断总体特征。统计推断包括区间估计和假设检验。

第四节统计表与统计图★

一、统计表

统计表的基本结构与要求

标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆放,左侧加表的序号。

标目:横标目和纵标目。

线条:通常采用三线表和四线表的形式。没有竖线或斜线。

数字:表内数字一律用阿拉伯数字。同一指标,小数位数应一致,位次对齐。无数字用“—”表示。暂缺用“…”表示。“0”为确切值。

备注:位于表的下面,通常是对表内数字的注解和说明,必要时可以用“*”等标出。一张统计表的备注不宜太多。

二、制表原则

重点突出,一个表一个中心内容

主谓分明,层次清楚

简单明了,一切文字数字线条尽量从简

【例题单选】统计表内不列的项是( ) (2010.7)

A.标目

B.线条

C.数字

D.备注

【答案】D

【解析】统计表内备注位于表的下面,不列在统计表内,所以本题选择D。

三、统计图

1.(1)标题(2)标目(3)刻度(4)图例:不同颜色或者不同线条表示,需要说明。

2.常用统计图的适用条件与要求

(1)条图:适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标。

(2)圆图和百分比条图:构成比的比较

(3)线图:描述某统计量随另一连续性数值变量变化而变化的趋势。

(4)直方图:数值变量的频数分布。

(5)散点图:用点的密集程度和趋势描述2个变量间的数量关系

(6)箱式图:多组数据分布的比较

(7)统计地图:用不同的颜色和花纹表示统计量的在地理分布上的变化,适宜描述研究指标的地理分布。

【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_________图。

【答案】线图

数值变量资料的统计分析

第一节数值变量资料的统计描述

一、频数分布表★

1.编制步骤

(1)计算全距(2)确定组距(3)划分组段(3)统计频数(4)确定频率与累计频率2.频数分布表的主要用途:

(1)揭示资料的分布类型(2)观察资料的集中趋势和离散趋势(3)便于发现某些特大或特小离群值(4)便于进一步计算统计指标和作统计处理

二、集中趋势指标★

数值变量资料的集中趋势指标是用平均数来描述的,代表一组同质变量值的平均水平。常用的有算术均数、几何均数和中位数。

1.算数均数适用于对称分布(正态分布)或者近似对称分布的资料。习惯上以μ表示总体均数,以表示样本均数。

2.几何均数数值变量呈倍数关系或者呈对数正态分布,如抗体效价及抗体滴度,某些传染病的潜伏期、细菌计数等,宜用几何均数(G)。几何均数常用于等比资料或对数正态分布资料。

3.中位数是指将一组变量值从小到大排列,位次居中的观察值就是中位数。适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。

4.百分位数是一种位置指标,以P x表示,把一组数据从小到大排列后,理论上有x%的变量比P x小,有(100-x)% 的变量值比P x大。

【例题单选】描述正态分布资料集中趋势的指标是()

A.中位数

B.几何均数

C.算术平均数

D.标准差

【答案】C

【解析】算数均数适用于对称分布或者近似对称分布的资料。几何均数常用于等比资料或对数正态分布资料。中位数适用条件:变量值中出现个别特别大或特别小的数值;偏态分布资料;数值一端或两端无确定数值;资料类型不明。标准差描述数据的离散趋势指标。所以本题选择C。

三、离散趋势指标★ 1.极差和四分位数间距

极差:简记为R ,亦称全距,即一组变量值中最大值与最小值之差,反应变量值的离散范围。 四分位数间距Q :一般和中位数一起描述偏态分布资料的分布离散趋势。 3.

方差和标准差:

均离散情况。标准差是方差的正平方根。 用途:

(1)用于表示正态或近似正态分布资料的离散度; (2)反映均数的代表性

标准差越小,数据离散程度越小,均数的代表性越好。 (3)确定医学参考值范围 95%医学参考值范围

3.变异系数(CV )适用条件:①观察指标单位不同,如身高、体重 ②同单位资料,但均数相差悬殊

四、正态分布与参考值范围的制定★ (一)正态分布

1.概念:也称高斯分布,是医学和生物学最常见、最重要的一种连续性分布。

2.特征:(1)在直角坐标的横轴上方呈钟型曲线,两端与X 轴永不相交,且以X=μ为对称轴左右完全对称(2)在x=μ处,f(X)取最大值 (3)正态分布有两个参数,即均数μ和标准差σ。均数μ描述了正态分布的集中趋势位置,若固定σ,改变μ值,曲线沿着X 轴平行移动,其形状不变,故μ称为位置参数。标准差σ描述了正态分布的离散程度,若固定μ,σ越小,曲线越陡峭;反之,σ越大,曲线越平坦.故σ称为形状参数或离散度参数。(4)正态曲线下的面积分布有一定的规律。 4.正态曲线下面积的分布规律

s

x 96.1±

(二)医学参考值范围的制定

医学参考值:是指绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。

第二节 数值变量资料的统计推断★ 一、

均数的抽样误差与标准误

抽样误差:由于个体变异和抽样造成的样本统计量与总体参数和样本统计量之间的差异。 均数的抽样误差:由于抽样造成的样本均数与总体均数和样本均数间的差异。 标准误:样本均数的标准差,用

来表示。

n

x

σ

σ

=

(σ未知)

二、t 分布

n S

S x =

1

,-=-=-=

n v S x n

S x t x μ

μ

t分布曲线以0为中心,t分布为一簇单峰分布曲线,υ不同,曲线形状不同

t分布与υ有关,υ越小,t值越分散,t分布的峰部越低,而两侧尾部翘得越高

t界值表中一侧尾部面积称单侧概率(α) 两侧尾部面积之和称双侧概率(α/2)

如:t0.05/2,9=2.262 , t0.05,9=1.833在相同自由度时,〡t〡值增大,α减小

在相同α时,单尾α对应的t值比双尾α的小

三、总体均数的区间估计

统计描述

统计分析参数估计---用样本指标估计总体指标

统计推断

假设检验

总体均数置信区间(可信区间)的计算

区间估计:是按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。

(一)小样本或σ 未知----按t 分布

(二)1.已知σ ----- u分布

2.σ 未知,但大样本(n>60 )----按u 分布

四、假设检验的意义和基本步骤★

假设检验:先对总体的参数或分布做出某种假设,再用适当的统计方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。

基本步骤:

1、建立检验假设,确定检验水准

(1)H0:(无效假设)μ=μ0

(2)H1:(备择假设)μ≠μ0 ,μ>μ0 或μ<μ0

(3)确定检验水准α=0.05

2.选定检验方法,计算检验统计量

3.确定P值,作出推断结论

第三节均数的t检验与u检验★

相关主题