搜档网
当前位置:搜档网 › 医学统计学重点 概述

医学统计学重点 概述

医学统计学重点 概述
医学统计学重点 概述

---------------------------------------------------------------最新资料推荐------------------------------------------------------

医学统计学重点概述

1一、名词解释 1.总体:

就是根据研究目的确定的同质观察单位的全体,确切的说,是同质的所有观察单位某种变量值的集合 2.样本:

就是从总体中随机抽取部分观察单位,其实测值的集合 3.系统误差:

是指数据搜集和测量过程中由于仪器不准确、标准不规范等人为原因,造成观察结果偏大或偏小的一种误差,是由确定原因造成的误差。

4.随机误差:

是由一些非人为的偶然因素,使得结果或大或小,是不确定、不可预知的一种误差,分为随机测量误差和抽样误差 5.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差 6.定量资料:

亦称计量资料,是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa)等 7.定性资料:

亦称计数资料或分类资料,是将观察单位按某种属性或类别分组,清点各组的观察单位的个数,所得的资料称定性资料 8.等级资料:

亦称有序分类资料,是将观察单位按属性的等级分组,清点各

1 / 18

组的观察单位数,所得的资料为等级资料 9.小概率事件(原理):统计学上一般把 P0.05 或 P0.01 的事件称为小概率事件;小概率事件在一次试验中几乎不可能发生,利用该原理可对科研资料进行假设检验 10.率:

是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度 11.构成比:说明某一事物内部各组成部分所占的比重或分布,等于某一组成部分的观察单位数/同一事物各组成部分的观察单位总数100% 12.医学参考值范围:

指医学领域中特定的正常人群(即排除了对所研究指标有影响的疾病和相关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据的大多数个体(一般为 95%)的取值范围 13.置信区间:

是对这个样本的某个总体参数的区间估计,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,给出的是被测量参数的测量值的可信程度 14.标准误:

是反映均数抽样误差大小的指标, 15.P 值:

指 H0成立,从所规定的总体中随机抽样,所获得等于及大于(或等于及小于)现有样本计算获得的检验统计量值的概率 16.第Ⅰ 类错误:

拒绝了实际上是成立的 H0,用来控制以真作假(漏诊) 17.第Ⅱ 类错误:

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 不拒绝实际上是不成立的 H0,用来控制论假成真(误诊) 18.配对设计:

配对设计是将受试对象按配对条件配成对子,每对中的个体接受不同的处理,配对设计一般以主要的非实验因素作为配比条件,而不以实验因素作为配比条件 19.完全随机设计:

又称单因素方差分析,是将受试对象随机分配到不同处理组的单因素设计方法;此设计只考虑一个处理因素,通过该处理因素不同水平组均值的比较,推断该处理因素水平组之间的差异有无统计学意义 20.随机区组设计:

又称双因素方差分析,该设计可以分析两个因素:

一个为处理因素,也称为列因素;一个为区组因素,也称为行因素 nX= 221.析因设计:

当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。

该设计不仅可以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析方法 22.卡方值:通过计算实际频数与理论频数的吻合程度来判断所给的处理因素是否有效 23.非参数统计:

不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法,原来的数据并不参加运算,而是变成符号、顺序号,然后比较符号、顺序号的位置 24.相关系数:

3 / 18

是说明两变量间线性关系的密切程度和相关方向的一个统计指标,样本的相关系数用 r 表示,总体的相关系数用表示 25.回归系数:

在回归方程中表示自变量 x 对因变量 y 影响大小的参数,正回归系数表示 y 随 x 增大而增大,负回归系数表示 y 随 x 增大而减小二、简答题 1.简述频数表的绘制方法(1)找出最大值、最小值和极差:

极差=最大值最小值(2)确定组距、组段、组数:

频数表一般设 8-15 个组段,常用极差的 1/10 取整作组距,第一组段包括最小值,最后一个组段要包括最大值并写出其下限上限(3)列表划记:

把确定的组段序列制成表的形式,得出各组段频数 2.简述应用相对数的注意事项(1)计算相对数时分母一般不宜过小,只有当观察单位足够多时,计算出的相对数才比较稳定,且能正确反映实际情况。

(2)分析时注意构成比和率的区别:

构成比说明事物内部各组成部分所占的比重,即只能说明分布,不能说明某现象发生的频率或强度。

(3)合计率的计算:

对观察单位不等的几个率,不能直接相加求其平均率,而应用合计的数据来计算。

(4)比较相对数时应注意资料的可比性:

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 除了研究因素以外,其他影响因素应尽可能相近或相同比较才有意义。

(5)对样本率、构成比的比较应作假设检验,不能凭表面数值大小下结论。

3.简述假设检验应用的注意事项(1)假设检验的前体是要有严密的抽样研究设计:

应尽量从同质总体中随机抽取,尽量保证组间均衡性,以确保资料具有可比性。

(2)正确选定假设检验方法:

资料性质、分布类型、设计类型、样本大小等不同,以及分析的目的不同,适用的假设检验的方法也不同。

(3)正确理解差异无统计学意义:

H0成立可能性是小概率,也就是说两者差异存在的可能性较大,差异统计学意义也不一定具有临床意义。

(4)结论不能绝对化:

是否拒绝 H0取决于研究对象有无本质差异和抽样误差大小,以及检验水准的高低,而检验水准与实验设计密切相关。

(5)报告结论时应注意:

应列出样本计算的检验统计量值,注明采用的是单侧检验还是双侧检验,写出 P 值。

4.简述秩和检验的优缺点及应用(1)优点:

5 / 18

计算简单便于掌握、应用范围广、收集资料方便(2)缺点:损失信息、检验效率低(3)应用:

①分布型未知,②能以严重程度、优劣等级、效果大小和名次先后 3等等级资料,③分布极度偏态,④本组内个别变量值偏离过大,远离本组其它变量值,⑤方差不齐时,⑥筛选或只需获得初步结果。

5.简述应用线性相关分析的注意事项(1)绘散点图了解线性趋势,样本的相关系数接近零时并不意味着两变量间一定无相关性(2)线性相关分析要求两个变量都是随机变量,且仅适用于二元正态分布资料(3)作相关分析时,应该剔除离群值,出现异常点时慎用相关(4)相关要有实际意义,两变量相关并不代表两变量间一定存在内在联系(5) r=0 表明无相关或非线性相关(6)分层资料盲目合并易出假象

6.简述应用线性回归的注意事项(1)进行线性回归分析时,应先绘散点图,提示有直线趋势存在时,可作线性回归分析(2)进行线性回归分析时,一般要求因变量 Y 是来自正态总体的随机变量,自变量 X 可以是正态随机变量,也可以是精确测量和严密控制的值(3)进行线性回归分析要有实际意义,不能把毫无关联的两个事物或现象进行进行线性回归分析(4)进行线性回归分析必须进行假设检验,以推断两变量间的线性关系是否存在(5)回归直线不能外延,以自变量取值范围为限

7.简述线性回归与相关的区别及联系(1)区别:

①资料不同:

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 相关分析要求两个变量均为随机变量,并服从双变量正态分布;回归分析只要求因变量 Y 服从正态分布,而自变量 X 可以是正态随机变量,也可以是精确测量和严密控制的值。

②统计意义不同:

相关反映两变量之间的相互关系,这种关系是对等的;回归则反映两变量间的依存关系,有自变量因变量之分,因变量随自变量的变化而变化。

③分析目的的不同:

相关分析表明两变量间线性关系的密切程度及相关方向;回归分析则用函数公式定量表达因变量随自变量变化的关系。

(2)联系:

①变量间关系的方向一致:

对同一资料其相关系数 r 与回归系数 b的正负号一致。

②假设检验等价:

实际分析中常以 r 的假设检验代替对 b 的检验③r 与 b 值可相互换算。

④用回归解释相关:

r2称决定系数, r2越接近 1,回归效果越好。

三、填空题 1.统计学的研究对象是变异 2.医学统计学工作的基本步骤是设计、搜集资料、整理资料、分析资料,其中最重要的步骤是科研设计 3.等比资料的集中趋势常用的描述方法是几何均

7 / 18

数 4.偏态分布的集中趋势常用的描述方法是中位数;偏态分布的离散趋势常用的描述方法是四分位间距 5.单位不同或均数相差较大的多组资料常用的描述方法是变异系数 6.参数是指总体的统计指标;统计量是指样本的统计指标 7.标准正态分布是一种特殊的正态分布,标准正态分布的 =0, 2=1 ,通常用u(或 Z)表示服从标准正态分布的变量,记为~N(0, 12) 48.正态分布函数中代表总体均数(位置参数),代表总体标准差(变异度参数) 9.正态分布曲线区间面积为 95%的范围是( -1.96 , +1.96 ) 10.正态分布数据的参数估计X1.96S;偏态分布数据的参数估计(P25,P75) 11.二项分布近似正态分布的条件是 n 和 n(1- )均大于 5 12.Poisson 分布近似正态分布的条件是 20 13.Poisson 分布的两个特性是均数与方差相等,观察结果有可加性 14.t 分布自由度越小, t 分布曲线越低平,尾部越高; Z 分布与自由度无关 15.医学参考值范围通常表达为X1.96S;置信区间围通常表达为X1.96SX;其中范围较宽的是医学参考值范围 16.假设检验的基本原理是反证法思想和小概率事件 17.t 检验的应用条件有样本例数 n 较小、样本均是随机样本、符合正态分布、方差齐(两样本) 18.t 检验 P <0.05 拒绝 H0有统计学意义;正态性检验 P<0.05 为非正态分布,通常运用秩和检验 19.做单侧检验时如果运用了双侧检验可以导致第Ⅱ 类错误增大;可以同时减小第Ⅰ 类错误和第Ⅱ 类错误的方法是增加样本含量 20.方差分析应用条件有两观察值互相独立、服从正态分布、方差齐性 21.完全随机设计组间变异包含治疗方案+

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 随机误差;组内变异包括随机误差; SS总=SS 组间+SS 组内;总= 组间+ 组内 22.随机区组设计的两因素方差分析中,总变异 SS 总通常可以分为 SS 处理、 SS 区组和 SS 误差,它们的关系是 SS 总=SS 处理+SS 区组+SS 误差 23.行列表2检验,要求不能有理论数(T)小于 1,且 1T<5 的格子数不超过总格子数的 1/5 24.四格表的自由度等于 1;四格表的周边合计数不变时,如果某格子的实际频数有变化,则其理论频数不变 25.统计表的结构包括标题、标目、线条、数字、备注 26. 表示相互独立的各指标的大小用直条图;表示全体中各部分的比重用百分直条图或圆形图;表示连续性资料的发展变化或一事物随另一事物变迁的情况用线图;比较事物发展速度用半对数图;表示连续性资料的频数分布用直方图;表示两事物的相关关系用散点图;表示某现象的数量在地域上的分布用统计地图。

27.某地调查的 863 例恶性肿瘤死者,分别由省、市、县、乡医院最后确诊。

现欲说明各级医院确诊比例,宜绘制圆图/构成图(统计图) 28.非参数检验的优点:

计算简单便于掌握、应用范围广、收集资料方便;缺点:

损失信息、检验效率低 29.线性相关分析的步骤:

绘制散点图观察两变量的线性趋势计算相关系数相关系数的假设检验 30.回归分析的步骤:

9 / 18

绘制散点图求回归方程回归系数的假设检验线性回归方程图 31.实验设计的基本原则:

对照原则、随机化原则、重复原则、盲法原则 32.实验设计的基本要素:

处理因素、受试对象、实验效应 33.线性相关系数的取值范围: -1r1; r 假设检验方法:

r 界值表法、 t 检验法 534.回归系数的估计原则:最小二乘法原则四、计算与分析 1.表 1 数据如下,卡方检验如下。

问:

应该选择哪种方法及哪组数值?新旧防护服是否对皮肤病患病率有影响?表 1 穿新旧两种防护服工人的皮肤病患病率比较皮肤病炎症防护服种类患病率(%) 阳性例数(理论频数) 阴性例数(理论频数)新旧 1(3.8) 10(7.2) 14(11.2) 18(20.8) 6.7 35.7 表 2 卡方检验(SPSS)结果 df 渐进 Sig. (双侧) 精确 Sig.(双侧)值精确 Sig.(单侧) .038 Pearson 卡方连续校正 b 似然比Fisher 的精确检验线性和线性组合有效案例中的 N (1)由于n40,但有 1T<5,所以选用2检验校正公式,即选择结果的第二行数据进行分析(2)假设检验:

①建立检验假设:

H0:

1=2,即新旧防护服对皮肤病患病率无影响 H1:

---------------------------------------------------------------最新资料推荐------------------------------------------------------

1,2,即新旧防护服对皮肤病患病率有影响②确定假设检验水准:

=0.05 ③计算检验统计量:

根据表 2 可得2=2.938,=1 ④确定 P 值,作出推断结论: 20.05,1=3.84,根据表 2 可得 P=0.087>0.05,按=0.05 水准,不拒绝 H0,差异无统计学意义,尚不能认为新旧防护服对皮肤病患病率有影响。

2.对 11 份工业污水测定氟离子(mg/L),每份水样同时采用电极法及分光光度法测定,结果见表 3。

三人对两种方法测定结果有无差别进行了统计分析, (1) 甲用独立样本 t 检验, t=-0.072, P=0.943; (2)乙则先对每份样品的差值做正态性检验(P0.05),然后用配对设计的符号秩和检验(Wilcoxon Signed Ranks Test),得到z=1.633, P=0.102; (3)丙用配对设计的 t 检验, t=0.441, P=0.669。

请问哪个人统计方法运用得当,并对该结果进行恰当分析表 3 两法测定的氟离子浓度结果(mg/L) 样品号电极法分光光度法4.329a 2.938 5.056 4.228 43 1 1 1 1 .037 .087 .025 .040 .065 样品号电极法分光光度法1 10.5 8.8 7 16.4 14.7 2 21.6 18.8 8 19.5 17.2 3 14.9 13.5 9 127 15.5 4 30.2 27.6 10 18.7 16.3 5 8.4 9.1 11 9.5 9.5 6 7.7 7 (1)丙的统计方法运用得当 6(2)分析:

11 / 18

该样本属于同一样本的两个部分分别接受两种不同处理,即应该采用配对样本均数的 t 检验(3)假设检验:

①建立检验假设:

H0:

d=0,即两种检测方法无差异 H1:

d0,即两种检测方法有差异②确定假设检验水准:

=0.05 ③计算检验统计量:

t=0.441,=10 ④确定 P 值,作出推断结论:

P=0.669>0.05,按 =0.05 水准,不拒绝 H0,差异无统计学意义,尚不能认为两种检测方法有差异 3.某研究者测定 51 名肿瘤患者蛋白激酶(PKC)水平以及某单核苷酸多态性(SNP)的 3 种基因型 GG、 GA、 AA(详见下表),他欲分析男、女 PKC 水平间有无差别,用什么统计分析方法?又想了解 3 种基因型 PKC 水平间有无差别,用什么统计方法分析(PKC 数据经正态性检验服从正态分布) 性别基因型 PKC 性别基因型 PKC 性别基因型 PKC 男 GA 65.8 男 AA 67.6 女 GA 70.4 男 GA 71.4 男 AA 68.4 女 GA 74 男 GA 76.6 男 AA 71.8 女 GA 75.2 男 GA 78.2 男 AA 73.5 女 GA 80.2 男 GA 79.8 男 AA 80.6 女 GA 84.5 男 GA 80.2 男 AA 60.8 女 GA 85.4 男 GA 80.4 男 GG 38.2 女 GA 89.2 男 GA 82.4 男 GG 39.2 女 AA 60.5 男 GA 82.8 男 GG 39.4 女 AA 52.6 男 GA 85.6 男 AA 45.8 女 AA 62.6 男 GA 86.8 男 GA 46.8 女 AA 60.4 男 GA 87.2 男 GG 49.6 女 AA 74.2 男 GA 88.6 男 AA 49.6 女 GG 41.2 男 AA

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 53.2 男 AA 52.4 女 GA 41.4 男 AA 58.2 男 AA 52.8 女 GA 42.6 男 AA 65.5 男 GA 67.8 女 GA 44.5 男 AA 67.4 男 AA 68.8 女 AA 52.4 (1)分析男女 PKC 水平间有无差别应该用两独立样本的 t 检验①建立检验假设:

H0:

1=2,即男女 PKC 水平间无差别 H1:

12,即男女 PKC 水平间有差别②确定假设检验水准:=0.05 ③计算检验统计量:

t=0.511,=49 ④确定 P 值,作出推断结论:

P=0.612>0.05,按 =0.05 水准,不拒绝 H0,差异无统计学意义,尚不能认为男女PKC 水平间有差别7Independent Samples Test.362.550.51 149.61 22.370594.641 1 5-6.9561 41 1 .69732.49830.058.6222.370594.75966-7.3491 51 2.09033Equal variancesassumedEqual variancesnot assumedPKCFSig.Levene’s Test forEquality of VariancestdfSig. (2-tailed)MeanDifferenceStd. ErrorDifferenceLowerUpper95% ConfidenceInterval of theDifferencet-test for Equality of Means (2)分析 3 种基因型 PKC 水平间有无差别应选用完全随机设计资料的方差分析,并进行 3 组均数间的两两比较①建立检验假设:

H0:

13 / 18

3 种基因型 PKC 水平总体均数水平相同 H1:

3 种基因型 PKC 水平总体均数水平不全相同②确定假设检验水准:

=0.05 ③计算检验统计量:

F=16.608 ④确定 P 值,作出推断结论:

P=0.000<0.05,按 =0.05 水准,拒绝 H0,差异有统计学意义,所以可以认为 3 种基因型 PKC 水平总体均数水平不全相同。

为了进一步了解三组间均值两两比较情况, SNK 检验显示 1、 2 组, 1、 3 组和 2、 3组之间均有统计学意义,可认为 3 种基因型 PKC 水平完全不相等。

Test of Homogeneity of VariancesPKC2.964248.061LeveneStatisticdf1df2Sig. ANOVAPKC491 8.35322459.1 761 6.608.00071 07.3441 2025.69748501 48.070Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig. PKCStudent-Newman-Keulsa,b541 .5201912561 .861 973.91 201 .0001 .0001 .000gene132Sig.N123Subset for alpha = .05Means for groups in homogeneous subsets are displayed.a. Uses Harmonic Mean Sample Size = 1 0.430.The group sizes are unequal. The harmonic meanof the group sizes is used. Type I error levels arenot guaranteed.b. 8 4.有 28 份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察两种白

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 喉杆菌生长情况,+ 号表示生长,- 号表示不生长,结果如下表。

问两种白喉杆菌培养基的效果有无差别?甲种++ 11(a)- 1 (c)合计 12 (1)建立检验假设 H0:

总体1=2,即两种白喉杆菌培养基的效果相同 H1:

总体1,2,即两种白喉杆菌培养基的效果不同(2)确定假设检验水准:

=0.05 (3)计算检验统计量:

本例 b=9, c=1, b+c40,(4)确定 P 值,作出推断结论: 2=4.90>20.05,1=3.84, P<0.05,按 =0.05水准,拒绝 H0,接受 H1,差异有统计学意义,可认为甲、乙两种白喉杆菌培养基的效果有差别,甲培养基培养效果优于乙培养基。

乙种合计 20 8 28 - 9 (b) 7 (d) 16 四、补充知识点 1.频数分布表的用途:

①描述资料的分布特征和分布类型,②便于进一步计算有关指标或进行统计分析,③发现特大、特小的可疑值,④据此绘制频数分布图 2. 正态分布图形的特征:

① 是正态分布的位置参数,描述正态分布的集中趋势位置。

正态分布以 x = 为对称轴,左右完全对称。

正态分布的均数、中位数、众数相同,均等于;② 描述正态分布资料数据分布的离散程度,越大,数据分布越分散,越小,数据分布越集中。

15 / 18

也称为是正态分布的形状参数,越大,曲线越扁平,反之,越小,曲线越瘦高 3. 正态分布的应用:

①估计频数分布,②制定参考值范围,③质量控制,④正态分布是许多统计方法的理论基础 4. t 分布图形的特征:

①以 0 为中心,左右对称的单峰分布,②t 分布是一簇曲线,其形态变化与 n(确切地说与自由度)大小有关。

自由度越小, t 分布曲线越低平;自由度越大, t 分布曲线越接近标准正态分布(u 分布)曲线 5. 医学参考值范围的制定6.标准误与标准差 90.419)1|19(|22=+= 9 7. 方差分析的基本思想:

就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS组间可由处理因素的作用加以解释。

通过各变异来源的均方与误差均方比值的大小,借助F分布作出统计推断判断各因素对各组均数有无影响。

8. 卡方检验公式选择①当 n40,且所有格子的 T5 时,选用卡方检验基本公式或专用公式②当 n40,但有 1T<5 时,选用卡方检验校正公式或改用四格表资料Fisher ③当 n<40,或 T<1 时,须用四格表资料 Fisher 确切概率法 9. 配对设计的符号秩和检验方法 (1)假设:

---------------------------------------------------------------最新资料推荐------------------------------------------------------ H0:

差值总体中位数 Md=0 , H1:

Md0 , =0.05 (2)求差值 (3)编秩次:依差值的绝对值从小到大编秩次。

编秩次时遇差数等于 0,舍去不计,同时样本例数减 1;遇绝对值相等差数,符号相同顺次编秩次,符号相反取平均秩次,且符号相反。

(4)求秩和并确定检验统计量:

分别求出正负秩次之和,正秩和以 T+表示,负秩和的绝对值以 T-表示。

T+及 T-之和应等于 n(n+1)/2,任取 T+(或 T-)作检验统计量T 。

(5)确定 P 值和作出推断结论:

当 n50 时,查 T 界值表,得出 P 值。

若检验统计量 T 值在上、下界值范围内,其 P 值大于表上方相应概率水平;若 T 值在上、下界值上若范围外,其 P 值小于表上方相应概率水平。

10. 配对设计的形式有:

①两种同质受试对象分别接受两种不同的处理,②同一受试对象或同一样本的两个部分分别接受两种不同的处理,③同一受试对象接受某种处理前后。

17 / 18

注意:

做 t 检验时,一定要分清是配对样本的 t 检验还是两独立样本的 t 检验;做卡方检验时,一定要注意公式的适用条件。

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学

第一单元概述 1. 研究设计应包括那几方面内容?答:包括:专业设计和统计设计。专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据 收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1. 描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?答:集中趋势的指 标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2. 变异系数和标准差有何区别和联系? 答:区别: 1.计算公式不同:CV=S/X*100% ,标准差是方差的平方根。 2.单位不同:变异系数无量纲,标准差量纲和原指标一致。 3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分 布的资料,并且由公式所知,在均数一定时,CV 与s 呈正比。 3. 频数表的用途有哪些? 答: 1.描述资料的频数分布的特征; 2.便于发现一些特大或特小的可疑值; 3.将频数表作为 陈述资料的形式,便于进一步的统计分析和处理; 4.当样本量足够大时,可以以频数表作为 概率的估计值。 4. 用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。 3.正确计算频数指 标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1. 正态分布和标准正态分布的联系和区别?答:联系:均为连续型随机变量分布。区别:标准正态 分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4. 简述二项的应用条件? 答:条件为: 1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变; 3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5. 简述Q-Q 图法的基本原理? 答:U-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,U-变换的逆变 换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q 图法实际上就是首先求的小于某个x 的积累频率,再通过该积累频率求得相应的u 值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u —变换直线),否则(u, x)不会近似在一条直线上。Q —Q图法正是根据(u, x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1. 均数的标准差和标准误的区别和联系?答:区别和联系:标准差是描述个体值变异程度的指标, 为方差的算术平方根,该变异不能 通过统计方法来控制;而标准误则是指样本统计量的标准差,均数的标准误实质上是样本均

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

医学统计学考试(详细)

医学统计学基本概念 1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。 3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo) 上的一切值。 4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。它是指变量的取值有 限的,至多是可列多个。附:无序分类:二项分类、多项分类 5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值 大小,故等级之间不可度量。 6.个体individual:即每个观察单位。 7.总体population:根据研究目的确定的同质观察单位的全体。 8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。如总体均数、总体标准差等。特点:参数是未知的,固有的,不变的! 10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。特点:统计量是已知的,变化的,有误差的! 11.概率probability:是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。 13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。 14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的。这个常数p就称为事件A出现的概 率(probability),记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出,频率为一变量,是样本统计量,而概率为常数,是一总体参数。实践中,当试验次数足够多时,可以近似地将频率作为概率的一个估计。 15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能 发生,此即为小概率原理。 16.同质(homogeneity):性质相同的事物称为同质的。 17.变异(variation):同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、 机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值(normal value)。 19.正常值范围(normal ranges),是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error):样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计:由样本信息估计总体参数称为参数估计,包括点估计和区间估计。 23.点估计(point estimation) :直接用样本统计量作为总体参数的估计值。这种估计方法简单,但未考虑抽样误差的大小。 24.区间估计(interval estimation) :按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间(confidence interval, CI),又 称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。如取α=0.05,则每100个样本所算得 的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。 26.可信区间的两个要素:第一个要素是可靠性,常用可信度1-α的大小表示;第二个要素是精确性,常用可信区间的长度CU-CL衡量。 27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内, 理论上有95个包含总体均数,而有5个不包含总体均数。 28.可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。这里的95%,指的是方法本身!而不是某个区间! 29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”, 用α来表示。 30.第二类错误(II型错误):不拒绝实际上不成立的H0,称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效:1-β称检验效能(power of a test),过去称把握度。为当两总体确有差异,按检验水准α所能发现该差异的能力。1-β只取单 尾。 32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,每个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为 单因素多个样本均数,单个因素可以有多个水平,R>2 33.随机区组设计又称配伍组设计(Random Block Design):即两因素多个样本均数的比较(或称两因素方差分析,two way analysis of variance)。 34.绝对数:在计数资料中,各组的观察数称绝对数。 35.相对数:是两个有联系的指标的比,计数资料的统计描述主要是相对数(relative number)。 36.率(rate):说明某现象发生的频率或强度,常用%、‰、1/万、1/10万等作单位,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常 以保留1-2位整数为宜。

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

医学统计学试卷

《医学统计学》考查试卷(必修) ---------------------------------------- 说明:本试卷总计100分,全试卷共4页,完成答卷时间2小时。 ---------------------------------------- 一、填空(10小题,每小题2分,共计20分。) 1、统计学分为 和 两大部分。 2、统计思想是用样本 估计(或推测)总体 ,它是通过 和 来实现的。 3、统计步骤包括 、 、 、 。 4、统计资料分为 和 ,后者又分为 、 和 。 5、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 6、假设检验的原理是 。 7、假设检验得到 ,可认为差别无统计学意义, ,可认为差别有 统计学意义, ,可认为差别有高度统计学意义。 8、直线回归反映两个变量的 ,而直线相关反映的是两个变量的 。 9、2x 检验的思想可以概述为看 和 吻合程度如何。 10、秩和检验和Ridit 分析均属 ,前者关键是 ,后者关键是 。 二、选择题(有单选和多选,10小题,每小题1分,共计10分。) 1、当均数相差很大或量刚不同时,比较多个样本资料的离散趋势指标 应选 。 (1)极差 (2)变异系数 (3)方差 (4)标准差 2、总体均数95%的可信区间为 。 (1))96.1,96.1(s x s x +- (2))58.2,58.2(s x s x +-

(3))96.1,96.1(x x s x s x +- (4))58.2,58.2(x x s x s x +- 3、四个样本均数的比较,参数假设检验为 。 (1)0H :4321x x x x === (2) 1H :4321x x x x ≠≠≠ (3)0H :4321μμμμ=== (4)1H :4321μμμμ≠≠≠ 4、两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明: 。 (1)两样本均数差别越大 (2)两总体均数差别越大 (3)越有理由认为两总体均数不同 (4)越有理由认为两样本均数不同 5、分类资料的配对设计差异性(或优势性)检验需选用 。 (1)Pearson-2x 检验 (2)CMH-2x 检验 (3)McNemar-2x 检验 (4)Fisher 的确切概率法 6、来自医院的资料可求得 。 (1)有效率 (2)无效率 (3)发病率 (4)死亡率 7、作直线相关分析,要求: 。 (1)X 和Y 变量总体均服从正态分布 (2)X 或Y 变量总体服从正态分布 (3)只要因变量Y 总体服从正态分布 (4)两变量总体服从不服从正态分布均可。 8、方差分析可用于 。 (1)两个样本均数的比较 (2)多个样本均数的比较 (3)回归系数的假设检验 (4)多个样本率的比较 9、Fisher 确切概率法可用于 。 (1)两个样本均数的比较 (3)多个样本均数的比较 (3)两个样本率的比较 (4)每组观察例数不太大的多个样本率的比较 10、等级资料(有序多分类资料),可采用的统计分析方法有 。 (1)2x 检验 (2)秩和检验 (3)Ridit 分析 (4)t 检验或F 检验 三、(本题10分)

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特 征进行测量或观察,这种特征称为变量 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

相关主题