搜档网
当前位置:搜档网 › 医学统计学名词解释

医学统计学名词解释

医学统计学名词解释
医学统计学名词解释

统计学

1、医学统计学:

就是运用统计学原理与方法研究生物医学资料的搜集、整理、分析与推断的一门学科。(医学研究的对象主要就是人体以及与人体的健康与疾病相关的各种因素)

2、同质:

性质相同的事物成为同质的,否则成为异质的或间杂的。

(观察单位间的同质性的进行研究的前提,也就是统计分析的必备条件,缺乏同质性的观察单位的不能笼统地混在一起进行分析的)

3、变异:

就是指在同质的基础上各观察单位(或个体)之间的差异。

4、总体:

总体就是根据研究目的所确定的同质观察单位的全体。

5、样本:

样本就是从总体中随机抽取的部分个体。(样本中包含的个体数称为样本含量)

6、随机:

即机会均等,就是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施。(包括抽样随机、分组随机、实验顺序随机)

7、统计量:

由样本所算出的统计指标或特征值称为统计量。(反映样本特性的有关指标)

8、参数:

总体的统计指标或特征值称为参数。

(总体参数就是事物本身固有的、不变的,为常数)

9、抽样误差:

从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。这种在抽样研究中不可避免。(抽样误差有两种表现形式:①样本统计量与总体参数间的差异②样本统计量间的差异) 10、概率:

描述事件发生可能性大小的一个度量,常用P表示,取值为0≤P≤1。

11、频率:

用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例0≤f≤1为频率。显然有 f = m / n

12、小概率事件:

当某事件发生的概率小于或等于0、05时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生。(为进行统计推断的依据)

13、定量资料:

以定量值表达每个观察单位的某项观察指标,如血脂,心率等。

14、定性资料:

以定性方式表达每个观察单位的某项观察指标,表现为互不相容的类别或属性,如血型、性别等。

15、等级资料:

以等级表达每个观察单位的某项观察指标,如疗效分级、血粘度、心功能分级等。

第二章、统计资料的整理与描述

1、中位数:

就就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。

2、百分位数:

就是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有X%的观察值比Px小,有(100-X)%观察值比Px大。

3、变异系数(CV):

也称离散系数,为标准差与均数之比,变异系数没有度量衡单位,常用于比较度量衡单位不同或均数相差悬殊的两组或多组资料的离散程度。

第三章、正态分布与二项分布

1、参考值范围(reference range):

也称正常值范围,即绝大多数正常人的某指标值范围称为该指标的正常值范围。

(这里的“绝大多数”可以就是90%、95%、99%等等,最常见的就是95%,所谓“正常人”不就是指健康人,而就是指排除了影响所研究指标的疾病与有关因素的同质人群)

第四章、统计推断基础

1、抽样误差:

由抽样引起的样本统计量与总体参数间的差别。

(原因: 个体变异+ 抽样,表现为样本统计量与总体参数间的差别、不同样本统计量间的差别)

2、中心极限定理:

从均数为μ、标准差为σ的正态总体中,独立随机抽取例数为n的样本,样本均数x的分布服从正态分布。

3、标准误(SE):

样本统计量的标准差称为标准误。

4、区间估计:

就是按照一定的概率或可信度用一个区间估计总体参数所在的范围,这个范围称作可信度为1—的可信区间(CI),又称为置信区间。

5、第一类错误:

拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误。

6、第二类错误:

不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误。

7、水准(检验水准):

常用表示,在假设检验之前设定的,说明按不超越多大的误差为条件作结论,就是犯第一类错误的最大风险。

8、假设检验中的P值:

指由H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量的概率。P值的大小表明以多大的误差拒绝H0 。P值越小,风险越小,所得结论的误差也小。

第八章、秩与检验

1、秩次:

就是指全部观察值按某种顺序排列额为序。反映等级的高低。

2、秩与:

就是同组秩次之与。(反映各组秩次的分布位置) 3、秩变换:

将等级变成秩次的方法。

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学试卷-2

《医学统计学》期末试卷(考查) 姓 名: 学 号: 班 级: ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间2小时。 ---------------------------------------- 一、判断题(本大题共10题,每题1分,共10分,对的打“√”,错的打“×”) 1、 参数(parameter )是根据总体分布的特征而计算的总体数值,如:总体均数用μ表示。( ) 2、 将一组观察值按大小顺序排列,位次居中的数值即算术均数,统计符号为X 。( ) 3、 标准差可以反映抽样误差的大小。( ) 4、 假设检验有两类错误,其中,拒绝了实际上是成立的0H ,为第一类错误。( ) 5、 两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明两总体均数差别越大。( ) 6、 方差分析后,各总体均数不等,要想分析多个试验组与对照组均数比较,需用SNK-q 检验。( ) 7、 拉丁方设计可用来进行因素间的交互作用分析。( ) 8、 正交表48(42)L ? ,表示最多可观察5个因素,其中1个因素为4水平,4个因素为2水平。( ) 9、 分类资料常用率表示某一事物内部各组成部分所占的比重或分布。( ) 10、有序分类资料不是等级资料( )。 二、填空题(本大题共10题,每题1分,共10分) 1、四分位数间距与 可用来描述偏态分布资料的分布特征。 2、当均数相差很大或单位不同时,比较多个样本资料的离散趋势指标应选 。 3、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 4、标准正态分布的均数和标准差分别为 。 5、t 曲线是以 为中心,左右对称的一簇曲线。 6、已知一个样本来自正态分布的总体,样本均数为x ,样本含量为n ,总体标准差为σ,试估计总体均数的99%可信区间: 。 7、完全随机化设计的方差分析,根据方差分析的基本思想,可将总变异分解为两部分:

医学统计学基本概念

习题-医学统计学基本概念 选择题: 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压,调查某地1000 人,记录每人是否患有高血压。最后清点结果,其中有10 名高血压患者,有990 名非高血压患者。() A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指() A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是() A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级(轻、中、重) E.疾病疗效(有效、无效) 4、总体是由() A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是() A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是() A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样,下列哪一项说法是正确的() A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是() A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是:() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

医学统计学论文

医学统计学论文 【摘要】大学生是当今社会中的新鲜血液,是新生代的力量。当代大学生的道德素质的层次会直接左右我们的身心健康水平,同时也影响到社会的前进发展。对于当代大学生道德现状的分析调查可以直接的反映出当今社会所存在的问题。大学生的道德取向则是一个社会道德的风向标。所以,提高当代大学生道德素质是当今社会刻不容缓的问题,同时对于社会主义现代化建设也有很重要的意义。本文基于调查问卷所得出的严谨数据,对学校内的大学生道德现状进行客观分析,并得出相应数据。 一、调查目的 1了解现在大学生的社会道德水平。 2关注大学生的发展,以总结现大学生存在的问题。 3分析原因,找到相关的原因。 二、调查设计 1调查对象:郑州大学继续教育学院 2调查时间:2016年9月—2016年10月 3调查方法:采用问卷调查(问卷共30题) 4问卷:发放出书面问卷200份,回收问卷179份 三、数据分析 数据经整理后,采用SPSS17.0统计软件包录入数据并运用独立样本t检验、方差分析和卡方检验进行数据分析。 四、影响因素的分析 为了能更好的来参照男女性别以及年级的不同,从而对调查问卷涉及的问题所给出的不同回答,我们做了诸多的关于性别差异,年纪差异的数据分析。其中也包括了T检验,交叉表等形式,当然,对于道德素质的选材,我们也没有一个硬性的指标来衡量乃至划分层次的高低。一方面,这给我们的调查统计造成了难以精准的障碍,另一方面,在我们的论文阐述中也不易找到相似的文献资料供以参考。尽管有这些不可避免的问题存在,我们小组还是尽量在数据统计分析出的结果中找到相关性。 1,年级差异对道德水平的影响 针对我们调查问卷主要涉及大学生群体的三个年级、大一、大二、大三,我们采用了不同的交叉表等形式来进行分析。

医学统计学01护理学(本科)期末考试试卷A卷

山东中医药大学 专业 年级(本科) 《医学统计学01》期末考试试卷(A 卷) 姓 名: 学 号: 班 级: 考试时间:2010.6 补(重)考:(是、否) 题号 一 二 三 四 五 六 七 八 总分 核分人 得分 ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间90分钟。 ---------------------------------------- 一、单项选择题(本大题共5题,每题2分,共10分) 1、某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下: 年龄(岁) 10~ 20~ 30~ 40~ 50~ 60~ 人数 6 40 50 85 20 1 为了形象表达该资料,适合选用:() A 、线图 B 条图 C 直方图 D 圆图 2、成组设计的两样本比较的秩和检验,其检验统计量是( )。 A 、 以例数较小者为 B 、以例数较大者为 C 、以秩和较小者为 D 、以秩和较大者为。 3、当组数等于 2 时,对于同一资料,方差分析与 t 检验的关系是____ 。 A .完全等价且 F=t B.方差分析结果更准确 C.t 检验结果更准确 D.完全等价且 t 2=F 4、Poisson 分布独有的特征是______。 A. 离散型分布 B. 参数是总体均数 C. 方差等于均数 D. 当样本较小时是偏倚分布 5、甲、乙两个医院某传染病各型治愈率 病 型 患者数 治愈率(%) 甲 乙 甲 乙 普通型 300 100 60.0 65.0 重 型 100 300 40.0 45.0 暴发型 100 100 20.0 25.0 合 计 500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是:() A 、重新计算,多保留几位小数 B 、对率进行标准化 C 、对各医院分别求平均 D 、增大样本含量,重新计算 得分 阅卷人 (签全名)

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学期末考试模拟题(三)

《医学统计学》期末模拟考试题(三)一.是非题(每题1分,共20分)1.评价某人的某项指标是否正常,所用的范围是。()t2.配对资料若用成组检验处理,就降低了统计效率。() 3.因为两类错误的存在,所以不能凭假设检验的结果下结论。() 4.随机区组设计的区组变异和误差两部分相当于完全随机设计方差分析的组内变异。()P5.抗体滴度资料经对数转换后可做方差分析,若方差分析得<0.05,则可认为实测数据的各总体算术均数不全相等。() 6.五个百分率的差别的假设检验,>,可认为各组总体率都不相同。() ZZZ4.在两样本均数比较的检验中,若≥,则在α=0.05水平上可认为两总体均数不等。0.05()P5.在t检验中,若拒绝H, 值越小,则说明两总体均数差别越大。()06.对三个地区 血型构成(A、B、O、AB型),作抽样调查后比较,若有一个 理论频数小于5大于1且n>40,必须作校正检验。() 7.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。() 8.Ⅱ期临床试验是指采用随机盲法对照实验,评价新药的有效性及安全性,推荐临床给药剂量。()9.临床试验中,为了避免人为主观因素的影响,保证结果的真实性,通常不让受试者及其家属知道他参与这项试验。()10.假定变量X与Y的相关系数r是0.8,P<0.05;变量M与N的相关系数r为-0.9,P<0.05,1122则X与Y的相关密切程度较高。与Y的相关系数r是0.8,P<0.05;变量M与N

的相关系11数r为-0.9,P<0.05,则X与Y的相关密切程度较 高。()2211.临床试验必须符合《赫尔辛基宣言》和国际医 学科学组织委员会颁布的《人体生物医学研究国际道德指南》 的道德原则。() 12.当直线相关系数r=0时,说明变量之 间不存在任何相关关系。=0时,说明变量之间不存在任何相 关关系。() 13.偏回归系数表示在除X以外的自变量固定 不变的条件下,X每改变一个单位的平均变ii化。以外的自变 量固定不变的条件下,X每改变一个单位的平均变化。()i 14.单盲法是让病人知道自己在实验组或对照组,但不知道用 什么处理。() 15.重复原则是指少选择样本例数。()16.越小,所需样本含量越大。() 17.在相同条件下完全 随机设计比随机区组设计更节约样本含量。() 18.配对符号 秩和检验中,有差值绝对值相等时,可不计算平均秩次。()19.非参数统计的检验效能总是低于参数检验。() nTnTT20.两样本比较的秩和检验,现=15,=153,=10,=126,则 检验统计量=126。()1122二.选择题(每题1分,共20分)1.一种新药可以控制某病,延长寿命,但不能治愈其病,如果 某地采用该药则该地。a.该病发病率将增加 b.该病 发病率将减少c.该病患病率将增加 d.该病患病率将减少e.以上都不对2.用触诊和X摄片对100名妇女作乳癌检查, 触诊有40名阳性,X摄片有70名阴性,两种方法均阳性者10 名,两种方法检查均为阴性的人数是。 a.20 b.30

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下: 表1 BCG治疗组生存情况 *死亡=1;删失=0

*死亡=1;删失=0 按上述二表将数据输入SPSS软件,其中数据编号为i,列(1)即时间为t,列(3)即生存结局为status,表1为group1,表2为group2。 选择Analyze中的Survival里的Kaplan-Meier分析,将Time,Status,Factor依次选定,option 和Compare Factor依次设定完成后,得到输出结果,结果分析如下: Survival Table中: 1为BCG治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。2为药物与BCG结合治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0:两种疗法患者生存率相同 H 1:两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验,得到上面Overall Comparisons 表,其中第一行为LogRank 检验结果。即X 2=0.057,P=0.811。按α=0.05水准,不拒绝H 0,还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。 生存曲线如上图所示,其中生存时间为横轴,生存率为纵轴。

医学统计学试卷-1

《医学统计学》考查试卷(必修) ---------------------------------------- 说明:本试卷总计100分,全试卷共4页,完成答卷时间2小时。 ---------------------------------------- 一、填空(10小题,每小题2分,共计20分。) 1、统计学分为 和 两大部分。 2、统计思想是用样本 估计(或推测)总体 ,它是通过 和 来实现的。 3、统计步骤包括 、 、 、 。 4、统计资料分为 和 ,后者又分为 、 和 。 5、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 6、假设检验的原理是 。 7、假设检验得到 ,可认为差别无统计学意义, ,可认为差别有 统计学意义, ,可认为差别有高度统计学意义。

8、直线回归反映两个变量的 ,而直线相关反映的是两个变量的 。 9、2x 检验的思想可以概述为看 和 吻合程度如何。 10、秩和检验和Ridit 分析均属 ,前者关键是 ,后者关键是 。 二、选择题(有单选和多选,10小题,每小题1分,共计10分。) 1、当均数相差很大或量刚不同时,比较多个样本资料的离散趋势指标 应选 。 (1)极差 (2)变异系数 (3)方差 (4)标准差 2、总体均数95%的可信区间为 。 (1))96.1,96.1(s x s x +- (2))58.2,58.2(s x s x +- (3))96.1,96.1(x x s x s x +- (4))58.2,58.2(x x s x s x +- 3、四个样本均数的比较,参数假设检验为 。 (1)0H :4321x x x x === (2) 1H :4321x x x x ≠≠≠ (3)0H :4321μμμμ=== (4)1H :4321μμμμ≠≠≠ 4、两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明: 。 (1)两样本均数差别越大 (2)两总体均数差别越大 (3)越有理由认为两总体均数不同 (4)越有理由认为两样本均数不同 5、分类资料的配对设计差异性(或优势性)检验需选用 。 (1)Pearson-2x 检验 (2)CMH-2x 检验

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学试题及答案完整版

医学统计学试题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

医学统计学试题及答案 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分 布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资料的 t检验时,自由度是( D ) (A)n 1+ n 2 (B)n 1+ n 2 –1 (C)n 1+ n 2 +1 (D)n 1+ n 2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

医学统计学基本概念[资料]

医学统计学基本概念 1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。 3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo) 上的一切值。 4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。它是指变量的取值有 限的,至多是可列多个。附:无序分类:二项分类、多项分类 5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值 大小,故等级之间不可度量。 6.个体individual:即每个观察单位。 7.总体population:根据研究目的确定的同质观察单位的全体。 8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。如总体均数、总体标准差等。特点:参数是未知的,固有的,不变的! 10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。特点:统计量是已知的,变化的,有误差的! 11.概率probability:是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。 13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。 14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的。这个常数p就称为事件A出现的概 率(probability),记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出,频率为一变量,是样本统计量,而概率为常数,是一总体参数。实践中,当试验次数足够多时,可以近似地将频率作为概率的一个估计。 15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能 发生,此即为小概率原理。 16.同质(homogeneity):性质相同的事物称为同质的。 17.变异(variation):同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、 机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值(normal value)。 19.正常值范围(normal ranges),是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error):样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计:由样本信息估计总体参数称为参数估计,包括点估计和区间估计。 23.点估计(point estimation) :直接用样本统计量作为总体参数的估计值。这种估计方法简单,但未考虑抽样误差的大小。 24.区间估计(interval estimation) :按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间(confidence interval, CI),又 称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。如取α=0.05,则每100个样本所算得 的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。 26.可信区间的两个要素:第一个要素是可靠性,常用可信度1-α的大小表示;第二个要素是精确性,常用可信区间的长度CU-CL衡量。 27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内, 理论上有95个包含总体均数,而有5个不包含总体均数。 28.可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。这里的95%,指的是方法本身!而不是某个区间! 29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”, 用α来表示。 30.第二类错误(II型错误):不拒绝实际上不成立的H0,称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效:1-β称检验效能(power of a test),过去称把握度。为当两总体确有差异,按检验水准α所能发现该差异的能力。1-β只取单 尾。 32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,每个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为 单因素多个样本均数,单个因素可以有多个水平,R>2 33.随机区组设计又称配伍组设计(Random Block Design):即两因素多个样本均数的比较(或称两因素方差分析,two way analysis of variance)。 34.绝对数:在计数资料中,各组的观察数称绝对数。 35.相对数:是两个有联系的指标的比,计数资料的统计描述主要是相对数(relative number)。 36.率(rate):说明某现象发生的频率或强度,常用%、‰、1/万、1/10万等作单位,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常 以保留1-2位整数为宜。

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

《医学统计学》期末考试试卷附答案

《医学统计学》期末考试试卷附答案 一、单项选择题(每小题3分,共20小题,共60分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制() A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述( )资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是() A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用() A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是() A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍,该指标为() A.相对比 B.构成比 C.定基比 D.率 7.统计推断的内容为() A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验() A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是() A.n1+ n2 B. n1+ n2 –1 C. n1+ n2 +1 D. n1+ n2 -2 10、标准误反映() A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的( ) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?() A.tr>tb B. trχ20.05,ν可认为() A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为()

医学统计学重点总结教学提纲

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation ):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity ):对研究指标有影响的非实验因素相同。 4 总体(population ):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample ):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter ):总体的设计指标称为参数。 统计量(statistic ):样本的统计指标称为统计量。 6 变量(variable ):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean )简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G )适用于倍数关系变化,经对数转换后呈正态分布(如:抗 体滴度,血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -(n x f ∑lg ) 三 中位数(M )和百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距和频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距和频数,

相关主题