搜档网
当前位置:搜档网 › 第01章 医学统计中的基本概念

第01章 医学统计中的基本概念

第01章 医学统计中的基本概念
第01章 医学统计中的基本概念

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学基本概念

习题-医学统计学基本概念 选择题: 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压,调查某地1000 人,记录每人是否患有高血压。最后清点结果,其中有10 名高血压患者,有990 名非高血压患者。() A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指() A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是() A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级(轻、中、重) E.疾病疗效(有效、无效) 4、总体是由() A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是() A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是() A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样,下列哪一项说法是正确的() A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是() A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是:() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

第二节 医学统计学的基础知识习题及答案

【单项选择题】 1. 医学统计学的主要内容不包括()。 A. 变量计算 B. 统计设计 C. 统计描述 D. 统计推断 【答案】A 【解析】P111;医学统计学的主要内容; 1)统计设计; 2)统计描述; 3)统计推断。 2. 医学统计工作的基本步骤不包括()。 A. 研究设计

B. 健康教育 C. 收集资料 D. 整理资料 【答案】B 【解析】P112;医学统计工作的基本步骤:研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。这4个步骤是紧密联系不可分割的,某一环节发生问题,都将影响最终的统计分析结果。 3. 描述集中趋势的指标有()。 A. 算数均数 B. 方差与标准差 C. 极差 D. 百分位数 【答案】:A 【解析】:P115;描述集中趋势的指标:

1)算术均数,简称均数; 2)中位数(median); 3)几何均数(geometry mean)。 4. 统计学中的总体是指()。 A. 根据研究目的确定的同质观察单位的全体 B. 根据地区划分的研究对象的全体 C. 根据时间划分的研究对象的全体 D. 根据人群划分的研究对象的全体 【答案】A 【解析】P114;总体( population)是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 5. 下列不属于离散趋势的描述指标是()。 A. 极差

B. 百分位数 C. 方差与标准差 D. 几何均数 【答案】D 【解析】P116;描述离散趋势的指标; 1)方差与标准差; 2)极差:亦称全距(range),用符号R表示; 3)百分位数(percentile):是一个位置指标,用符号Px表示;4)变异系数(coefficient of variation):用符号CV表。 而几何均数是描述集中趋势的指标。 6. 血清学滴度资料最常用来表示其平均水平的指标是()。 A. 算术平均数 B. 中位数

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

流行病学和医学统计学基础知识答案及解析

第五章流行病学和医学统计学基础知识 一、单选题 1、以下对流行病学的任务,表述错误的是()。 A. 流行病学第二阶段的任务是“找出原因、影响或决定因素” B. “健康风险评估”对应流行病学第一阶段的任务 C. “健康危险因素干预”对应流行病学第三阶段的任务 D. 流行病学第一阶段的任务是“揭示现象” E. 流行病学第三阶段的任务是“提供措施” 网校答案:B 网校解析:流行病学的任务大体上可以分为三个阶段 第一阶段的任务是“揭示现象”,即揭示流行(主要是传染病)或分布(其他疾病、伤害与健康)的现象。 第二阶段为“找出原因、影响或决定因素”,即从分析现象入手找出流行与分布的规律、原因或影响因素。 第三阶段为“提供措施”,即合理利用前两个阶段的结果,找出预防或干预的策略与措施。结合健康管理的实际,流行病学第一、二和三阶段的任务分别对应的是“健康信息收集”“健康风险评估”“健康指导和健康危险因素干预”。 2、流行病学主要研究()。 A. 医院内的患者及患病有关因素 B. 正常人群的健康水平 C. 亚健康人群的健康水平 D. 人群中疾病与健康状况的分布及其影响因素 E. 社区内高危人群及其健康水平 网校答案:D 网校解析:流行病学的主要研究内容如下: ①疾病分布及影响分布的原因:即“揭示现象”。 ②研究疾病的流行因素和病因:即“找出原因”。 ③研究与制定预防对策和措施:即“提供措施”。 ④评价策略和措施的效果:即“评价效果”。 3、下列关于流行病学,说法错误的是()。 A. 流行病学是从群体角度研究疾病与健康 B. 流行病学研究的病种仅限于传染病 C. 流行病学属于预防医学的范畴 D. 流行病学已深入临床医学的研究中 E. 流行病学是从疾病分布入手探讨疾病的流行因素 网校答案:B 网校解析:流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素,用以预防和控制疾病、促进健康的学科。该定义的基本内涵有四点: ①它的研究对象是人群,是研究所关注的具有某种特征的人群; ②它不仅研究各种疾病,而且研究健康状态和事件; ③它的重点是研究疾病、健康状态和事件的分布、影响和决定因素;

医学统计学知识点梳理

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

第五章-医学统计学的基本知识(五)

第五章医学统计学的基本知识 第二节医学统计学的基本知识 一、基本概念 (一)医学统计学的定义和研究对象 1.医学统计学定义: 根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科。 2. 医学统计学研究对象: 是具有不确定性的医学数据,其基本的研究方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发现蕴含其中的统计学规律。 (二)医学统计学的主要内容 1.统计设计 2.统计描述 3.统计推断 (三)医学统计资料的类型 计量资料、计数资料和等级资料三类。 1.计量资料——数值变量: 为定量测量的结果,通常用专用仪器测量,并有计量单位,如身髙(cm)、体重(kg)等。 2.计数资料——定性观察的结果。 二分类:两种相互对立的属性如:阳性/阴性、正常/异常 多分类:定性观察结果有两种以上互不包含的属性, 如新生儿出生缺陷、某病患者的死亡原因等。 这类资料之所以称为计数资料,因为在统计时通常将各种 观察结果按属性分类计数,如阳性人数、阴性人数、 死于某病的人数等。 3.等级资料: 介于定量测量和定性观察之间的半定性观察结果,通常有两个以上等级, 如阴性、阳性、强阳性,治愈、好转、有效、无效等。 (四)医学统计工作的基本步骤 研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。 (五)统计学的几个重要概念 1.同质与变异 同质:研究对象具有相同的背景、条件、属性称为同质。 变异:同一性质的事物,其个体观察值(变量值)之间的差异,在统计学上称为变异。 统计学所研究的对象是以同质为基础,并具有变异的事物或现象。

2.总体与样本 总体:是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 观察单位——个体,是统计研究中最基本的单位。 样本:即从总体中随机抽取有代表性的一部分观察单位,其测量值(或观察值)的集合称为样本(sample)。 抽样研究的目的是用样本信息推论总体特征。 3.参数与统计量 参数:指总体指标,如总体均数、总体率、总体标准差等。 统计量:指样本指标,如样本均数、样本率、样本标准差等。 4.误差 医学科学研究中的误差: 通常指测量值与真实值之差,其中包括系统误差和随机测量误差; 以及样本指标与总体指标之差,即抽样误差。 5.概率与频率 概率是对总体而言,频率是对样本而言。 概率:指某随机事件发生的可能性大小的数值,常用符号P来表示。 随机事件的概率在0与1之间,即0≤P≤1,常用小数或百分数表示。P越接近1,表明某事件发生的可能性越大,P越接近0,表明某事件发生的可能性越小。 频率:指一次实验结果计算得到的样本率。 二、统计描述 (一)数值变量资料的统计描述 1.频数表:最小值、最大值、组段之间首尾相接。 2.频数分布图:直接反映连续变量各种取值出现的机会。 3.描述离散趋势的指标:方差与标准差、极差、百分位数、变异系数。 4.描述集中趋势的指标:算数均数、中位数、几何均数。 (二)分类资料的统计描述 1.频数表:表5-4 108例患者随访方式频数表。 2.相对数:比和率(见本章第一节)。

医学统计学基本概念[资料]

医学统计学基本概念 1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。 3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo) 上的一切值。 4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。它是指变量的取值有 限的,至多是可列多个。附:无序分类:二项分类、多项分类 5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值 大小,故等级之间不可度量。 6.个体individual:即每个观察单位。 7.总体population:根据研究目的确定的同质观察单位的全体。 8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。如总体均数、总体标准差等。特点:参数是未知的,固有的,不变的! 10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。特点:统计量是已知的,变化的,有误差的! 11.概率probability:是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。 13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。 14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的。这个常数p就称为事件A出现的概 率(probability),记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出,频率为一变量,是样本统计量,而概率为常数,是一总体参数。实践中,当试验次数足够多时,可以近似地将频率作为概率的一个估计。 15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能 发生,此即为小概率原理。 16.同质(homogeneity):性质相同的事物称为同质的。 17.变异(variation):同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、 机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值(normal value)。 19.正常值范围(normal ranges),是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error):样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计:由样本信息估计总体参数称为参数估计,包括点估计和区间估计。 23.点估计(point estimation) :直接用样本统计量作为总体参数的估计值。这种估计方法简单,但未考虑抽样误差的大小。 24.区间估计(interval estimation) :按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间(confidence interval, CI),又 称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。如取α=0.05,则每100个样本所算得 的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。 26.可信区间的两个要素:第一个要素是可靠性,常用可信度1-α的大小表示;第二个要素是精确性,常用可信区间的长度CU-CL衡量。 27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内, 理论上有95个包含总体均数,而有5个不包含总体均数。 28.可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。这里的95%,指的是方法本身!而不是某个区间! 29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”, 用α来表示。 30.第二类错误(II型错误):不拒绝实际上不成立的H0,称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效:1-β称检验效能(power of a test),过去称把握度。为当两总体确有差异,按检验水准α所能发现该差异的能力。1-β只取单 尾。 32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,每个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为 单因素多个样本均数,单个因素可以有多个水平,R>2 33.随机区组设计又称配伍组设计(Random Block Design):即两因素多个样本均数的比较(或称两因素方差分析,two way analysis of variance)。 34.绝对数:在计数资料中,各组的观察数称绝对数。 35.相对数:是两个有联系的指标的比,计数资料的统计描述主要是相对数(relative number)。 36.率(rate):说明某现象发生的频率或强度,常用%、‰、1/万、1/10万等作单位,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常 以保留1-2位整数为宜。

常用医学统计学方法的选择

常用医学统计学方法的选择 1. 多组率的比较用卡方检验(χ2检验,chi-square test) 直接用几个率的数值比较,与直接用原始数据录入比较,结果会有什么不同?卡方值会受样本量的影响,样本越多,卡方值越大。 2.多组计量资料比较采用方差分析(F检验) ,不能用t检验。当方差分析结果为P<0.05时,只能说明k组总体均数之间不完全相同。若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的多重比较,即SNK-q检验(多个均数两两之间的全面比较)、LSD-t检验(适用于一对或几对在专业上有特殊意义的均数间差别的比较)和Dunnett检验(适用于k-1个实验组与一个对比组均数差别的多重比较)。 3.非正态分布多组数据之间比较选用非参数检验、单样本中位数检验(符号检验和Wilcoxon 检验)、双样本中位数检验(Mann-Whitney 检验)、方差分析(Kruskal-Wallis、Mood 中位数和Friedman 检验) 4.按血糖水平从低到高分成多组,进行多组之间死亡率的比较,由于死亡率同样受年龄、性别、病史、您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响,所以需选取合适统计方法实现“调整年龄、性别等危险因素后,按血糖分组进行死亡率的比较(由血糖从低到高分成的4组)”。 ①年龄是定量变量(是数值),调整年龄的方法可在Logistic回归中运用,连续性变量年龄加入covariate中,当成协变量,就可以调整年龄,age-adjusted odds ratio就能得到了。 ②性别性别是二分类变量,不是定量变量,不可在LOGISTIC回归里比较。调整性别可在卡方检验中采取分层的方法比较。 如果为多分类LOGISTIC回归,在选择用multinomianl LOGISTIC回归中,可选入年龄等进入covariate,观察年龄的配比情况。可把性别选入factors(自变量)。这样可以实现调整年龄、性别等危险因素。 5.回顾性研究(1)临床妊娠率和女性年龄的关系+(2)男性影响临床妊娠的精子参数比较: 数据类型及变量的说明:y:计量 拟采用的分析方法:卡方检验 拟采用的分析软件:spss 原始数据附件及格式:word表 能否用其他方法统计分析:可用卡方分割,调整检验水准(根据比较的次数N,校正后的检验水准为0.05/N)。 6.重复t检验:多个样本均数间的两两比较(又称多重比较)不宜用t检验,因为重复数次,t 检验将增加第一类错误的概率,使检验效率降低。此时宜用方差分析,并在此基础上用两两比较方法(如.SNK、LSD、Duncan法等)。 对于同一对均数间的差异,用t检验无显著性,而两两比较可能有显著性,可见错误选用统计方法将推出错误结论。 统计方法的选择: 分计量、计数、等级资料三

2020健康管理师考试辅导资料-医学统计学基础知识

医学统计学基础知识 基本概念 统计描述 统计图表 统计推断 基本概念 医学统计学的定义和研究对象 1.定义统计学通常被定义为“关于数据收集、表达和分析的普遍原理和方法”。医学统计学则可定义为“根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科”。 2.研究对象医学统计学的研究对象是具有不确定性的医学数据,其基本研究方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发现蕴含其中的统计学规律。 医学统计学的主要内容 1.统计设计 包括调查设计和实验设计。调查设计主要有抽样方法、调查技术、质量控制技术等;实验设计主要有 各种实验设计模型、分组方法、样本量估计等。 由于统计设计关系到资源分配的可行性、数据收集的正确性和结论的科学性,一旦出现设计上的失误 或缺陷,有可能导致在整个研究的失败。因此,统计设计是保证统计描述和推断正确的基础。 2.统计描述对原始数据归纳整理,用相应的统计指标,如率、均数等,表示出研究对象最鲜明的数量特征,必要时选择统计表或统计图。 3.统计推断在统计描述的基础上,对统计指标的差别和关联性进行分析和推断。 医学统计资料的类型 在医学研究中,试验或观察结果常按分组因素和反应变量分别记录。分组因素为研究者根据试验目的 施加的干预,如不同治疗药物、不同治疗期限等。在某些不能施加干预的观察性研究中,研究者感兴趣的 因素,如年龄、性别等,也可看作分组因素。在流行病学研究中,这些因素又称为危险因素。反应变量是 指施加干预后的研究对象的生物反应,如是否治愈、是否死亡、红细胞计数、血细胞计数、血压值等。 统计资料类型通常针对反应变量而言,如收缩压、舒张压、药物不良反应等。 1.计量资料亦称数值变量,为定量测量的结果,通常用专用仪器测量,并有计量单位,如身高(cm)、体重(kg)等。计量资料有连续性的特点,如身高可以是175cm、175.1cm、175.11cm等。 2.计数资料计数资料是定性观察的结果。有二分类和多分类两种情况。二分类观察结果只有两种相互对立的属性,如“阳性”或“阴性”、“死亡”或“存活”、“正常”或“异常”;多分类的定性观察结 果有两种以上互不包含的属性,如新生儿出生缺陷、某病患者的死亡原因等。 这类资料之所以称为计数资料,因为在统计时通常将各种观察结果按属性分类计数,如阳性人数、阴 性人数、死于某病人数等。 3.等级资料介于定量测量和定性观察之间的半定性观察结果,通常有两个以上等级,如阴性、阳性、强阳性,治愈、好转、有效、无效等。 等级资料与计数资料又可统称为分类变量。它们的区别在于,等级资料虽然也是多分类资料,但各个 类别间还是存在大小或程度上的差别。 表5-3 108例高血压患者随访记录汇总表

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标? 定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均数的 程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 2. 应用相对数时应注意哪些问题? 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图形适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)

医学统计学重点总结教学提纲

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation ):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity ):对研究指标有影响的非实验因素相同。 4 总体(population ):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample ):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter ):总体的设计指标称为参数。 统计量(statistic ):样本的统计指标称为统计量。 6 变量(variable ):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean )简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G )适用于倍数关系变化,经对数转换后呈正态分布(如:抗 体滴度,血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -(n x f ∑lg ) 三 中位数(M )和百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距和频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距和频数,

硕士医学统计学知识点总结汇总

第2章统计描述 1.对定量资料进行统计描述时,如何选择适宜的指标? 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平均 数 个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准 差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口 资料;④分布不明 变异系数标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 2. 应用相对数时应注意哪些问题? 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图形适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系 箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数

医学统计学名词解释概念总结

一名解 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

第八章医学统计学的基本内容

第八章医学统计学的基本内容 【 A 1 型题】 1 . 图示7 岁女童身高与体重的关系,宜绘制: A. 散点图 B. 条图 C. 线图 D. 直方图 E . 半对数线图 2 . 为了由样本推断总体,样本应当是总体中 A. 任意一部分 B. 的典型部分 C. 有价值的一部分 D. 有意义的一部 分 E . 有代表性的一部分 3 . 欲表示某地区某年各种死因的构成比,可绘制: A. 线图 B. 直方图 C. 百分条图或圆图 D. 统计地图 E . 条图 4 . 统计表有简单表和复合表两种,复合表是指 A. 有主辞和宾词 B. 主辞分成两个或两个以上标志 C. 宾辞分成两个或两个以上标志 D. 包含两张简单表 E . 包含两张或两张以上简单表 5 . 要制定某年某地恶性肿瘤男、女年龄别死亡率的统计分析表,则主 要标志是 A. 年龄别 B. 性别 C. 死亡率 D. 性别和年龄别E . 性别、年龄别和死亡率 6 . 图示某年某医院门诊患者的年龄分布,宜绘制 A. 直方图 B. 圆图 C. 百分直条图 D. 直条图E . 普通线图 7 . 某研究者准备通过分析8 0 0 人的血压资料以评价当地高血压患病情 况,问可以考虑将血压测量值按哪种变量类型进行处理 A. 计量资料 B. 计数资料 C. 等级资料 D. 以上均可 E . 以上均不可 8 . 半对数线图 A. 纵横轴都必须为对数尺度 B. 纵轴为对数尺度,横轴为算术尺度 C. 横轴为对数尺度,纵轴为算术尺度 D. 纵横轴都必须为算数尺度E . 以对数的 1 / 2 值作纵横轴尺度 9 . 比较某年某地四种病的病死率时,宜绘制 A. 普通线图 B. 半对数线图 C. 直方图 D. 百分直条图E . 直条图 1 0 . 要反映某市连续 5 年甲肝发病率的变化情况,宜选用 A. 直条图 B. 直方图 C. 线图 D. 百分直条图E . 散点图 11 . 下列哪些统计图适用于计数资料 A. 直条图、直方图 B. 线图、半对数线图 C. 直条图、百分直条图 D. 百分直条图、直方图E . 散点图、线图 1 2 . 下列哪种统计图纵坐标必须从0 开始 A. 半对数线图 B. 散点图 C. 百分直条图 D. 普通线图E . 直条图 1 3 . 关于统计表的列表要求,下列哪项是错误的 A. 标题应写在表的上端,简要说明表的内容 B. 横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表 的左侧 C. 线条主要有顶线、底线及纵标目下面的横线,不宜有斜线和竖线 D. 数字右对齐,同一指标小数位数一致,表内不宜有空格 E . 备注用“ * ”标出,写在表的下面 1 4 . 医学统计工作的基本步骤是 A. 调查、搜集资料、整理资料、分析资料 B. 统计资料收集、整理资料、统计描述、统计推断

相关主题