搜档网
当前位置:搜档网 › 关于道路交通事故的统计分析

关于道路交通事故的统计分析

关于道路交通事故的统计分析
关于道路交通事故的统计分析

统计分析

道路交通事故

学院:应用数学学院

专业:信息与计算科学

姓名:张琪

学号:1117020102

一.背景

汽车的发明使用使人类的生活方式发生了巨大的变化,汽车以其特有的优越性为人类生活带来了舒适和便捷,但同时,它也给人类带来了道路交通事故等负面效应。由于汽车工业和交通运输业的高速发展,车辆保有量急剧增加,交通流量急剧增大,造成车辆与道路比例的严重失调,导致交通事故频发,伤亡人数增多,经济损失增加,当今世界面临道路交通安全问题的困扰,无论是工业发达国家,还是发展中国家,无不为交通事故所烦恼,道路交通事故问题已成为深刻的全球性社会问题,所以开展道路交通事故研究更具有重要性和紧迫性。

二.数据的收集

2.1

关于中国交通安全问题的调查问卷

1.你对目前中国交通安全状况有何看法?

A很好B一般C糟糕

2你认为中国最近几年交通事故频繁吗?

A频繁B较多C一般

3你认为交通知识主要由谁来灌输?

A老师B家长C交警

4你认为中国在普及交通安全知识方面全面吗?

A全面B不全面C不清楚

5你认为中国政府在处理交通事故方面做得够了吗?

A够了B不够C不清楚

6你认为机动车哪些行为对交通安全影响大?

A乱闯红灯B强行抢道C车辆乱停

7你认为行人及非机动车哪些行为对交通安全影响大?

A乱闯红灯B乱穿马路C非机动车驶入机动车道

8哪类车辆交通违章较突出?

A电动车B出租车C摩托车

9你认为造成交通安全意识差的原因是什么?(可多选)

A缺乏交通安全意识B缺乏交通安全知识

C缺乏交通安全责任感D存在侥幸心理

E存在麻痹思想F没有交警的监督

G惩处违法行为力度不够

10.你认为今后中国的交通在哪些方面需要改进?(可多选)

A机动车的性能和质量B逃生设施

C服务质量D基础设施及环境的舒适度

E监管体质F配套法律

G事故处理能力

2.2

为了简便地了解关于交通事故方面的相关内容,在网站上找到了以下的统计数据。

表1 1995-2004年全国道路交通事故统计表

表2 北京2012年不同时间段,不同公路等级的交通事故发生次数统计表

表3 北京2012年一周不同天数,不同时间段事故次数统计表

三.数据的分析

3.1

据2.1调查问卷显示:

1、近五成的市民认为目前市区交通秩序一般

调查显示,只有4.4%的市民认为目前我市市区交通秩序好,15.4%的市民认为比较好,两者合计为19.8%。认为市区交通秩序一般的市民占到了45.6%,认为不太好的占17.1%,认为不好的占16.4%,三者合计为79.1%,另有1.1%的市民表示不清楚。

2、交通违章是影响交通安全的主要原因

在问及“您认为机动车哪些行为对交通安全影响较大”时,排在首位的是乱闯红灯,认同率为66.2%;排在第二位的是抢行抢道,包括临时变更车道、强行超车、乱插队等,认同率为57.1%;车辆乱停靠排在第三位,认同率为49.3%;以下依次是超速驾驶(认同率为48.4%)、酒后驾车(40.9%)、超载行驶(30.4%)、

疲劳驾驶(23.6%)。另外,市民还反映了诸如开车打电话、乱按喇叭等行为也对交通安全造成了一定的影响。

在问及“您认为行人及非机动车的哪些行为对交通安全影响较大”时,市民主要反映了以下三种行为:一是乱穿马路,认同率为70.4%;二是乱闯红灯,认同率为70.2%;三是非机动车驶入机动车道,认同率为65.6%。另外,一些行人随意翻越护栏的行为既不安全,也影响了正常的交通秩序。

在问及“哪几类车辆交通违章行为比较突出”时,排在首位的是出租车,认同率为66.7%。市民反映,在没有探头监控的路口出租车经常闯红灯,另外像超速超车、乱变更车道、路边随意停靠上下客等行为也是屡见不鲜,这些都影响了正常的交通秩序,造成很大的安全隐患。排在第二、第三位的分别是电动车(认同率为40.4%)和摩托车(认同率为27.1%),这两类车辆常有乱穿马路、乱闯红灯、逆向行驶等情况,影响了机动车的安全行驶。另外市民认同率比较高的还有大货车和工程车(认同率为22.7%),这类车辆往往是因为超载导致货物沿路洒落,威胁到后面车辆的行驶安全。

3、增强市民遵守交通法规的意识甚为重要

在问及您对改善交通状况的意见建议时,70.2%的市民认为要加强宣传,增强市民遵守交通法规的意识,真正做到“文明出行、礼让为先”;53.6%的市民认为要改善道路设施,例如拓宽老城区部分道路,多建一些地下通道及过街天桥;

47.8%的市民认为要加强车辆管理,加大对违章行为的处罚力度;41.1%的市民认为应当适当错开上下班时间;22.7%的市民认为应当倡导短途出行不开车。3.2

(1)由2.2表1可以画出下面的折线图,更让人直观看出近年来交通事故的变化情况。在1995年一2002年间,道路交通事故次数、事故死亡人数、事故受伤人数均上升明显,且增长率很高,快速增加的道路交通事故发生量表明我国交通安全形势严峻,2002年开始,各项统计数据都有所下降,但这并不表明我国的道路安全形势已经好转,如2004年的道路交通事故死亡人数比2003年上升了2.%6。目前,我国道路交通事故的死亡人数比其他各种运输方式的死亡人数都多,超过了各种生产事故的非正常死亡人数的总和。据有关专家分析,在当前和今后一定时期内我国交通事故仍处于高发期,所以我国道路交通安全面临的形势是非常严峻的。

(2)由2.2表2刻画出下面两个扇形图。

由第一个扇形图可知,北京2012年发生的道路交通事故,三级公路上的事故量最大,占事故总量的28%,一级次之,占事故总量的27%,高速公路和四级公路上的事故量最少,分别占事故总量的3%和6%。

第二个扇形图为三级公路上不同时间段的事故量分析,我们可以看到,三级公路上6(15:00一18:00)和7(18:00~2l:00)这两个时间段的事故量最大,占全天事故量总的19%,l(0:00一3:00)和2(3:00一6:00)这两个时间段的事故量最小,分别占事故总量的3%和5%。

(3)由2.2表3可以分别得出下面的交通事故发生的频数分布表和交通事故发生次数分布的直方图。由表3的数据我们还可以进行工作日和休息日的事故情况比较,总体来说工作日的事故量比休息日的事故量大,白天的事故量比夜间的事故量大,15:00一18:00是事故高发时间段。

四.总结

道路交通事故数据的研究是道路交通安全研究的一个非常重要的方面,道路交通事故调查是进行交通事故数据统计分析的基础,道路交通事故数据的统计分析为道路交通事故的预测和安全评价提供理论依据。

道路交通事故数据统计分析系统研究

Y82660I107lO-22087学位论文指导教师姓名垫垒占鲎熊焦壅煎申请学位级别塑±专业名称主垫苎焦论文提交日期2005.06论文答辩日期呈Q盟:Q昼:!璺学位授予单位垫尘.去堂答辩委员会主席塑叁堡壅亟评阅人塑圭堡整垫查壅鲎一查.墨二oo五年六月摘要目前,道路交通安全研究已趋于从交通事故成因、机理入手,寻找道路交通事故发生时的人员、车辆、道路环境等方面的诱导因素,以及交通事故与影响因素间的相互关系,所以道路交通事故的调查和统计分析是交通事故研究的一个很重要的方面。我国关于道路交通安全中事故影响因素定量分析工作还不是很完善,而符合实际功用的事故数据统计分析系统无疑会促进这一工作的发展。本文在对国内外道路交通事故数据采集项目和道路交通事故数据分析系统进行详细的研究分析后,确定了我国的道路事故数据采集项目及道路事故数据分析方面存在的问题,针对所存在的问题,提出了适合于道路安全研究的道路交通事故数据的加工整理方法,建立了能展示更多交通事故信息的数据分析系统,从而为道路交通事故的规律总结提供了一定的依据。关键词:道路交通事故事故数据采集交通事故统计统计分析系统AbstractAtpresent,thecasestudyofthetraffichasalreadytendedtoward

sproceeding淅morigincauseoftrafficaccident,mechanism,factorofleadinginsuchrespectsastheroad,traffic,environmentwhilelookingforthetrafficaccidentoftheroadtohappen,andtrafficaccidentandinteractionofinfluencefactor,SOinvestigationandstatisticalanalysisoftheroadtrafficaccidentareimportantway intrafficaccidentstudy.Itisnotstillveryperfectthatourcountryhitsthequantitativeanalyticalworkofinfluencefactorofaccidentaboutthetrafficsafetyoftheroad,theaccidentdatastatisticalanalysissystemofthefunctionthatcorrespondtorealitywillundou

多元统计分析与R语言建模考试试卷

.. .. 多元统计分析及R 语言建模考试试卷 一、简答题(共5小题,每小题6分,共30分) 1. 常用的多元统计分析方法有哪些? (1)多元正态分布检验 (2)多元方差-协方差分析 (3)聚类分析 (4)判别分析 (5)主成分分析 ______________ 课程类别 必修[ ] 选修[ ] 考试方式 开卷[ ] 闭卷[ ]

(7)对应分析 (8)典型相关性分析 ( 9)定性数据建模分析 (10)路径分析(又称多重回归、联立方程) (11)结构方程模型 (12)联合分析 (13)多变量图表示法 (14)多维标度法 2. 简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。 简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。 复相关分析;研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R0.12…n的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线,再计算x0与用回归直线估计值悯之间的简单直线回归。复相关系数为R0.12…n的取值围为0≤R0.12…n≤1。复相关系数值愈大,变量间的关系愈密切。 典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

计量经济学多项选择题

计量经济学多项选择题 第一部分 1—40题 1.计量经济学是以下哪些学科相结合的综合性学科()。 A.统计学 B.数理经济学 C.经济统计学D.数学 E.经济学 2.从内容角度看,计量经济学可分为()。 A.理论计量经济学 B.狭义计量经济学 C.应用计量经济学D.广义计量经济学 E.金融计量经济学 3.从学科角度看,计量经济学可分为()。 A.理论计量经济学 B.狭义计量经济学 C.应用计量经济学D.广义计量经济学 E.金融计量经济学 4.从变量的因果关系看,经济变量可分为()。 A.解释变量 B.被解释变量 C.内生变量 D.外生变量 E.控制变量 5.从变量的性质看,经济变量可分为()。 A.解释变量 B.被解释变量 C.内生变量 D.外生变量 E.控制变量 6.使用时序数据进行经济计量分析时,要求指标统计的()。A.对象及范围可比 B.时间可比 C.口径可比 D.计算方法可比 E.内容可比 7.一个计量经济模型由以下哪些部分构成()。 A.变量 B.参数 C.随机误差项 D.方程式 E.虚拟变量 8.与其他经济模型相比,计量经济模型有如下特点()。 A.确定性 B.经验性 C.随机性 D.动态性 E.灵活性 9.一个计量经济模型中,可作为解释变量的有()。 A.内生变量 B.外生变量 C.控制变量 D.政策变量 E.滞后变量

10.计量经济模型的应用在于( )。 A .结构分析 B .经济预测 C .政策评价 D .检验和发展经济理论 E .设定和检验模型 11.下列哪些变量属于前定变量( )。 A .内生变量 B .随机变量 C .滞后变量 D .外生变量 E .工具变量 12.经济参数的分为两大类,下面哪些属于外生参数( )。 A .折旧率 B .税率 C .利息率 D .凭经验估计的参数 E .运用统计方法估计得到的参数 13.在一个经济计量模型中,可作为解释变量的有( )。 A .内生变量 B .控制变量 C .政策变量 D .滞后变量 E .外生变量 14.对于经典线性回归模型,各回归系数的普通最小二乘法估计量具有的优良特性有( )。 A .无偏性 B .有效性 C .一致性 D .确定性 E .线性特性 15.指出下列哪些现象是相关关系( )。 A .家庭消费支出与收入 B .商品销售额与销售量、销售价格 C .物价水平与商品需求量 D .小麦高产与施肥量 E .学习成绩总分与各门课程分数 16.一元线性回归模型i 01i i Y X u ββ+=+的经典假设包括( )。 A .()0t E u = B .2var()t u σ= C .cov(,)0t s u u = D .(,)0t t Cov x u = E .2~(0,)t u N σ 17.以Y 表示实际观测值,?Y 表示OLS 估计回归值,e 表示残差,则回归直线满足( )。 A .X Y 通过样本均值点(,) B .i i ?Y Y ∑∑= C .2i i ?Y Y 0∑(-)= D .2i i ?Y Y 0∑(-)=

多元统计分析试题及答案

华南农业大学期末试卷(A 卷) 2006学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:120 分钟 学号 姓名 年级专业 题号 一 二 三 四 五 六 七 八 总分 得分 评阅人 一、填空题(5×6=30) 22121212121~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ???+-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1, ,16(,),(,) 15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 (), 123设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111 X σ = 的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.83511 00.4170.8940.02700.8940.44730.8350.4470.1032013 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

计量经济学多项选择题 ()

计量经济学多项选择题第一部分 1—40题 1.计量经济学是以下哪些学科相结合的综合性学科()。 A.统计学 B.数理经济学 C.经济统计学 D.数学 E.经济学 2.从内容角度看,计量经济学可分为()。 A.理论计量经济学 B.狭义计量经济学 C.应用计量经济学D.广义计量经济学 E.金融计量经济学 3.从学科角度看,计量经济学可分为()。 A.理论计量经济学 B.狭义计量经济学 C.应用计量经济学D.广义计量经济学 E.金融计量经济学 4.从变量的因果关系看,经济变量可分为()。 A.解释变量 B.被解释变量 C.内生变量 D.外生变量 E.控制变量 5.从变量的性质看,经济变量可分为()。 A.解释变量 B.被解释变量 C.内生变量 D.外生变量 E.控制变量 6.使用时序数据进行经济计量分析时,要求指标统计的()。 A.对象及范围可比 B.时间可比 C.口径可比 D.计算方法可比 E.内容可比 7.一个计量经济模型由以下哪些部分构成()。 A.变量 B.参数 C.随机误差项

D.方程式 E.虚拟变量 8.与其他经济模型相比,计量经济模型有如下特点()。 A.确定性 B.经验性 C.随机性 D.动态性 E.灵活性 9.一个计量经济模型中,可作为解释变量的有()。 A.内生变量 B.外生变量 C.控制变量 D.政策变量 E.滞后变量 10.计量经济模型的应用在于()。 A.结构分析 B.经济预测 C.政策评价 D.检验和发展经济理论 E.设定和检验模型 11.下列哪些变量属于前定变量( )。 A.内生变量 B.随机变量 C.滞后变量 D.外生变量 E.工具变量 12.经济参数的分为两大类,下面哪些属于外生参数( )。 A.折旧率 B.税率C.利息率 D.凭经验估计的参数 E.运用统计方法估计得到的参数 13.在一个经济计量模型中,可作为解释变量的有( )。A.内生变量 B.控制变量 C.政策变量 D.滞后变量 E.外生变量 14.对于经典线性回归模型,各回归系数的普通最小二乘法估计量具有的优良特性有( )。 A.无偏性 B.有效性 C.一致性

应用多元统计分析SAS作业审批稿

应用多元统计分析S A S 作业 YKK standardization office【 YKK5AB- YKK08- YKK2C- YKK18】

5-9 设在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。对每块岩石测定了Cu,Ag,Bi三种化学成分的含量,得到的数据如表1。 表1 岩石化学成分的含量数据 (1)假定两类样本服从正态分布,使用广义平方距离判别法进行判别归类(先验概率取为相等,并假定两类样本的协方差阵相等); (2)今得一块标本,并测得其Cu,Ag,Bi的含量分别为2.95,2.15和1.54,试判断该标本是含矿还是不含矿? 问题求解 1 使用广义平方距离判别法对样本进行判别归类 用SAS软件中的DISCRIM过程进行判别归类。 SAS程序及结果如下。 data d59; input group x1-x3@@; cards; 1 2.58 0.9 0.95 1 2.9 1.23 1 1 3.55 1.15 1 1 2.35 1.15 0.79 1 3.54 1.85 0.79 1 2.7 2.23 1.3 1 2.7 1.7 0.48 2 2.25 1.98 1.06 2 2.16 1.8 1.06 2 2.3 3 1.7 4 1.1 2 1.96 1.48 1.04

2 1.94 1.4 1 2 3 1.3 1 2 2.78 1.7 1.48 ; proc print data =d59; run ; proc discrim data =d59 pool =yes distance list ; class group; var x1-x3; run ; 由输出结果可知,两总体间的广义平方距离为D 2=3.19774。还可知两个三元总体均值相等的检验结果:D =3.19774,F =3.10891,p =0.0756<0.10,故在显着性水平=0.10α时量总体的均值向量有显着差异,即认为讨论这两个三元总体的判别问题是有意义的。 线性判别函数为: 判别结果为含矿的6号样本错判为不含矿;不含矿的13号样本错判为含矿。 2 对给定样本判别归类 将Cu ,Ag ,Bi 的含量数值2.95、2.15、1.54分别代入线性判别函数得: 1244.674246.978882Y Y ==,。 贝叶斯判别的解{}***1, ,k D D D = 为 {}*|()(),,1, ,(1, ,)t t j D X Y X Y X j t j k t k =>≠==, 由于1244.6742246.97888Y Y =<=,因此待判的样品判为不含矿。 5-10 已知某研究对象分为三类,每个样品考察4项指标,各类的观测样品数分别为7,4,6;类外还有3个待判样品(所有观测数据见表2)。假定样本均来自正态总体。 表2 判别分类的数据

应用多元统计分析试题及答案

一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A

和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

03第三篇 多元统计分析作业题

第三篇 多元统计分析作业题 1 证明题 1)已知ψ==A X E X Z T T T ,这里用到关系1-ψ=E A 。以二变量为例证明: 12*-Λ=ψ=A X A X Z T T T 1)(-=T T A X 。 式中X 为标准化原始变量矩阵,A 为载荷矩阵,Z 为非标准化主成分得分,Z *为标准化的因子得分,E 为单位化特征向量构成的矩阵即正交矩阵,Ψ为特征根的平方根的倒数构成的对角阵,Λ为特征根构成的对角阵,对于二变量有 ?????? ??=ψ21 /10 /1λλ, ?? ? ???=Λ21 00λλ. 2)对于二变量因子模型,我们有 ?? ?++=++=222221122 112211111εεu f a f a x u f a f a x . 试以 x 1为例证明1 2 22==+j x j j u h σ ,这里∑== p k kj j a h 1 2 22 21 211a a +=。 2 计算题 1)现有一组古生物腕足动物贝壳标本的两个变量:长度x 1和宽度x 2。所测数据如下(表2.1)。 要求: ① 利用Excel 对数据进行主成分分析。 ② 借助SPSS 对该数据进行主成分分析,并计算结果与Excel 的计算结果进行对比,理解各个表格所给参数的含义。 ③ 用本例数据验证证明题?的推导结果。 表2.1 古生物腕足动物贝壳标本数据 样品编号 长度x 1 宽度x 2 样品编号 长度x 1 宽度x 2 1 3 2 14 12 10 2 4 10 15 12 11 3 6 5 16 13 6 4 6 8 17 13 14 5 6 10 18 13 15 6 7 2 19 13 17 7 7 13 20 14 7 8 8 9 21 15 13 9 9 5 22 17 13

秋季多元统计分析考试答案

《多元统计分析》课程试卷答案 A 卷 2009年秋季学期 开课学院:理 考试方式:√闭卷、开卷、一纸开卷、其它 考试时间:120 分钟 班级 姓名 学号 散卷作废。 一、(15分)设()∑????? ??=,~3321μN x x x X ,其中????? ??-=132μ,??? ? ? ??=∑221231111, 1.求32123x x x +-的分布; 2. 求二维向量???? ??=21a a a ,使3x 与??? ? ??'-213x x a x 相互独立。 解:1.32123x x x +-()CX x x x ???? ? ? ??-=321123,则()C C C N CX '∑,~μ。(2分) 其中:μC ()13132123=????? ??--=,()9123221231111123=??? ? ? ??-????? ??-='∑C C 。(4分) 所以32123x x x +-()9,13~N (1分) 2. ????? ?????? ??'-213 3x x a x x =AX x x x a a ????? ? ?????? ??--3212 1110 ,则()A A A N AX '∑,~2μ。(1分) 其中: 订 线 装

μA ???? ??++-=???? ? ??-???? ??--=132113********* a a a a ,(1分) ??? ? ??+--+++--+--='???? ??--???? ? ?????? ??--='∑242232222211002212311111100 2121222121212121 a a a a a a a a a a a a a a A A (2分) 要使3x 与???? ??'-213x x a x 相互独立,必须02221=+--a a ,即2221=+a a 。 因为2221=+a a 时24223212122 21 +--++a a a a a a 0>。所以使3x 与??? ? ??'-213x x a x 相互独立,只要 ???? ??=21a a a 中的21,a a 满足2221=+a a 。 (4分) 二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为 ??? ? ? ??=3861096X ,给定显著性水平05.0=α, 1. 求均值向量μ和协方差矩阵∑的无偏估计 2. 试检验,38:H 0???? ??=μ .38:H 1??? ? ??≠μ (已知F 分布的上α分位数为19)2,2(F ,5.199)1,2(F ,51.18)2,1(F 0.050.050.05===) 解:1、??? ? ??==∑=68X n 1X n 1i i (3分) ???? ??--='--=∑=9334)X X ()X X (1-n 1S i n 1i i (3分) 2、,38:H 0???? ??=μ .38:H 1??? ? ??≠μ…(1分)

统计学原理多项选择题05--第五章 统计指数

第五章统计指数 1、下列指数中属于狭义指数的有( ) 。 A、多种产品销售额指数 B、某种产品销售额指数 C、多种产品的销售量指数 D、多种产品的产量指数 E、多种产品的单位成本指数 2、下列指数中,属于质量指标指数的有()。 A、农副产品产量总指数 B、农副产品收购价格总指数 C、某种工业产品成本总指数 D、全部商品批发价格指数 E、职工工资个体指数 3.某企业甲产品报告期单位成本为基期的120%,这一指数是()。 A、个体指数 B、数量指标指数 C、质量指标指数 D、动态指数 E、静态指数 4、指数的作用是( ) A、综合反映复杂现象总体数量上的变动情况 B、分析现象总体变动中受各个因素变动的影响 C、反映现象总体各单位变量分布的集中趋势

D、反映现象总体的总规模水平 E、利用指数数列分析现象的发展趋势 5、下列属于质量指标指数的是( ) A、商品零售量指数 B、商品零售额指数 C、商品零售价格指数 D、职工劳动生产率指数 E、销售商品计划完成程度指数 6、下列属于数量指标指数的有( ) A、工业总产值指数 B、劳动生产率指数 C、职工人数指数 D、产品总成本指数 E、产品单位成本指数 7、编制总指数的方法有( ) A、综合指数 B、平均指数 C、质量指标指数 D、数量指标指数 E、平均指标指数 8、加权算术平均数指数是一种() A、综合指数 B、总指数 C、平均指数 D、个体指数加权平均数 E、质量指标指数 9、某商品基期售出50千克,报告期售出60千克,指数为() A、综合指数 B、总指数 C、个体指数 D、数量指标指数 E、销售量指数 10、编制综合指数的一般原则为() A、数量指标指数以基期数量指标为同度量因素 B、数量指标指数以基期质量指标为同度量因素 C、数量指标指数以报告期数量指标为同度量因素 D、质量指标指数以报告期数量指标为同度量因素 E、质量指标指数以基期数量指标为同度量因素

交通事故统计分析

交通事故统计分析 第一节交通事故统计的意义和任务 一、交通事故统计分析及其意义 ㈠交通事故统计分析 交通事故统计分析属于宏观分析,按统计的范围又包括地域性事故调查统计分析和线路事故统计分析。地域性调查主要针对全国、省、市等特定地区进行的,为制定安全性法规和政策服务。线路统计是针对某一路段进行调查,目的是找出道路的事故多发路段,为道路交通状况的改善和安全设施的设置提供依据。 ㈡交通事故统计分析的意义 事故统计分析对于科学地搞好交通管理,减少和防止交通事故的发生,保证道路交通安全具有非常重要的意义. 二、交通事故统计分析的内容 第二节交通事故统计指标 一、总量指标 总量指标是指反映交通事故现象在一定时间、地点、条件下的总体规模和水平,其表现形式为绝对数,也称绝对指标。指标反映的状况不同,可分为时期指标和时点指标。时期指标是反映总体在一段时期内活动过程的总量,是一个时间间隔内的数字。如某年、某月的交通事故次数。时点指标是反映总体在某一时点上规模或水平的总量,是在某一时刻的数字。如某年底某地的人口数、机动车辆数、驾驶员数等。 二、相对指标 相对指标是两个有联系的指标的比值,也叫相对数,通常是两个绝对数之比。交通事故相对指标是用两个交通事故绝对数的比值来表示的,更便于分析和说明两相比较指标之间的数量关系。相对指标的计算公式为:相对指标(%)=比数/基数×100% 三、平均指标 平均指标反映统计某一数量指标的一般水平或平均水平,也叫统计平均数。利用平均指标可以对比同类现象在不同地区、不同单位的一般水平,也可以分析在不同时期的一般水平,分析其发展变化。 四、动态分析指标 交通事故动态分析指标是通过事故动态数列计算的分析指标。交通事故动态数列可以反映事故发展变化的过程和趋势,但要分析事故的变化特点的规律性,还需计算动态分析指标,即计算平均水平、增长量、发展速度、增长速度、平均发展速度、平均增长速度等。 第三节统计分析方法 一、统计表格分析法 把统计调查所得到的数据资料汇总整理,按一定的顺序填在特定的统计表格中,便得到统计表。任何一种统计表都是统计表格与统计数据的结合体,利用统计表中的绝对指标、相对指标和平均指标,可以研究各类交通事故的规模、趋势和比例关系。 二、比重图分析法 比重图是一种表示事物构成情况的平面图形。可以在平面图上形象、直观地反映事物的各种构成所占的比例。例如,根据公安部交通管理局的统计资料,1997

统计学原理多项选择题分析

统计学原理例题分析_多项选择题 三、多项选择题(在下列每小题的五个选项中,有二个或二个以上是正确的,请把正确答案的序号填在括号内) 1. 下面哪些是连续型数量标志()。 A. 住房面积B. 商店的商品销售额 C. 高校的大学生人数D. 人口的出生率 E. 工业增长速度 参考答案:ABDE 2.下列统计指标中,是质量指标的有() A.工资总额B.单位产品成本 C.平均亩产量D.单位产品原材料消耗 E.商品流转额 参考答案:BCD 3.下列各项中,哪些属于统计指标()。 A.我国1994年国民生产总值 B.某工人日平均产量 C.某地区出生人口总数 D.某产品单位产品成本为12元/件 E.某企业全部工人生产某种产品的人均产量 参考答案:ACE 4.制定一个周密的统计调查方案,应确定()。 A.调查目的和调查对象B.调查单位和填报单位 C.调查项目和调查表D.调查资料使用范围 E.调查的时间和时限 参考答案:ACE 5.全国人口普查中()。 A.全部人口数是总体B.每个人是总体单位 C.调查单位是“户”D.填报单位是“人” E.男性是品质标志表现 参考答案:BE 6.抽样调查()。 A.是一种非全面调查 B.其目的是根据抽样结果推断总体数量特征 C.它具有经济性、时效性、准确性和灵活性等特点 D.其调查单位是随机抽取的 E.抽样推断的结果往往缺乏可靠性 参考答案:ABCD 7.下列哪些现象和指标宜于采用非全面调查()。 A.全国钢铁、原油产量及主要产品产量 B.了解扩大企业自主权试点的成果及问题 C.电视机出厂前的使用寿命检验 D.对全国各铁路枢纽站的货运量、货物种类的调查,以了解

应用多元统计分析SAS作业第六章资料

6-10 今有6个铅弹头,用“中子活化”方法测得7种微量元素的含量数据(见表1)。 (1) 试用多种系统聚类法对6个弹头进行分类;并比较分类结果; (2) 试用多种方法对7种微量元素进行分类。 问题求解 1对6个弹头进行分类 对数据进行标准化变换,样品间距离定义为欧式距离,系统聚类的方法分别使用类平均法(A VE )、中间距离法(MID )、可变类平均法(FLE )和离差平方合法(WARD )。使用SAS 软件CLUSTER 过程对数据进行聚类分析(程序见附录1)。 1.1类平均法 图1 类平均聚类法相关矩阵特征值图 图2 类平均聚类分析法聚类历史图 由图2可知,NCL=1时半偏R 2最大且伪F 统计量在NCL=2,5时和伪t 方统计量在NCL=1,4时较大。因此,将6个弹头分为两类{}{}(2) (2) 121,2,4,6,3,5G G ==。SAS 绘制的谱系聚类图如图 3所示。

图3 类平均聚类分析法谱系聚类图 1.2中间距离法 图4 中间距离聚类法相关矩阵特征值图 图5 中间距离聚类法聚类历史图 由图5可知,中间距离法与类平均法结果一致。因此,也将6个弹头分为两类 {}{}(2)(2) 121,2,4,6,3,5G G ==。 SAS 绘制的谱系聚类图如图6所示。

图6中间距离聚类法谱系聚类图 1.3可变类平均法 图7可变类平均聚类法分析结果图 图8 可变类平均聚类法聚类历史图 由图8可知,可变类平均法(=0.25 β-)输出结果与前两种方法稍有不同,NCL=1时半偏R2最大且伪F统计量在NCL=2时次大,NCL=5时最大;而伪t方统计量在NCL=1时最大。因此,分

关于道路交通事故的统计分析

统计分析 道路交通事故 学院:应用数学学院 专业:信息与计算科学 姓名:张琪 学号:1117020102

一.背景 汽车的发明使用使人类的生活方式发生了巨大的变化,汽车以其特有的优越性为人类生活带来了舒适和便捷,但同时,它也给人类带来了道路交通事故等负面效应。由于汽车工业和交通运输业的高速发展,车辆保有量急剧增加,交通流量急剧增大,造成车辆与道路比例的严重失调,导致交通事故频发,伤亡人数增多,经济损失增加,当今世界面临道路交通安全问题的困扰,无论是工业发达国家,还是发展中国家,无不为交通事故所烦恼,道路交通事故问题已成为深刻的全球性社会问题,所以开展道路交通事故研究更具有重要性和紧迫性。 二.数据的收集 2.1 关于中国交通安全问题的调查问卷 1.你对目前中国交通安全状况有何看法? A很好B一般C糟糕 2你认为中国最近几年交通事故频繁吗? A频繁B较多C一般 3你认为交通知识主要由谁来灌输? A老师B家长C交警 4你认为中国在普及交通安全知识方面全面吗? A全面B不全面C不清楚 5你认为中国政府在处理交通事故方面做得够了吗? A够了B不够C不清楚 6你认为机动车哪些行为对交通安全影响大? A乱闯红灯B强行抢道C车辆乱停 7你认为行人及非机动车哪些行为对交通安全影响大? A乱闯红灯B乱穿马路C非机动车驶入机动车道 8哪类车辆交通违章较突出? A电动车B出租车C摩托车 9你认为造成交通安全意识差的原因是什么?(可多选) A缺乏交通安全意识B缺乏交通安全知识 C缺乏交通安全责任感D存在侥幸心理 E存在麻痹思想F没有交警的监督 G惩处违法行为力度不够

10.你认为今后中国的交通在哪些方面需要改进?(可多选) A机动车的性能和质量B逃生设施 C服务质量D基础设施及环境的舒适度 E监管体质F配套法律 G事故处理能力 2.2 为了简便地了解关于交通事故方面的相关内容,在网站上找到了以下的统计数据。 表1 1995-2004年全国道路交通事故统计表

多元统计分析期末试题及答案.doc

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立? (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

统计学原理多项选择题01--第一章 绪论

第一章绪论 1、要了解某地区全部成年人口的就业情况,那么()。 A、全部成年人是研究的总体 B、成年人口总数是统计指标 C、成年人口就业率是统计标志 D、“职业”是每个人的特征,“职业”是数量指标 E、某人职业是“教师”,这里的“教师”是标志表现 2、国家统计系统的功能或统计的职能是()。 A、信息职能 B、咨询职能 C、监督职能 D、决策职能 E、协调职能 3、下列统计指标中,属于质量指标的有()。 A、工资总额 B、单位产品成本 C、出勤人数 D、人口密度 E、合格品率 4、数量指标反映总体某一特征的()。 A、规模 B、工作总量 C、强度 D、水平 E、密度 5、对某市工业企业状况进行调查,得到以下资料,其中统计指标是()。 A、该市职工人数为400000人 B、某企业职工人数4000人

C、该市设备台数75000台 D、全市产值40亿元 E、某企业产值20万元 6、统计基本概念中的标志()。 A、都只能用数值表示 B、有一部分可用数值表现 C、都只能用文字表现 D、有一部分可用文字表现 E、有品质标志与数量标志之分 7、要了解某地区全部成年人口的就业情况,那么()。 A、全部成年人口是研究的总体 B、成年人口总数是统计指标 C、成年人口就业率是统计标志 D、某人职业是教师是标志表现 E、反映每个人特征的职业是数量指标 8、下面研究问题中所确定的总体单位有()。 A、研究某地区国有企业的规模时,总体单位是每个国有企业 B、研究某地区粮食收获率时,总体单位是每一亩播种面积 C、研究某种农产品价格,总体单位可以是每一吨农产品 D、研究货币购买力(一定单位的货币购买商品的能力),总体单位应是每元货币 E、确定某商店的销售额,总体单位是每一次销售行为。 9、在全国人口普查中,()。 A、全国人口总数是统计总数 B、男性是品质标志表现 C、人的年龄是变量 D、每一户是总体单位 E、人口的平均年龄是统计指标 10、下列变量中属于离散变量的有()。 A、机床台数 B、学生人数 C、耕地面积 D、粮食产量 E、汽车产量 11、总体、总体单位、标志、指标这几个概念间的相互关系表现为()。 A、没有总体单位就没有总体,总体单位也离不开总体而独立存在 B、总体单位是标志的承担者 C、统计指标的数值来源于标志 D、指标是说明总体特征的,标志是说明总体单位特征的

道路交通事故状况分析

九十一年道路交通事故分析 提報單位:統計室 92.9.30 一、前言 隨著科技進步,車輛、道路工程不斷改進,且車輛安全配備及道路服務水準受到重視,交通投資建設在於滿足行的需求與加強安全保障。 依據本署統計資料,九十一年交通事故A1及A2類死傷案件為86,259件,死亡2,861人(只計算事故發生起24小時死亡者),受傷109,594人。若依衛生署機動車死亡人數統計資料,由84年的高峰7,427人逐年降低,91年為4,322人,顯示近年來交通安全政策已具成效。惟我國每十萬人口死亡19.2人(2002年),與日本6.6人(2002年)、新加坡5.2人(2000年)比較,仍有進步空間,本文就警察機關交通事故資料分析,提供制訂道路交通安全決策之參考。 二、歷年概況 表一、歷年臺閩地區道路交通里程、機動車輛及道路交通事故 說明:道路含國道、省道、縣道、鄉道、專用道路及市區道路。

道路交通事故死亡人數(衛生署資料) 人口 (80年=100) 50100150 200 80 81 82 83 84 85 86 87 88 89 90 91年 九十一年臺閩地區機動車輛為17,906,957輛,較上年增加441,920輛或增2.53%,其中汽車數5,923,200輛(平均每千人263.01輛);道路交通事故死亡4,322人,較上年減少465人或減9.71%;人口為22,520,776人,較上年增加115,208人或增0.51%;道路里程37,299公里,較上年增加601公里或增1.64%(詳表一)。 以八十年至九十一年止十二年之資料觀察,機動車輛增加68.76%,道路里程增加31.00%,人口增加9.29%,道路交通事故死亡人數則在政府積極推動多項安全措施(如註一)及警察嚴正執法下減少3,000人(-40.97%)(詳圖一)。 圖一、歷年臺閩地區道路交通事故等之變動 三、世界主要國家道路交通事故概況 主要國家機動車交通事故死亡率以新加坡 5.2人/十萬人口(2000年)最低,英國5.6人(1999年)次之、日本6.6人、德國7.9人又次之,韓國22.3人/十萬人口(2000年),我國2002年死亡率為19.2人/十萬人口,略高於美國15.1人/十萬人口。就狀態別結構觀察,我國以騎乘機車死亡占54.6%最多(2002年),歐美、日本以乘坐汽車死亡為主約占40-50%(2001年),韓國以徒步死亡較高占38.7%。就年齡組(每十萬人口死亡人數)觀察,我國、日、韓等亞洲國家以65歲以上組較高,美、英、德等歐美國家則以15-24歲組較高(詳表二、三)。

多元统计分析期末考试考点整理

二名词解释 1、多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广 2、聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。使类内对象的同质性最大化和类间对象的异质性最大化 3、随机变量:是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向量。类似地,所有元素都是随机变量的矩阵称为随机矩阵。 4、统计量:多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量 三、计算题 解:

答: 答:

题型三解答题 1、简述多元统计分析中协差阵检验的步骤 答: 第一,提出待检验的假设和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 2、简述一下聚类分析的思想 答:聚类分析的基本思想,是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕. 3、多元统计分析的内容和方法 答:1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。(1)主成分分析(2)因子分析(3)对应分析等

使用Excel对多项选择题自动评分并统计正确率

【内容摘要】 对选择题的答题卷进行批改和分析是教学中经常要做的重要工作。利用Microsoft Excel电子表格的强大功能,用FREQUENCY函数和数组公式、COUNT函数对选各题各选项的人 数及百分比进行统计;用IF函数和SUM函数自动计算单项选择题的总得分;用VLOOKUP 函数和SUM函数自动计算不定项选择题的总得分。 【关键词】 Excel 选择题自动结分统计分析 考试是教学中不可缺少的环节,是检查教学质量的重要手段。考试可以促进、激励学生的进步发展,让教师检查、诊断学生的学习是否达到教学大纲规定的要求,同时给教师提供反馈信息,以便及时调整教学进度,改进教学方法,提高教学质量。而要达到以上目的,试卷分析是很重要的环节,只有对考试结果进行全面细致的分析,才能找出教和学双方存在的问题,找出有针对性的解决方法,提高教学效果。而全面细致的分析必须要有详细的数据,如及格率、优秀率、平均分、标准差、各分数段人数、各题难度等,特别是对每题的难度分析,对搞清每个知识点的落实掌握情况是很重要的。而选择题答卷的统计分析,由于一般的平时测验都没有答题卡和读卡机,老师要对选择题进行手工逐题的批改记分,如要对各题的答题情况进行比较详细的分析,许多老师用打五划“正”的方法,来统计各题的做对和做错人数。本人也经常做这样的事,感到效率很低,且容易出错搞不准确。想到用Excel对考试结果数据进行及格率、优秀率、平均分、标准差、各分数段人数分析很容易,能不能也用Excel对选择题进行比较详细的分析,通过反复摸索,找到了以下方法。 下面以60人的班级,20题选择题为例,多于60人或少于60人可用插入行或删除行来调整,多于20题或少于20题用插入列或删除列来调整,都不影响表格的性质。 对单选题的分析 1.先新建一个空白的Excel工作簿,工作表Sheet1重命名为“1班”,输入表格头、题号、 学号、姓名,C3:V62为数据输入区(如图1)。 2.在W3、W4、W5三个单元格分别输入数值1.5、2.5、3.5。在姓名的下方的适当位置, 如隔二行B65:B68分别输入“选A项人数、…、选D项人数”。 3.选中C65:C68四个单元格,单击F2(编辑选定的单元格),在公式编辑栏或直接在单元格输入“=FREQUENCY(C3:C62,$W$3:$W$5)”(注意:输入公式时字母、符号要用英文半角), 按Ctrl+Shift+Enter组合键输入(如图2)。选中C65:C68光标移到右下角变为实心的十字时,向右拖拉至V65:V68。 4.填入学生的选择题答案,选A的填1,选B的填2,选C的填3,选D的填4。就会在65至68行中显示各题选择各选项的人数。至此主要任务完成。 5.为了使数据看起来更方便,可在B69输入“总人数”,在C69中输入公式“=COUNT(C3:C62)”,光标移到右下角变为实心的十字时,向右拖拉至V69,则69行显示答题总人数。 6.在B70:B73中分别输入“选A百分比、…、选D百分比”,在C70中输入 “=C65/COUNT(C$3:C$62)”,光标移到右下角变为实心的十字时,向下拖拉至C73,向右拖拉至V73,就会在70至73行中显示各题选择各选项的人数的百分比。注意设置C70:V73 单元格的格式,点“格式”中“单元格格式”,在“数字”中选“百分比”,“小数位数”设为1位,

相关主题