搜档网
当前位置:搜档网 › 数据分析与建模实验指导书

数据分析与建模实验指导书

数据分析与建模实验指导书
数据分析与建模实验指导书

数据分析与建模实验指导书

张肃

中原工学院经济管理学院

实习一MATLAB基本操作

一、实验目的

1.了解MATLAB操作环境。

2.掌握MATLAB的使用界面与相关操作。

二、实例

1.矩阵访问。

v=[1 2 3 4 5 6 7]; %生成一个行向量

v(3) %查询第三个元素的值

ans =

3

v(3)=23 %将第三个元素的值设为23

v =

1 2 23 4 5 6 7

v([1 2 6])=[11 12 16] %将下标为1、2、6的三元素的值设为11、12、16 v =

11 12 23 4 5 16 7

v(4:end) %查询第4至最后元素之间的所有元素

ans =

4 5 16 7

v(1:5) %查询第1至5个元素

ans =

11 12 23 4 5

m=[1 2 3;4 5 6] %产生一个新矩阵m

m =

1 2 3

4 5 6

m(2,3) %查询第2行第3列位置上的元素

ans =

6

m(:,2) %查询第2列元素上所有行的元素

ans =

2

5

m(2,:) %查询第2行上所有列的元素

ans =

4 5 6

m(2,[1 2]) %查询第2行上的第1、2列位置上的元素

ans =

4 5

m(1,[2 3])=[88 99] %将第1行上的第2、3列上的元素分别设为88和99

m =

1 88 99

4 5 6

m(2,2)=518 %将第2行2列位置上的元素设为518

m =

1 88 99

4 518 6

2.通过MATLAB指令创建向量和矩阵演示。

(1)指定起点:步长:终点。如果不指定步长,则将步长默认为1,最后一个元素不一定是终点,这取决于区间长度是否为步长的整数倍。该方法用于创建向量。

v = 0:0.2:1 %以0为起点、1为终点、步长为0.2创建一个数组(行向量)

v =

0 0.2000 0.4000 0.6000 0.8000 1.0000

v = 0:pi %起点0、终点pi、默认步长1。最后一个元素不是终点。

v =

0 1 2 3

(2)linspace(起点,终点,元素个数),等分间隔。该方法用于创建向量。

v = linspace(0,pi,3)

v =

0 1.5708 3.1416

v = linspace(0,3,5)

v =

0 0.7500 1.5000 2.2500 3.0000

3.矩阵乘、除操作。

A=magic(3);

B=ones(3);

A.*B %数组方式的乘法

ans =

8 1 6

3 5 7

4 9 2

A*B %矩阵方式的乘法

ans =

15 15 15

15 15 15

15 15 15

M=[1,2;2 1]

M =

1 2

2 1

B=[1 -1;1 0]

B =

1 -1

1 0

A./B %维数不匹配,将会出错

??? Error using ==> rdivide

Matrix dimensions must agree.

M./B %数组方式的除法

ans =

1 -2

2 Inf

B./M %数据方式的除法

ans =

1.0000 -0.5000

0.5000 0

M/B %矩阵方式的除法

ans =

-2 3

-1 3

M*inv(B) %以矩阵方式运算,M乘以B的逆矩阵

ans =

-2 3

-1 3

inv(B) %计算B的逆

ans =

0 1

-1 1

三、实习题

1.先生成两个矩阵:A=[3 6 9 5; 2 4 8 3; 1 2 3 7; 5 1 4 8]和B=[1 2 3 2; 2 4 1 5; 1 4 7 2; 7 4 2

9]后求解A.*B、A.\B和A./B的结果。

2.设f(x,y)= x2+sinxy+2y,在M文件编辑/调试器中创建一个名为wlb_3的M函数文件并保存,在命令窗口中调用M文件,实现输入自变量的值时输出函数值。

实习二数据统计量及其分布检验

一、实验目的

1.掌握利用MATLAB软件计算基本统计量与数据可视化方法。

2.掌握利用MATLAB软件进行数据正态性检验的方法。

二、实例

1.矩阵A是2008年安徽省各市森林资源情况统计数据,计算各指标均值、中位数以及三均值.

A=[53.93 50.98 15.48 256.00 65.41

44.92 40.38 14.99 211.07 151.14

148.19 145.54 17.10 842.09 677.52

293.86 279.86 28.80 1238.01 1035.67

86.96 74.64 12.91 302.67 299.32

165.62 160.25 16.46 898.76 800.96

17.93 16.37 6.20 151.39 30.17

199.46 158.24 11.90 885.16 591.17

660.36 607.16 34.74 2278.37 1984.36

17.14 13.72 8.10 81.20 36.34

148.52 117.54 12.60 494.38 335.26

77.27 66.69 20.85 279.34 187.92

724.30 640.15 54.00 2446.98 2323.04

36.78 32.10 32.12 137.64 115.10

539.49 458.66 56.86 2277.00 2237.43

598.92 546.67 35.60 2291.09 2099.21

791.50 680.96 77.80 3298.56 325]

资料来源:《安徽省统计年鉴2009》

M=mean(A); % 计算各指标(即各列)均值, MD=median(A); % 计算各指标中位数

SM=[0.25,0.5,0.25]*prctile(A,[25,50,75]); % 计算各指标三均值

[M;MD;SM] % 输出计算结果

%计算结果为

ans =

1.0e+003 *

0.2709 0.2406 0.0269 1.0806 0.9543

0.1485 0.1455 0.0171 0.8421 0.5912

0.2258 0.2050 0.0205 1.0516 0.8344

2.根据2007年华东各地区高校教职工数据计算专任教师、行政人员、教辅人员以及工勤人员占在职教工的百分比,该百分比的极差、四分位极差以及上、下截断点。

地区在职教工专任教师行政人员教辅人员工勤人员

上海61385 35480 10282 7842 7781

江苏134215 88568 20172 13371 12104

浙江67763 45622 10960 6798 4383

安徽59149 40743 7278 5763 5365

福建47864 31385 7712 5034 3733

江西63392 45153 8179 5495 4565

山东120996 81889 16342 11614 11151

clear

A=[61385 35480 10282 7842 7781

134215 88568 20172 13371 12104

67763 45622 10960 6798 4383

59149 40743 7278 5763 5365

47864 31385 7712 5034 3733

63392 45153 8179 5495 4565

120996 81889 16342 11614 11151

];

B=A(:,2:5)./[A(:,1)*ones(1,4)]; % 计算百分比

R=range(B); % 计算百分比极差

R1=iqr(B); % 计算四分位极差

XJ=prctile(B,[25])-1.5*R1; % 计算下截断点

SJ=prctile(B,[75])+1.5*R1; % 计算上截断点

B =

0.5780 0.1675 0.1278 0.1268

0.6599 0.1503 0.0996 0.0902

0.6733 0.1617 0.1003 0.0647

0.6888 0.1230 0.0974 0.0907

0.6557 0.1611 0.1052 0.0780

0.7123 0.1290 0.0867 0.0720

0.6768 0.1351 0.0960 0.0922

R =

0.1343 0.0445 0.0411 0.0621

R1 =

0.0291 0.0311 0.0076 0.0183

XJ =

0.6132 0.0840 0.0849 0.0461

SJ =

0.7294 0.2082 0.1154 0.1192

3.随机生成150个服从标准正态分布随机数,将这些数据作为样本数据,分别作出样本数据的柱形图、直方图、阶梯图、火柴棒图等图形。

clear

x= random('normal',0,1,[1,150]); %产生服从标准正态分布随机数150个

bar(x) %作柱形图

hist(x) %作直方图

stairs(x) %作阶梯图

stem(x) %作火柴棒图

4.生成服从标准正态分布的50个样本点,作出样本的经验分布函数图,并与理论分布函数比较. clear

X=normrnd (0,1,50,1); %生成服从标准正态分布的50个样本点 [h,stats]=cdfplot(X); %作样本的经验分布函数图 hold on

plot(-3:0.01:3, normcdf(-3:0.01:3,0,1),'r') %作理论分布函数图

三、实习题

1.已知样本数据为

1,3,4,2,9,6,7,8,11,2.5,3,10

(1)求该数据的中位数; (2)求该数据的顺序统计量;

(3)写出上述计算的MA TLAB 实现程序。

2.利用MATLAB 软件生成均值向量为(3,2),协方差矩阵为??

?

???45.15.11的二元正态分布

的随机数,并给出散点图以及密度函数曲面图的程序。

实习三回归分析

一、实验目的

掌握MATLAB回归分析的方法与计算步骤。

二、实例

1.近10年来,某市社会商品零售总额与职工工资总额(单位:亿元)数据如下表3.1。

工资总额23.8 27.6 31.6 32.4 33.7 34.9 43.2 52.8 63.8 73.4

零售总额41.4 51.8 61.7 67.9 68.7 77.5 95.9 137.4 155.0 175.0

建立社会商品零售总额与职工工资总额数据的回归模型.

clear

x=[23.80,27.60,31.60,32.40,33.70,34.90,43.20,52.80,63.80,73.40];

y=[41.4,51.8,61.70,67.90,68.70,77.50,95.90,137.40,155.0,175.0];

% 然后作散点图

plot(x,y,'*') %作散点图

xlabel('x(职工工资总额)') %横坐标名

ylabel('y(商品零售总额)') %纵坐标名

% 计算最佳参数

Lxx=sum((x-mean(x)).^2);

Lxy=sum((x-mean(x)).* (y-mean(y)));

b1=Lxy/Lxx

b0=mean(y)-b1*mean(x)

%给出例3.1.1解法的另一程序。

%p=polyfit(x,y,1) %注意取n=1

2.为了分析X射线的杀菌作用,用200千伏的X射线来照射细菌,每次照射6分钟用平板计数法估计尚存活的细菌数,照射次数记为t,照射后的细菌数y如表

3.2所示。

t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

y 352 211 197 160 142 106 104 60 56 38 36 32 21 19 15

数据来源:http//https://www.sodocs.net/doc/3211686029.html,/~hadi/RABE

试求:①给出y与t的二次函数回归模型;

②在同一坐标系内做出原始数据与拟合结果的散点图

③预测t=16时残留的细菌数;

④根据问题实际意义选择多项式函数是否合适?

clear

% 输入原始数据

t=1:15;

y=[352,211,197,160,142,106,104,60,56,38,36,32,21,19,15];

% 作二次多项式回归

p=polyfit(t,y,2);

% 模型估计与作图

y1= polyval(p,t);

plot(t,y,'-*',t,y1,'-o');

legend('原始数据','二次函数')

xlabel('t(照射次数)')

ylabel('y(残留细菌数)')

% 预测t0=16时残留的细菌数

t0=16;

yc1= polyconf(p,t0)

yc1 =

39.0396

polytool(t,y,2)

3.炼钢厂出钢时所用盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增大,我们

希望找出使用次数与增大容积之间的函数关系.实验数据如表3.3。

(1)建立非线性回归模型1/y=a+b/x;

(2)预测钢包使用x0=17次后增大的容积y0;

(3)计算回归模型参数的95%的置信区间。

clear

x=[2:16];

y=[6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,10.59,10.6,10.8,10.6,10.9,10.76];

%画散点图以确定选用图2-4曲线拟合

%plot(x,y) %从图形看建立非线性双曲线回归模型

b0=[0.084,0.1436]; % 初始参数值

fun=inline('x./(b(1)*x+b(2))','b','x');

[beta,r,J]=nlinfit(x,y,fun,b0);

beta % 输出最佳参数

y1=x./(0.0845*x+0.1152); % 拟合曲线

% figur(2)

plot(x,y,'*',x,y1,'-or')

legend('原始数据','拟合曲线')

%求a,b值

%[a,b]=solve('6.42*(2*a+b)=2','10.76*(16*a+b)=16')

%预测钢包使用17次后增大的容积,可在执行上面的程序中,继续输入命令

%ypred=nlpredci(fun,17,beta,r,J)

%求回归模型参数的95%的置信区间,只要继续添加程序

%ci = nlparci(beta,r,J)

4.某销售公司将库存占用资金情况、广告投入的费用、员工薪酬以及销售额等方面的数据作了汇总见表3.4。该公司试图根据这些数据找到销售额与其他变量之间的关系,以便进行销售额预测并为工作决策提供参考依据。(1)建立销售额的回归模型;(2)如果未来某月库存资金额为150万元,广告投入预算为45万元,员工薪酬总额为27万元,试根据建立的回

归模型预测该月的销售额。

clear

A=[75.2 30.6 21.1 1090.4 77.6 31.3 21.4 1133 80.7 33.9 22.9 1242.1 76 29.6 21.4 1003.2 79.5 32.5 21.5 1283.2 81.8 27.9 21.7 1012.2 98.3 24.8 21.5 1098.8 67.7 23.6 21 826.3 74 33.9 22.4 1003.3 151 27.7 24.7 1554.6 90.8 45.5 23.2 1199 102.3 42.6 24.3 1483.1 115.6 40 23.1 1407.1 125 45.8 29.1 1551.3 137.8 51.7 24.6 1601.2 175.6 67.2 27.5 2311.7 155.2 65 26.5 2126.7 174.3 65.4 26.8 2256.5]; [m,n]=size(A);

subplot(3,1,1),plot(A(:,1),A(:,4),'+'), xlabel('x1(库存资金额)')

ylabel('y(销售额)')

subplot(3,1,2),plot(A(:,2),A(:,4),'*'), xlabel('x2(广告投入)')

ylabel('y(销售额)')

subplot(3,1,3),plot(A(:,3),A(:,4),'x'), xlabel('x3(员工薪酬)')

ylabel('y(销售额)')

% 调用命令regress 建立三元线性回归模型 x=[ones(m,1), A(:,1), A(:,2), A(:,3)]; y=A(:,4)

[b,bint,r,rint,stats]=regress(y,x);

b,bint,stats, % 输出结果 %残差与置信区间图 %rcoplot(r,rint)

三、实习题

(1)求经验回归方程x y 1

0???ββ+=。 (2)检验线性关系的显著性(α=0.05,采用F 检验)。

2.某省1978-1989消费费基金、国民收入使用额为67(十亿元),平均人口为58(百万人),当显著性水平=0.05时,试估计1990年消费基金的预测区间。

实习四判别分析

一、实验目的

掌握MATLAB判别分析的方法与计算步骤。

二、实例

1.蠓是一种昆虫,分为很多类型,其中有一种名为Af,是能传播花粉的益虫;另一种名为Apf,是会传播疾病的害虫,这两种类型的蠓在形态上十分相似,很难区别。现测得6只Apf和9只Af蠓虫的触角长度和翅膀长度数据Apf:(1.14,1.78), (1.18,1.96), (1.20,1.86), (1.26,

2.00), (1.28,2.00), (1.30,1.96) ;Af:(1.24,1.72), (1.36,1.74), (1.38,1.64), (1.38,1.82), (1.38,1.90), (1.40,1.70), (1.48,1.82),(1.54,1.82), (1.56,2.08).

若两类蠓虫协方差矩阵相等,试判别以下的三个蠓虫属于哪一类?

(1.24,1.8),(1.28,1.84),(1.4,2.04)

%方法一

clear

apf=[1.14,1.78;1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96]; %总体apf

af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08];

%总体af

x=[1.24,1.8;1.28,1.84; 1.4,2.04]; % 输入原始待判数据

n1=size(apf,1); %总体apf的样本容量

n2=size(af,1); %总体af的样本容量

m1=mean(apf); %总体apf 的均值向量

m2=mean(af); %总体af 的均值向量

s1=cov(apf); %总体apf 的协方差

s2=cov(af); %总体af 的协方差

s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2); %计算样本均值与协方差矩阵

for i=1:3

W(i)=(x(i,:)-1/2*(m1+m2))*inv(s)*(m1-m2)'; % 计算判别函数值

end

输出结果为:

W =

2.1640 1.3568 1.9802

%方法二

clear

apf=[1.14,1.78;1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96]; %总体apf

af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08];

%总体af

training=[apf;af]; %合并两个总体形成训练集

n1=size(apf,1); %总体apf中样本的行数

n2=size(af,1); %总体af中样本的行数

group=[ones(1,n1), 2*ones(1,n2)]; %apf中样本与af中样本类属

x=[1.24,1.8;1.28,1.84; 1.4,2.04]; % 输入原始待判数据即sample

class = classify(x, training,group) %判别分析

输出结果为:

class=

1

1

1

2.假定两类总体的协方差矩阵不相等,重新判别上述三个蠓虫的类别。

clear

apf=[1.14,1.78; 1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96];

af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08];

x=[1.24,1.8;1.28,1.84;1.4,2.04]; % 输入原始数据

W=mahal(x,apf)-mahal(x,af) % 计算判别函数值

输出结果为:

W =

1.7611

3.8812

3.6468

3.已知矩阵A给出的身体指标化验数据,对三个待判数(190,67,30,17),(315,100,35,19),(240,60,37,18)进行判别归类.

clear

A=[260 75 40 18 310 122 30 21 320 64 39 17

200 72 34 17 310 60 35 18 260 59 37 11

240 87 45 18 190 40 27 15 360 88 28 26

170 65 39 17 225 65 34 16 295 100 36 12

270 110 39 24 170 65 37 16 270 65 32 21

205 130 34 23 210 82 31 17 380 114 36 21

190 69 27 15 280 67 37 18 240 55 42 10

200 46 45 15 210 38 36 17 260 55 34 20

250 117 21 20 280 65 30 23 260 110 29 20

200 107 28 20 200 76 40 17 295 73 33 21

225 130 36 11 200 76 39 20 240 114 38 18

210 125 26 17 280 94 26 11 310 103 32 18

170 64 31 14 190 60 33 17 330 112 21 11

270 76 33 13 295 55 30 16 345 127 24 20

190 60 34 16 270 125 24 21 250 62 22 16

280 81 20 18 280 120 32 18 260 59 21 19

310 119 25 15 240 62 32 20 225 100 34 30

270 57 31 8 280 69 29 20 345 120 36 18

250 67 31 14 370 70 30 20 360 107 25 23

260 135 39 29 280 40 37 17 250 117 36 16

];

G1=A(:,1:4);G2=A(:,5:8);G3=A(:,9:12); %三类总体数据

x=[190 67 30 17;315 100 35 19;240 60 37 18]; %待判定的数据

m(1,:)=mean(G1);m(2,:)=mean(G2);m(3,:)=mean(G3);

s1=cov(G1);s2=cov(G2);s3=cov(G3); % 计算样本均值与协方差矩阵

s=19*(s1+s2+s3)/57; % 计算混合样本方差 for i=1:3 for j=1:3 for k=1:3

w(j,k)=(x(i,:)-1/2*(m(j,:)+m(k,:)))*inv(s)*(m(j,:)-m(k,:))'; %计算判别函数 if w(j,k)<0 q=0;break; else q=1; end end if q==1 y(i)=j; end end end y

输出结果为: y =

1 3

2 三、实习题

1.已知T x x X ),(21=服从二维正态分布),(∑μN ,其中???? ??=00μ,???

?

?

?=∑19

.09.01

,试分别求点T

A )1,1(=和T

B )1,1(-=到总体均值的马氏距离和欧氏距离,并论述马氏距离的合理性。

求:(1)计算两总体的样本均值向量()

1x 、()

2x

和样本协方差矩阵1S 、2S ;

(2)假定两总体的协方差矩阵相等,记为∑,用1S 、2S 联合估计∑; (3)建立距离判别法的判别准则; (4)设有一样品()7,20=x ,判别其归属。

实习五主成分分析和典型相关分析

一、实验目的

1.掌握MATLAB主成分析的方法与计算步骤。

2.了解MATLAB典型相关分析的方法与计算步骤。

二、实例

1.设随机向量的协方差矩阵为S=[2,2,-2;2,5,-4;-2,-4,5]。求X的各主成份以及各主成份的贡献率。

clear

S=[2,2,-2;2,5,-4;-2,-4,5]; %S表示总体的协方差矩阵

[PC,vary,explained]=pcacov(S) %总体主成分分析

PC=

-0.3333 0 0.9428

-0.6667 0.7071 -0.2357

0.6667 0.7071 0.2357

vary=

10.0000

1.0000

1.0000

explained=

83.3333

8.3333

8.3333

2.根据调查分析,影响我国粮食安全生产的主要因素有以下几个方面:有效灌溉面积,粮食播种面积,成灾面积,财政投入,农业劳动力,农村用电量,农业机械总动力及农业化肥施用量,具体数据如矩阵X所示。

由于各个指标的单位不同,且各指标的方差相差很大,所以首先对样本数据进行无量纲的变换,变换方法是用采用标准化方法。然后对标准化的样本数据进行主成份

分析。

clear

X=[4740.31 11346.60 178.20 221.76 33336.00 844.50 28707.70 647.58 4782.21 11231.40 278.10 243.55 34186.30 963.20 29388.60 701.28

4859.01 11056.00 259.00 269.04 34037.00 1106.90 30308.40 732.55

4872.79 11050.90 231.30 323.42 33258.20 1244.80 31816.60 787.98

4875.91 10854.40 313.80 399.70 32690.30 1473.90 33802.50 829.53

4928.12 11006.00 222.70 430.22 32335.00 1655.70 36118.10 898.40

5038.14 11254.80 212.30 510.07 32260.40 1812.70 38546.90 957.00

5123.85 11291.20 303.10 560.77 32434.90 1980.10 42015.60 995.23

5229.56 11378.70 251.80 626.02 32626.40 2042.10 45207.70 1020.88

5315.80 11316.10 267.30 677.46 32911.80 2173.40 48996.10 1031.08

5382.00 10846.30 343.70 766.89 32798.00 2421.30 52573.60 1036.63

5424.90 10608.00 317.90 917.96 32451.00 2610.80 55172.10 1063.28

5435.50 10389.10 271.60 1102.70 31991.00 2993.40 57929.90 1083.08

5401.42 9941.00 325.20 1134.86 31259.60 3432.90 60386.50 1102.90 5447.80 10160.60 163.00 1693.79 30596.00 3933.00 64027.90 1157.30 5502.93 10427.80 199.70 1792.40 29975.50 4375.70 68397.80 1191.45 5575.05 10495.80 246.30 2161.35 28886.35 4895.80 72522.10 1231.90 5651.83 10563.80 250.60 3404.70 22543.4 5509.90 76589.60 1276.70

5847.17 10679.30 222.80 4544.01 20078.6 5713.20 82190.41 1309.19];

%数据无量纲化

X1=zscore(X); %按公式(5.14)对样本数据标准化

%主成份分析

[pc,la,tent]=princomp(X1) %主成份分析,pc是特征向量矩阵,la得分矩阵,tent特征值tents=sum(tent) %特征值总和

gxl= tent/ tents %各个主成份贡献率

pc =

0.3933 -0.1518 -0.0544 0.3944 0.5494 0.3701 -0.1396 0.4533

-0.2821 0.3173 -0.7669 0.4403 0.0325 -0.1907 -0.0141 -0.0121 -0.0479 -0.8701 -0.4379 -0.1998 -0.0337 -0.0838 0.0257 -0.0115

0.3856 0.1952 -0.2572 -0.3364 0.2998 0.0210 0.7181 -0.1668

-0.3605 -0.2487 0.3850 0.4799 0.2640 -0.3102 0.5109 -0.0512

0.4083 0.0358 0.0265 -0.0014 -0.2123 -0.7233 0.0088 0.5128

0.4070 -0.0643 0.0422 0.1814 0.2707 -0.3433 -0.3636 -0.6872

0.3905 -0.1175 -0.0151 0.4841 -0.6466 0.2861 0.2659 -0.1692 tent =

5.9106

1.1327

0.6118

0.2842

0.0347

0.0216

0.0039

0.0005

gxl =

0.7388

0.1416

0.0765

0.0355

0.0043

0.0027

0.0005

0.0001

3.主成分分析用于分类.做出蠓虫原始数据图与主成分得分数据图。

clear

apf=[1.14,1.78;1.18,1.96;1.20,1.86;1.26,2.;1.28,2;1.30,1.96];

af=[1.24,1.72;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48,1.82;1.54,1.82;1.56,2.08]; x=[1.24,1.8;1.28,1.84; 1.4,2.04]; % 输入原始数据

subplot(2,1,1)

plot(apf(:,1),apf(:,2),'*',af(:,1),af(:,2),'or',x(:,1),x(:,2),'p') % 原始数据图形

[c1,s1,l1,t1]=princomp([apf;af;x]); % 计算主成分得分s1

subplot(2,1,2),

plot(1:6,s1(1:6,2),'*')

hold on

plot(7:15,s1(7:15,2),'or')

hold on

plot(16:18,s1(16:18,2),'p')

legend('apf','af','x') % 主成分得分图形

hold on

plot(0:18,0*ones(1,19),'-')

4.某康复俱乐部对20名中年人测量了三项生理指标:体重(weight )、腰围(waist )、脉搏(pulse)和三项训练指标:引体向上(chins )、起坐次数(situps )、跳跃次数(jumps )。其数据列于表

5.1。试分析这两组变量间的相关性。

Obs weight waist pulse chins situps jumps

1 191 36 50 5 16

2 60

2 189 37 52 2 110 60

3 193 38 58 12 101 101

4 162 3

5 62 12 105 37

5 189 35 4

6 13 155 58

6 182 36 56 4 101 42

7 211 38 56 8 101 38

8 167 34 60 6 125 40

9 176 31 74 15 200 40

10 154 33 56 17 251 250

11 169 34 50 17 120 38

12 166 33 52 13 210 115

13 154 34 64 14 215 105

14 247 46 50 1 50 50

15 193 36 46 6 70 31

16 202 37 62 12 210 120

17 176 37 54 4 60 25

18 157 32 52 11 230 80 19 156 33 54 15 225 73 20 138 33 68 2 110 43

clear

DATA=[191 36 50 5 162 60 189 37 52 2 110 60 193 38 58 12 101 101 162 35 62 12 105 37 189 35 46 13 155 58 182 36 56 4 101 42 211 38 56 8 101 38 167 34 60 6 125 40 176 31 74 15 200 40 154 33 56 17 251 250 169 34 50 17 120 38 166 33 52 13 210 115 154 34 64 14 215 105 247 46 50 1 50 50 193 36 46 6 70 31 202 37 62 12 210 120 176 37 54 4 60 25 157 32 52 11 230 80 156 33 54 15 225 73 138 33 68 2 110 43];

X=DATA(:,1:3); %第一组向量观测值 Y=DATA(:,4:6); %第二组向量观测值 [A,B,r,U,V,stats] = canoncorr(X,Y) A=

-0.0314 -0.0763 0.0077 0.4932 0.3687 -0.1580 -0.0082 -0.0321 -0.1457 B=

-0.0661 -0.0710 0.2453 -0.0168 0.0020 -0.0198 0.0140 0.0207 0.0082 r=

0.7956 0.2006 0.0726 三、实习题

1.设随机向量X=(X 1,X 2,X 3)T 的协方差与相关系数矩阵分别为

???? ??=∑25441,???

?

??=18.08.01R

分别从∑,R 出发,求X 的各主成分以及各主成分的贡贡率并比较差异况。

实训指导书4.3进货数据分析图表

实训指导书4.3进货数据分析图表 【实训目的】 掌握使用数据透视表对进货数据按商品进行分析的方法;掌握使用图形对进货数据进行分析的方法。 【实训内容】 任务1:使用数据透视表对进货数据按商品进行分析 任务2:使用图形对进货数据进行分析 【实训资料】 山东海弘家纺股份有限公司进货数据分析图表资料如下: 任务1:使用数据透视表对进货数据按商品进行分析 山东海弘家纺股份有限公司2017年8月对进货数据进行分析,请根据采购业务表相关资料,完成使用数据透视表对进货数据按商品进行分析的操作。 采购业务表资料: 任务2:使用图形对进货数据进行分析 山东海弘家纺股份有限公司需要使用图形对进货数据进行分析,根据任务一所完成的数据透视表,完成使用图形对进货数据进行分析的操作。

【实训准备】 准备实训素材、教学素材、任务单、实训室、2016版office软件 【实训要求】 根据任务要求,完成以上任务操作。 【操作步骤】 任务1:使用数据透视表对进货数据按商品进行分析 ※操作指导 1-1使用数据透视表对进货数据按商品进行分析 (1)新建工作表 打开“进销存管理”工作簿,单击按钮,新建一张工作表,然后将该工作表重命名为“商品进货分析”。 (2)输入标题 选择区域A1:E1,转到“开始”选项卡,在“对齐方式”功能组中单击按钮 ,合并该区域,在该区域内输入“商品进货分析”,在“字体功能组”中设置字体为“微软雅黑”,字号为“20”,在“单元格”功能组中单击“格 式”按钮的行高,设置行高为“40”。点击按钮,选择双底框线,选中区域A1:E1,右击选择设置单元格格式,点击填充按钮,选择图案颜色,图案样式,点击确定。 (3)输入日期 选择区域A2:E2,合并并居中。输入“2017-08”,设置字体为“Arial”,字号为“12”,行高为“20”。然后选择区域A2:E2,右击,点击“设置单元格格式”选项,在“设置单元格格式”对话框中点击“数字”按钮,在“分类”列表框中选择“日期”,在“类型”列表框中选择“2012年3月”格式,单击“确定”按钮,关闭对话框,即完成对日期格式的设置,日期显示为“2017年8月”。 (4)创建数据透视表 选择单元格A3,在“插入”选项卡中选择“表格”功能组中的“数据透视表”按钮,弹出“创建数据透视表”对话框,在“请选择要分析的数据”中勾选

数据分析实验报告

数据分析实验报告 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出: 统计量 全国居民 农村居民 城镇居民 N 有效 22 22 22 缺失 均值 1116.82 747.86 2336.41 中值 727.50 530.50 1499.50 方差 1031026.918 399673.838 4536136.444 百分位数 25 304.25 239.75 596.25 50 727.50 530.50 1499.50 75 1893.50 1197.00 4136.75 3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 数据分析实验报告 【最新资料,WORD 文档,可编辑修改】

2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验

结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2 )W 检验 结果:在Shapiro-Wilk 检验结果972.00 w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5 5 多维正态数据的统计量 数据:

《数学建模与数学实验》本科教学日历

《数学建模与数学实验》本科教学日历 数学建模部分 开设课程课程名称数学建模课程编号0701107 施教单位理学院 课内学时 总课时36 课程性质公共基础讲授课时28 修读要求选修实践课时8 选用教材教材名称数学建模教程出版社名称高等教育出版社 出版时间 及版次 2011年出版,第一版印刷时间2011年 其他情况 教学安排 班次授课对象及人数任教教员(指导教员)姓名及职称数学建模A 各专业本科学员 吴孟达教授 段晓君教授 毛紫阳讲师 王丹讲师 数学建模B 各专业本科学员 吴孟达教授 段晓君教授 毛紫阳讲师 王丹讲师 课次节 次 授课内容 教学 方法 采用现代化教学手段(课时) 多媒体电教双语网络实验 1 1 (1)什么是数学建模?数学建模的一般概念 (2)几个数学建模问题 讲授 1 2 (1)数学建模的一般步骤 (2)敏感问题调查案例 讲授 1 2 3 (1)行走步长问题 (2)雨中行走淋雨量最小问题 (3)道路是越多越通畅吗? 讲授 1 4 (1)有奖销售的抽奖策略问题 (2)“非诚勿扰”女生最佳选择问题 (3)网络文章流行度预测和招聘匹配 讲授 1 3 5 (1)线性规划模型基本概念 (2)整数规划模型 (3)0-1规划模型 讲授 1 6 (1)非线性规划 (2)多目标规划 讲授 1 4 7 (1)最短路算法 (2)最小生成树算法 讲授 1 8 (1)最大流算法 (2)PageRank算法 讲授 1 5 9 规划模型上机实践实践 1

课次节 次 授课内容 教学 方法 采用现代化教学手段(课时) 多媒体电教双语网络实验10 图论模型上机实践实践 1 6 11 (1)博弈模型基本概念 (2)Nash平衡和Pareto最优 (3)博弈论案例 讲授 1 12 (1)贝叶斯纳什均衡 (2)拍卖模型 讲授 1 7 13 社会选择理论中的选举问题数学模型-阿罗不可能定理讲授 1 14 越野长袍团体赛排名规则公平性问题讲授 1 8 15 军事作战模型-Lanchester作战模型讲授 1 16 自动化车床管理模型讲授 1 9 17 (1)“边际效应”基本概念 (2)实物交换模型,最佳消费模型、报童售报问题 讲授 1 18 (1)价格弹性模型 (2)合作效益的Shapley值分配模型 讲授 1 10 19 (1)聚类分析基本概念 (2)常用聚类算法 讲授 1 20 (1)方差分析基本概念 (2)单因素方差分析 (3)双因素方差分析 讲授 1 11 21 (1)主成分分析基本概念 (2)因子分析 讲授 1 22 (1)一元回归分析 (2)多元回归分析 (3)多元回归模型的检验与优化 讲授 1 12 23 聚类分析和方差分析上机实践实践 1 24 主成分分析和多元回归分析上机实践实践 1 13 25 (1)遗传算法基本思想 (2)算法步骤 讲授 1 26 遗传算法计算实例讲授 1 14 27 (1)模拟退火算法基本思想 (2)算法步骤 讲授 1 28 模拟退火算法计算实例讲授 1 15 29 (1)蚁群算法基本思想 (2)算法步骤 讲授 1 30 (1)数学建模中的计算机仿真 (2)不可召回的秘书招聘问题 (3)车灯光源优化设计 (4)生命游戏 讲授 1 16 31 遗传算法上机实践实践 1 32 模拟退火算法上机实践实践 1

统计与统计分析实验指导书

统计与统计分析实验指导书 【试验目的】 通过实验教学,使学生验证并加深理解和巩固课堂教学内容,掌握常用统计分析方法在Excel和SPSS中的实现,更好的理解和掌握统计分析方法的应用原理、基本条件、实现步骤、结果的内涵等问题。通过实验,使学生能够结合具体任务和条件对社会经济问题进行初步的调查研究,结合自己的专业,在定性分析基础上做好定量分析,提高学生的科研能力和解决实际问题的能力,以适应社会主义市场经济中各类问题的实证研究、科学决策和经济管理的需要。 【试验内容】 Excel和SPSS中的统计分析功能,包括: 1、数据的整理与显示,包括数据的排序与筛选、数据透视表与分类汇总、制作频数分布表和绘制各种统计图。计算描述统计量,选择适合的描述统计量反映统计数据的集中和离中趋势。 2、SPSS的参数检验,包括单样本的T检验,两独立样本的T检验及配对样本的T检验。 3、SPSS的方差分析。 4、相关与回归分析,包括Excel及SPSS中相关系数的计算、一元线性回归的基本方法、同时了解各种检验指标的给出、线性拟合图的制作等问题。 【实验要求】 1、按学校要求的试验报告格式打印。 2、用WORD文档输出,宋体,5号。 实验一、数据的整理与描述性统计分析 1.1 实验介绍 统计分析工作是以通过实验或调查收集到数据为起点的,有了统计数据之后,首先要对获取的数据进行系统化、条理化地整理,以提取有用的信息。我们如何能知道其中所包含的信息它们有哪些特点呢,要回答这样的问题,就要

先粗略了解数据的基本特点,考虑到数据的代表值,数据的分散程度以及数据的分布形态就需要对数据进行整理,并以恰当的方式进行呈现。方法之一就是统计分组,即根据被研究对象的特征和统计研究的目的,将所得数据进行适当的分组或分类。统计分组最常用的方式就是编制数据次数分布,它可以是任何形式的数据分组或分类;通常用图表的形式呈现出来,即次数分布表和次数分布图。面对数据可以通过基本的统计量来刻画数值结果,而通过次数分布表或次数分布图来直观地了解这些信息。 1.2 实验目的 分别掌握SPSS和EXCEL进行数据整理和显示,并利用描述统计分析的功能,能计算给定数据集的平均数等集中趋势指标和方差等变异指标;并能绘制统计图表。 1.3 实验内容 1) 使用EXCEL进行数据整理和显示及进行描述统计分析 (1) 描述统计 (2) 频次分析 2) 使用SPSS进行描述统计 (1) 描述统计 (2) 频次分析 1.4 实验准备 电脑、SPSS 11.0 1数据分析工具。 实验1:

实验指导书 实验二_SolidWorks建模1

实验二 SolidWorks 草绘特征和放置特征操作(一) 一、 实验目的 1. 掌握基本零件建模的一般步骤和方法 2. 掌握SolidWorks 草绘特征:拉伸凸台、拉伸切除、旋转凸台、旋转切除、扫描、 放样的操作方法。 3. 掌握放置(应用)特征:钻孔特征、倒角特征、圆角特征、抽壳特征、拔模斜度特 征、筋的操作方法 二、 实验内容 完成下列下列零件造型 三、 实验步骤 1. 连接件设计 完成如图 1 (1) (2) 2 所示。 图 1连接件 图 2草图 (3) 单击【拉伸凸台/ 框内选择【两侧对称】选项,在【深度】文本框内输入“54mm ”,单击【确定】按钮,如图 3所示。 图 3 “拉伸”特征 (4) 120°”,然后 在第二参考中选择图形的一条下边线。单击【确定】按钮,建立新基准面,如

错误!未找到引用源。所示。 (5) 1,选择“反转法线” 1,单选择 4所示。 图4草图 图4建立基准面 底面边线

(6) 单击【拉伸凸台/ 列表框内选择【给定深度】选项,在【深度】文本框内输入“12mm”,单击【确定】按钮,如图5所示。 图5“拉伸”特征 (7)选取基体上表面,单击【草图绘制】进入草图绘制,使用中心线工具在 上表面的中心位置绘制直线,注意不要捕捉到表面边线,如图6所示。 图 6 中心线 (8) 内输入“8mm”,在图形区域选择中心线,在属性管理器中选中【添加尺寸】、【选择链】、【双向】和【顶端加盖】复选框,选中【圆弧】单选按钮,单击【确定】按钮,标注尺寸,完成草图,如图7所示。 运用“等距实体”绘制草图 (8) -拉伸】属性管理器,在【终止条件】下拉 列表框内选择【完全贯穿】选项,单击【确定】按钮,如图8所示。

数学建模与数学实验习题

数学建模与数学实验课程总结与练习内容总结 第一章 1.简述数学建模的一般步骤。 2.简述数学建模的分类方法。 3.简述数学模型与建模过程的特点。 第二章 4.抢渡长江模型的前3问。 5.补充的输油管道优化设计。 6.非线性方程(组)求近似根方法。 第三章 7.层次结构模型的构造。 8.成对比较矩阵的一致性分析。 第五章 9.曲线拟合法与最小二乘法。 10 分段插值法。 第六章 11 指数模型及LOGISTIC模型的求解与性质。 12.VOLTERRA模型在相平面上求解及周期平均值。 13 差分方程(组)的平衡点及稳定性。 14 一阶差分方程求解。 15 养老保险模型。

16 金融公司支付基金的流动。 17 LESLLIE 模型。 18 泛函极值的欧拉方法。 19 最短路问题的邻接矩阵。 20 最优化问题的一般数学描述。 21 马尔科夫过程的平衡点。 22 零件的预防性更换。 练习集锦 1. 在层次分析法建模中,我们介绍了成对比较矩阵概念,已知矩阵P 是成对比较矩阵 31/52a b P c d e f ?? ??=?????? ,(1)确定矩阵P 的未知元素。 (2)求 P 模最大特征值。 (3)分析矩阵P 的一致性是否可以接受(随机一致性指标RI取0.58)。 2. 在层次分析法建模中,我们介绍了成对比较矩阵概念,已知矩阵P 是三阶成对比较矩阵 322P ? ???=?????? ,(1)将矩阵P 元素补全。 (2)求P 模最 大特征值。 (3)分析矩阵P 的一致性是否可以接受。 3.考虑下表数据

(1)用曲改直的思想确定经验公式形式。 (2)用最小二乘法确定经验公式系数。 4.. 考虑微分方程 (0.2)0.0001(0.4)0.00001dx x xy dt dy y xy dt εε?=--????=-++?? (1)在像平面上解此微分方程组。(2)计算0ε=时的周期平均值。(3)计算0.1ε=时,y 的周期平均值占总量的周期平均值的比例增加了多少? 5考虑种群增长模型 '()(1/1000),(0)200x t kx x x =-= (1)求种群量增长最快的时刻。(2)根据下表数据估计参数k 值。 6. 布均匀,若环保部门及时发现并从某时刻起切断污染源,并更新湖水(此处更新指用新鲜水替换污染水),设湖水更新速率是 3 (m r s 单位:)。 (1) 试建立湖中污染物浓度随时间下降的数学模型? 求出污染物浓度降为控制前的5%所需要的时间。 7. 假如保险公司请你帮他们设计一个险种:35岁起保,每月交费400元,60岁开始领取养老金,每月养老金标准为3600元,请估算该保险费月利率为多少(保留到小数点后5位)? 8. 某校共有学生40000人,平时均在学生食堂就餐。该校共有,,A B C 3 个学生食堂。经过近一年的统计观测发现:A 食堂分别有10%,25%的学生经常去B ,C 食堂就餐,B 食堂经常分别有15%,25%的同学去

SAS软件运用实验指导书

数据分析 实验指导书 理学院实验中心数学专业实验室编写

实验一SAS系统的使用 【实验类型】(验证性) 【实验学时】2学时 【实验目的】使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 启动SAS系统,熟悉各个菜单的内容;在编辑窗口、日志窗口、输出窗口之间切换。 2. 建立数据集 表1 Name Sex Math Chinese English Alice f908591 Tom m958784 Jenny f939083 Mike m808580 Fred m848589 Kate f978382 Alex m929091 Cook m757876 Bennie f827984 Hellen f857484 Wincelet f908287 Butt m778179 Geoge m868582 Tod m898484 Chris f898487 Janet f866587 1)通过编辑程序将表1读入数据集sasuser.score; 2)将下面记事本中的数据读入SAS数据集,变量名为code name scale share price: 000096 广聚能源8500 0.059 1000 13.27 000099 中信海直6000 0.028 2000 14.2 000150 ST麦科特12600 -0.003 1500 7.12 000151 中成股份10500 0.026 1300 10.08 000153 新力药业2500 0.056 2000 22.75

3)将下面Excel表格中的数据导入SAS数据集work.gnp; name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53 新疆123.24 38 13.72 4.64 17.77 5.75 4)使用VIEWTABLE格式新建数据集earn,输入如表所示数据Year earn 1981 125000 1982 136000 1983 122350 1984 65200 1985 844600 1986 255000 1987 265000 1988 280000 1989 136000

数学建模习题指导

数学建模习题指导 第一章 初等模型 讨论与思考 讨论题1 大小包装问题 在超市购物时你注意到大包装商品比小包装商品便宜这种现象吗?比如洁银牙膏50g 装的每支1.50元,120g 装的每支3.00元,二者单位重量的价格比是1.2:1,试用比例方法构造模型解释这种现象。 (1)分析商品价格C 与商品重量w 的关系。 (2)给出单位重量价格c 与w 的关系,并解释其实际意义。 提示: 决定商品价格的主要因素:生产成本、包装成本、其他成本。 单价随重量增加而减少 单价的减少随重量增加逐渐降低 思考题2 划艇比赛的成绩 赛艇是一种靠浆手划桨前进的小船,分单人艇、双人艇、四人艇、八人艇四种。各种艇虽大小不同,但形状相似。T.A.McMahon 比较了各种赛艇1964—1970年四次2000m 比赛的最好成绩(包括1964年和1968年两次奥运会和两次世界锦标赛),见下表。建立数学模型解释比赛成绩与浆手数量之间的关系。 各种艇的比赛成绩与规格 γβα++=3 2w w C w w c γβα++=-3 123 431w w c γβ--='-3 2943 4w w c γβ+=''-

第二章 线性代数模型 森林管理问题 森林中的树木每年都要有一批砍伐出售。为了使这片森林不被耗尽且每年都有所收获,每当砍伐一棵树时,应该就地补种一棵幼苗,使森林树木的总数保持不变。被出售的树木,其价值取决于树木的高度。开始时森林中的树木有着不同的高度。我们希望能找到一个方案,在维持收获的前提下,如何砍伐树木,才能使被砍伐的树木获得最大的经济价值。 思考: 试解释为什么模型中求解得到的 为每周平均销售量会略小于模型假设中给出的1。 练习: 将钢琴销售的存贮策略修改为:当周末库存量为0或1时订购,使下周初的库存 达到3架;否则,不订购。建立马氏链模型,计算稳态下失去销售机会的概率和每周的平均销售量。 2.将钢琴销售的存贮策略修改为:当周末库存量为0时订购本周销售量加2架;否则,不订购。建立马氏链模型,计算稳态下失去销售机会的概率和每周的平均销售量。 第三章 优化模型 讨论题 1)最优下料问题 用已知尺寸的矩形板材加工半径一定的圆盘。给出几种加工排列方法,比较出最优下料方案。 2)广告促销竞争问题 甲乙两公司通过广告竞争销售商品,广告费分别为 x 和 y 。设甲乙公司商品的售量在两公司总售量中所占份额是它们的广告费在总广告费中所占份额的函数 又设公司的收入与售量成正比,从收入中扣除广告费后即为公司的利润。试构造模型的图形,并讨论甲公司怎样确定广告费才能使利润最大。 (1)令 (2)写出甲公司的利润表达式 对一定的 y ,使 p (x ) 最大的 x 的最优值应满足什么关系。用图解法确定这个最优值。 练习1 三个家具商店购买办公桌:A 需要30张,B 需要50张,C 需要45张。这些办公桌由两个工厂供应:工厂1生产70张,工厂2生产80张。下表给出了工厂和商店的距离(单位公里) , 857.0=n R ) (),(y x y f y x x f ++的示意图。。画出则)()()(,t f t f t f y x x t 11=-++= 。 )(t p

数据分析实验报告

《数据分析》实验报告 班级:07信计0班学号:姓名:实验日期2010-3-11 实验地点:实验楼505 实验名称:样本数据的特征分析使用软件名称:MATLAB 实验目的1.熟练掌握利用Matlab软件计算均值、方差、协方差、相关系数、标准差与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差; 2.熟练掌握jbtest与lillietest关于一元数据的正态性检验; 3.掌握统计作图方法; 4.掌握多元数据的数字特征与相关矩阵的处理方法; 实验内容安徽省1990-2004年万元工业GDP废气排放量、废水排放量、固体废物排放量以及用于污染治理的投入经费比重见表6.1.1,解决以下问题:表6.1.1废气、废水、固体废物排放量及污染治理的投入经费占GDP比重 年份 万元工业GDP 废气排放量 万元工业GDP 固体物排放量 万元工业GDP废 水排放量 环境污染治理投 资占GDP比重 (立方米)(千克)(吨)(%)1990 104254.40 519.48 441.65 0.18 1991 94415.00 476.97 398.19 0.26 1992 89317.41 119.45 332.14 0.23 1993 63012.42 67.93 203.91 0.20 1994 45435.04 7.86 128.20 0.17 1995 46383.42 12.45 113.39 0.22 1996 39874.19 13.24 87.12 0.15 1997 38412.85 37.97 76.98 0.21 1998 35270.79 45.36 59.68 0.11 1999 35200.76 34.93 60.82 0.15 2000 35848.97 1.82 57.35 0.19 2001 40348.43 1.17 53.06 0.11 2002 40392.96 0.16 50.96 0.12 2003 37237.13 0.05 43.94 0.15 2004 34176.27 0.06 36.90 0.13 1.计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵; 2.计算各指标的偏度、峰度、三均值以及极差; 3.做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox变换以后给出该数据的密度函数; 4.上网查找1990-2004江苏省万元工业GDP废气排放量,安徽省与江苏省是 否服从同样的分布?

数学建模与数学实验试卷及答案

数学建模与数学实验试卷及答案 二、本题10分(写出程序和结果) 蚌埠学院2010—2011学年第二学期 2,x在 [-5 ,5] 区间内的最小值,并作图加以验证。求函数yxe,,,3《数学建模与数学实验》补考试卷答案 f1=inline('x.^2 +exp(-x)-3') 注意事项:1、适用班级:09数学与应用数学本科1,2班 2、本试卷共1页,附答题纸1页。满分100分。 x=fmin(f1,-5,5) 3、考查时间100分钟。 y=f1(x) 4、考查方式:开卷 fplot(f1,[-5,5]) 一、填空:(每空4分,共60分) x = 0.3517,y== -2.1728 123111,,,,, ,,,,三、本题15分(写出程序和结果) 1. 已知,,则A的秩为 3 ,A的特征值为 A,612B,234,,,, ,,,,,215531,,,,,360000xx,,,12,max2.5fxx,,求解:, stxx..250000,,,1212-1.9766 4.4883 + 0.7734i 4.4883 - 0.7734i ,若令 A([1,3],:)= B([2,3],:),则,x,150001,A(2,:)= 6 1 2 ; 解: xxx,,,22,123,model: 2. 的解为 1.25 ,0.25 0.5 ; xxx,,,521,123max=2.5*x1+x2; ,242xxx,,,123,3*x1+x2<=60000; 装订线内不要答题 2*x1+x2<=50000; 3. 将1234521 分解成质因数乘积的命令为_factor(sym(‘1234521’)),

数据结构实验指导书(C语言版)-罗先文

——信息管理系 《数据结构》实验指导书《DATA STRUCTURES》 罗先文 LUOXIANWEN 西南大学信息管理系Iinformation dept. SouthWest University January 24, 2010

写在上机实习之前 上机实践是学生对本门课程所学知识的一种全面、综合的能力训练,是与课堂听讲、自学和练习相辅相成的必不可少的一个教学环节,也是对课堂教学与实践教学效果的一种检验。通常,实习题中的问题比平时的习题复杂得多,也更接近实际。实习着眼于原理与应用的结合,使学生学会如何把书上学到的知识运用于解决实际问题的过程中去,培养从事软件开发设计工作所必需的基本技能;另一方面,能使书上的知识变“活”,起到深化理解和灵活掌握教学内容的目的。平时的练习较偏重于如何编写功能单一的“小”算法,而实习题是软件设计的综合训练,包括问题分析,总体结构设计,用户界面设计,程序设计基本技能和技巧,多人合作,以至一整套软件工程规范的训练和科学作风的培养。此外,还有很重要的一点是:机器是比任何教师都严厉的主考者。 为了达到上述目的,本篇安排了7个主实习单元,各单元的训练重点在于基本的数据结构,而不强调面面俱到。各实习单元与教科书的各章具有紧密的对应关系,在个别实习单元中安排有难度差别不等的多个实习题,以便学生选做。 此外,每个实习题采取了统一的格式,实验目的、实验内容、实验要求、程序实现、程序运行情况和源程序清单等5个部分组成。 在每个实习单元都提供了一个完整的实现代码,仅供同学们参考,绝大多数的同学在上机实习时千万不要机械的照抄本附录所提供的范文。而是应该自己独立的思考和设计你的算法和程序,并争取在规定的时间内如期完成上机工作任务。对于个别成绩较差的同学,实在是没法完成任务的建议你不妨抄一遍附录中的样题,以增强你的感性认识,强化你的实践基础,提高你的实践能力。本附录样题全部用c语言编写,并全部上机调试通过,但由于时间比较仓促,样题中提供的算法和程序并不是最好的算法和程序,相信不少的同学一定有能力设计出更好的算法和程序。随着计算机学科的不断发展,可以使用的语言工具越来越丰富,在本篇中的实习示例还只是应用面向过程的语言进行设计和编写的程序,同样的实习题,读者也可以用面向对象的语言来实现。我们希望实习报告示例能起到一个抛砖引玉的作用,在经过同学们的努力学习和积极使用以后,更多更优良的设计范例能不断涌现。 文中存在的不妥之处,敬请各位不吝赐教!

弹簧-质量-阻尼实验指导书

质量-弹簧-阻尼系统实验教学指导书 北京理工大学机械与车辆学院 2016.3

实验一:单自由度系统数学建模及仿真 1 实验目的 (1)熟悉单自由度质量-弹簧-阻尼系统并进行数学建模; (2)了解MATLAB 软件编程,学习编写系统的仿真代码; (3)进行单自由度系统的仿真动态响应分析。 2 实验原理 单自由度质量-弹簧-阻尼系统,如上图所示。由一个质量为m 的滑块、一个 刚度系数为k 的弹簧和一个阻尼系数为c 的阻尼器组成。系统输入:作用在滑块上的力f (t )。系统输出:滑块的位移x (t )。 建立力学平衡方程: m x c x kx f ??? ++= 变化为二阶系统标准形式: 22f x x x m ζωω?? ? ++= 其中:ω是固有频率,ζ是阻尼比。 ω= 2c m ζω= = 2.1 欠阻尼(ζ<1)情况下,输入f (t )和非零初始状态的响应: ()()sin()))] t t x t t d e ζωττζωττ +∞ --=? -= -+-?

2.2 欠阻尼(ζ<1)情况下,输入f(t)=f0*cos(ω0*t) 和非零初始状态的的响应: 022 3 00 22222 00 222222 2 ()cos(arctan()) 2f [(0)]cos() [()(2)] sin( t t x t t x e k e ζω ζω ζωω ω ωω ζωω ωωζωω - ? - =- - ++ -+ +) 输出振幅和输入振幅的比值:A= 3 动力学仿真 根据数学模型,使用龙格库塔方法ODE45求解,任意输入下响应结果。 仿真代码见附件 4 实验 4.1 固有频率和阻尼实验 (1)将实验台设置为单自由度质量-弹簧-阻尼系统。 (2)关闭电控箱开关。点击setup菜单,选择Control Algorithm,设置选择Continuous Time Control,Ts=0.0042,然后OK。 (3)点击Command菜单,选择Trajectory,选取step,进入set-up,选取Open Loop Step 设置(0)counts, dwell time=3000ms,(1)rep, 然后OK。此步是为了使控制器得到一段时间的数据,并不会驱动电机运动。 (4)点击Data菜单,选择Data Acquisition,设置选取Encoder#1 ,然后OK离开;从Utility菜单中选择Zero Position使编码器归零。 (5)从Command菜单中选择Execute,用手将质量块1移动到2.5cm左右的位置(注意不要使质量块碰触移动限位开关),点击Run, 大约1秒后,放开手使其自由震荡,在数据上传后点击OK。 (6)点击Plotting菜单,选择Setup Plot,选取Encoder #1 Position;然后点击Plotting 菜单,选择Plot Data,则将显示质量块1的自由振动响应曲线。 (7)在得到的自由振动响应曲线图上,选择n个连续的振幅明显的振动周期,计算出这段振动的时间t,由n/t即可得到系统的频率,将Hz转化为rad/sec即为系统的振动频率ω。

数学建模与数学实验课后习题答案

P59 4.学校共1002名学生,237人住在A 宿舍,333人住在B 宿舍,432人住在C 宿舍。学生要组织一个10人的委员会,使用Q 值法分配各宿舍的委员数。 解:设P 表示人数,N 表示要分配的总席位数。i 表示各个宿舍(分别取A,B,C ),i p 表示i 宿舍现有住宿人数,i n 表示i 宿舍分配到的委员席位。 首先,我们先按比例分配委员席位。 A 宿舍为:A n = 365.21002 10237=? B 宿舍为:B n =323.31002 10333=? C 宿舍为:C n =311.4100210432=? 现已分完9人,剩1人用Q 值法分配。 5.93613 22372 =?=A Q 7.92404 33332 =?=B Q 2.93315 44322 =?=C Q 经比较可得,最后一席位应分给A 宿舍。 所以,总的席位分配应为:A 宿舍3个席位,B 宿舍3个席位,C 宿舍4个席位。

商人们怎样安全过河

由上题可求:4个商人,4个随从安全过河的方案。 解:用最多乘两人的船,无法安全过河。所以需要改乘最多三人乘坐的船。 如图所示,图中实线表示为从开始的岸边到河对岸,虚线表示从河对岸回来。商人只需要按照图中的步骤走,即可安全渡河。总共需要9步。

P60 液体在水平等直径的管内流动,设两点的压强差ΔP 与下列变量有关:管径d,ρ,v,l,μ,管壁粗糙度Δ,试求ΔP 的表达式 解:物理量之间的关系写为为()?=?,,,,,μρ?l v d p 。 各个物理量的量纲分别为 []32-=?MT L p ,[]L d =,[]M L 3-=ρ,[]1-=LT v ,[]L l =,[]11--=MT L μ,Δ是一个无量纲量。 ???? ??????-----=?0310100011110010021113173A 其中0=Ay 解得 ()T y 00012111---=, ()T y 00101102--=, ()T y 01003103--=, ()T y 10000004= 所以 l v d 2111---=ρπ,μρπ112--=v ,p v ?=--313ρπ,?=4π 因为()0,,,,,,=??p l v d f μρ与()0,,,4321=ππππF 是等价的,所以ΔP 的表达式为: ()213,ππψρv p =?

数据挖掘试验指导书

《商务数据分析》实验指导书(适用于国际经济与贸易专业) 江西财经大学国际经贸学院 编写人:戴爱明

目录 前言 (1) 实验一、SPSS Clementine 软件功能演练 (5) 实验二、SPSS Clementine 数据可视化 (9) 实验三、决策树C5.0 建模 (17) 实验四、关联规则挖掘 (30) 实验五、聚类分析(异常值检测) (38)

前言 一、课程简介 商务数据分析充分利用数据挖掘技术从大量商务数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD),因此,数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。 数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像与信号处理、空间数据分析等,这里我们强调商务数据分析所处理的是大规模数据,且其算法应是高效的和可扩展的。通过数据分析,可从数据库中挖掘出有意义的知识、规律,或更高层次的信息,并可以从多个角度对其进行浏览察看。所挖掘出的知识可以帮助进行商务决策支持。当前商务数据分析应用主要集中在电信、零售、农业、网络日志、银行等方面。

数学建模实验指导书2011

数学建模实验指导书 数学建模实验项目一 初等模型 一、 实验目的与意义: 1、练习初等问题的建模过程;熟悉数学建模步骤 2、练习Matlab 基本编程命令; 二、 实验要求: 1、较能熟练应用Matlab 基本命令和函数; 2、注重问题分析与模型建立,了解建模小论文的写作过程; 3、提高Matlab 的编程应用技能。 三、 实验学时数:4学时 四、 实验类别:综合性 五、 实验内容与步骤: 练习: 基本命令 :循环、绘图、方程(组)求解 作业: 1、某大学青年教师从31岁开始建立自己的养老基金,他把已有的积蓄10000元也一次性地存入,已知月利率为0.001(以复利计),每月存入700元,试问当他60岁退休时,他的退休基金有多少?又若他退休后每月要从银行提取1000元,试问多少年后他的基金将用完? 2、试对公平席位分配问题进行编程求解。 3、编程求解差分方程的阻滞增长模型1(1)k k k x bx x +=-,分别令b 从1.8逐渐增加,考察序列k x 收敛、2倍周期收敛、4倍周期收敛……,直至一片混乱的情况,试以b 为横坐标,收敛点为纵坐标作图。(与7.3节图8比较)。 数学建模实验项目二 数学规划 一、实验目的与意义: 1、认识数学规划的建模过程; 2、认识数学规划的各种形式和解法。 二、实验要求: 1、熟练应用Matlab 、lindo 、lingo 求解工具箱求解数学规划; 2、掌握建立数学规划的方法和步骤; 3、提高Matlab 、lindo 、lingo 的编程应用技能。 三、实验学时数:4学时 四、实验类别:综合性 五、实验内容与步骤: 练习: 1、奶制品生产销售计划问题的再讨论。 2、自来水输送问题。 3、货机装运问题。 4、选课策略问题。 5、第四章 习题4的模型求解及灵敏度分析。 6、第四章 习题6的模型求解及灵敏度分析。 作业: 1、市场上有n 种资产i s (i=1,2……n )可以选择,现用数额为M 的相当大的资金作一个时期

数据分析实验报告

数据分析实验报告 【最新资料,WORD文档,可编辑修改】 第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:

方差1031026.918399673.8384536136.444百分位数25304.25239.75596.25 50727.50530.501499.50 751893.501197.004136.75 3画直方图,茎叶图,QQ图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689

1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验 单样本Kolmogorov-Smirnov 检验 身高N60正态参数a,,b均值139.00

标准差7.064 最极端差别绝对值.089 正.045 负-.089 Kolmogorov-Smirnov Z.686 渐近显着性(双侧).735 a. 检验分布为正态分布。 b. 根据数据计算得到。 结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验

《数学建模与数学实验》课程论文

10级信息《数学建模与数学实验(实践)》任务书 一、设计目的 通过《数学建模与数学实验(实践)》实践环节,掌握本门课程的众多数学建模方法和原理,并通过编写C语言或matlab程序,掌握各种基本算法在计算机中的具体表达方法,并逐一了解它们的优劣、稳定性以及收敛性。在熟练掌握C 语言或matlab语言编程的基础上,编写算法和稳定性均佳、通用性强、可读性好,输入输出方便的程序,以解决实际中的一些科学计算问题。 二、设计教学内容 1线性规划(掌握线性规划的模型、算法以及Matlab 实现)。整数线性规划(掌握整数线性规划形式和解法)。 2微分方程建模(掌握根据规律建立微分方程模型及解法;微分方程模型的Matlab 实现)。 3最短路问题(掌握最短路问题及算法,了解利用最短路问题解决实际问题)。 行遍性问题(了解行遍性问题,掌握其TSP算法)。 4回归分析(掌握一元线性回归和多元线性回归,掌握回归的Matlab实现)。 5计算机模拟(掌握Monte-carlo方法、了解随机数的产生;能够用Monte-carlo 解决实际问题)。 6插值与拟合(了解数据拟合基本原理,掌握用利用Matlab工具箱解决曲线拟合问题)。 三、设计时间 2012—2013学年第1学期:第16周共计一周 目录 一、10级信息《数学建模与数学实验(实践)》任务书 (1) 二、饭店餐桌的布局问题 (3) 摘要 (3)

问题重述 (3) 模型假设 (3) 模型分析 (4) 模型的建立和求解 (4) 模型推广 (9) 参考文献 (9) 三、白酒配比销售问题 (10) 摘要 (10) 问题重述 (11) 问题分析 (12) 模型假设 (12) 符号及变量说明 (12) 模型的建立与求解 (13) 模型的检验 (18) 模型的评价与推广 (19) 附录 (21) 饭店餐桌的布局问题 摘要 饭店餐桌的布局对于一个饭店有着很重要的作用。本文讨论的就是饭店餐桌的布局问题,根据实际需求及规定建立模型,同时考虑餐桌的类型及规格,尤其是餐桌的摆放技巧,保证使饭店能容纳的人数达到最大。根据所需餐桌的数量

福建工程学院《实验指导书(数据库系统原理及应用)》

数据库系统原理 实验指导书 (本科)

目录 实验一数据定义语言 (1) 实验二SQL Sever中的单表查询 (3) 实验三SQL Serve中的连接查询 (4) 实验四SQL Serve的数据更新、视图 (5) 实验五数据控制(完整性与安全性) (7) 实验六语法元素与流程控制 (9) 实验七存储过程与用户自定义函数 (11) 实验八触发器 (12)

实验一数据定义语言 一、实验目的 1.熟悉SQL Server2000/2005查询分析器。 2.掌握SQL语言的DDL语言,在SQL Server2000/2005环境下采用Transact-SQL实现表 的定义、删除与修改,掌握索引的建立与删除方法。 3.掌握SQL Server2000/2005实现完整性的六种约束。 二、实验内容 1.启动SQL Server2000/2005查询分析器,并连接服务器。 2.创建数据库: (请先在D盘下创建DB文件夹) 1)在SQL Server2000中建立一个StuDB数据库: 有一个数据文件:逻辑名为StuData,文件名为“d:\db\S tuDat.mdf”,文件初始大小为5MB,文件的最大大小不受限制,文件的增长率为2MB; 有一个日志文件,逻辑名为StuLog,文件名为“d:\db\StuLog.ldf”,文件初始大小为5MB,文件的最大大小为10MB,文件的增长率为10% 2)刷新管理器查看是否创建成功,右击StuDB查看它的属性。 3.设置StuDB为当前数据库。 4.在StuDB数据库中作如下操作: 设有如下关系表S:S(CLASS,SNO, NAME, SEX, AGE), 其中:CLASS为班号,char(5) ;SNO为座号,char(2);NAME为姓名,char(10),设姓名的取值唯一;SEX为性别,char(2) ;AGE为年龄,int,表中主码为班号+座号。 写出实现下列功能的SQL语句。 (1)创建表S; (2)刷新管理器查看表是否创建成功; (3)右击表S插入3个记录:95031班25号李明,男性,21岁; 95101班10号王丽,女性,20岁; 95031班座号为30,名为郑和的学生记录; (4)将年龄的数据类型改为smallint; (5)向S表添加“入学时间(comedate)”列,其数据类型为日期型(datetime); (6)对表S,按年龄降序建索引(索引名为inxage); (7)删除S表的inxage索引; (8)删除S表; 5.在StuDB数据库中, (1)按照《数据库系统概论》(第四版)P82页的学生-课程数据库创建STUDENT、COURSE 和SC三张表,每一张表都必须有主码约束,合理使用列级完整性约束和表级完整性。 并输入相关数据。 (2)将StuDB数据库分离,在D盘下创建DB文件夹下找到StuDB数据库的两个文件,进行备份,后面的实验要用到这个数据库。 6.(课外)按照《数据库系统概论》(第四版)P74页习题5的SPJ数据库。创建SPJ数据 库,并在其中创建S、P、J和SPJ四张表。每一张表都必须有主码约束,合理使用列级完整性约束和表级完整性。要作好备份以便后面的实验使用该数据库数据。 三、实验要求:

相关主题