搜档网
当前位置:搜档网 › R语言常用上机命令分功能整理——时间序列分析为主

R语言常用上机命令分功能整理——时间序列分析为主

R语言常用上机命令分功能整理——时间序列分析为主
R语言常用上机命令分功能整理——时间序列分析为主

应用实例

?R的基本界面是一个交互式命令窗口,命令提示符是一个大于号,命令的结果马上显示在命令下面。

?S命令主要有两种形式:表达式或赋值运算(用’<-’或者’=’表示)。在命令提示符后键入一个表达式表示计算此表达式并显示结果。赋值运算把赋值号右边的值计算出来赋给左边的变量。

?可以用向上光标键来找回以前运行的命令再次运行或修改后再运行。

?S是区分大小写的,所以x和X是不同的名字。

我们用一些例子来看R软件的特点。假设我们已经进入了R的交互式窗口。如果没有打开的图形窗口,在R中,用:> x11() 可以打开一个作图窗口。然后,输入以下语句:

x1 = 0:100

x2 = x1*2*pi/100

y = sin(x2)

plot(x2,y,type="l")

这些语句可以绘制正弦曲线图。其中,“=”是赋值运算符。0:100表示一个从0到100 的等差数列向量。第二个语句可以看出,我们可以对向量直接进行四则运算,计算得到的x2 是向量x1的所有元素乘以常数2*pi/100的结果。从第三个语句可看到函数可以以向量为输入,并可以输出一个向量,结果向量y的每一个分量是自变量x2的每一个分量的正弦函数值。

plot(x2,y, type="l",main="画图练习",sub="好好练", xlab="x轴",ylab='y轴')

有关作图命令plot的详细介绍可以在R中输入help(plot)

abs,sqrt:绝对值,平方根log, log10, log2 , exp:对数与指数函数sin,cos,tan,asin,acos,atan,atan2:三角函数sinh,cosh,tanh,asinh,acosh,atanh:双曲函数

简单统计量

sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量,sort,order,rank 与排序有关,其它还有ave,fivenum,mad,quantile,stem等。

下面我们看一看S的统计功能:

> marks <- c(10, 6, 4, 7, 8)

> mean(marks)

> sd(marks)

> min(marks)

> max(marks)

第一个语句输入若干数据到一个向量,函c()用来把数据组合为一个向量。后面用了几个函数来计算数据的均值、标准差、最小值、最大值。

可以把若干行命令保存在一个文本文件中,然后用source函数来运行整个文件:

> source("C:/l.R") 注意字符串中的反斜杠。

例:计算6, 4, 7, 8,10的均值和标准差,把若干行命令保存在一个文本文件(比如C:\1.R)中,然后用source函数来运行整个文件。

a<- c(10, 6, 4, 7, 8)

b<-mean(a)

c<-sd(a)

source("C:/1.R")

时间序列数据的输入

使用函数ts

ts(1:10, frequency = 4, start = c(1959, 2))

print( ts(1:10, frequency = 7, start = c(12, 2)), calendar = TRUE)

a<-ts(1:10, frequency = 4, start = c(1959, 2))

plot(a)

将外部数据读入R

read.csv

默认header = TRUE,也就是第一行是标签,不是数据。

read.table

默认header = FALSE

将R中的数据输出

write

write.table

write.csv

1. 绘制时序图、自相关图

例题2.1

d=scan("sha.csv")

sha=ts(d,start=1964,freq=1)

plot.ts(sha) #绘制时序图

acf(sha,22) #绘制自相关图,滞后期数22

pacf(sha,22) #绘制偏自相关图,滞后期数22

corr=acf(sha,22) #保存相关系数

cov=acf(sha,22,type = "covariance") #保存协方差

图的保存,单击选中图,在菜单栏选中“文件”,再选“另存为”。

同时显示多个图:用x11()命令生成一个空白图,再输入作图命令。

2. 同时绘制两组数据的时序图

d=read.csv("double.csv",header=F)

double=ts(d,start=1964,freq=1)

plot(double, plot.type = "multiple") #两组数据两个图

plot(double, plot.type = "single") #两组数据一个图

plot(double, plot.type = "single",col=c("red","green"),lty=c(1,2)) #设置每组数据图的颜色、曲线类型)

3.产生服从正态分布的随机观察值

例题2.4 随机产生1000白噪声序列观察值

d=rnorm(1000,0,1) #个数1000 均值0 方差1

plot.ts(d)

4.纯随机性检验

例题2.3续

d=scan("temp.csv")

temp=ts(d,freq=1,start=c(1949))

Box.test(temp, type="Ljung-Box",lag=6)

5.差分计算

x=1:10

y=diff(x)

k 步差分k t t t k x x x -?=- 加入参数 lag=k

如计算x 的3步差分为

y=diff(x, lag = 3)

p 阶差分

111p p p t t t x x x ---?=?-?加入参数differences = p 如2阶差分

21t t t x x x -?=?-? y=diff(x,differences = 2)

例题3.1

plot.ts(arima.sim(n = 100, list(ar = 0.8)))

#模拟AR(1)模型,并作时序图。

plot.ts(arima.sim(n = 100, list(ar = -1.1)))

#非平稳,无法得到时序图。

plot.ts(arima.sim(n = 100, list(ar = c(1,-0.5))))

plot.ts(arima.sim(n = 100, list(ar = c(1,0.5))))

例题3.5

acf(arima.sim(n = 100, list(ar = 0.8)))

acf (arima.sim(n = 100, list(ar = -1.1)))

acf (arima.sim(n = 100, list(ar = c(1,-0.5))))

acf (arima.sim(n = 100, list(ar = c(1,0.5))))

例题3.7

arima.sim(n = 1000, list(ar = 0.5, ma = -0.8))

acf(arima.sim(n = 1000, list(ar = 0.5, ma = -0.8)),20)

pacf(arima.sim(n = 1000, list(ar = 0.5, ma = -0.8)),20)

例题2.5

d=scan("a1.5.txt") #导入数据

prop=ts(d,start=1950,freq=1) #转化为时间序列数据

plot(prop) #作时序图

acf(prop,12) #作自相关图,拖尾

pacf(prop,12) #作偏自相关图,1阶截尾

Box.test(prop, type="Ljung-Box",lag=6)

#纯随机性检验,p值小于5%,序列为非白噪声

Box.test(prop, type="Ljung-Box",lag=12)

arima(prop, order = c(1,0,0),method="ML")

#用AR(1)模型拟合,如参数method="CSS",估计方法为条件最小二乘法,用条件最小二乘法时,不显示AIC。

arima(prop, order = c(1,0,0),method="ML", include.mean = F) #用AR(1)模型拟合,不含截距项。tsdiag(arima(prop, order = c(1,0,0),method="ML"))

#对估计进行诊断,判断残差是否为白噪声

summary(arima(prop, order = c(1,0,0),method="ML"))

a=arima(prop, order = c(1,0,0),method="ML")

r=a$residuals#用r来保存残差

Box.test(r,type="Ljung-Box",lag=6)#对残差进行纯随机性检验

predict(arima(prop, order = c(1,0,0)), n.ahead =5) #预测未来5期

prop.fore = predict(arima(prop, order = c(1,0,0)), n.ahead =5)

#将未来5期预测值保存在prop.fore变量中

U = prop.fore$pred + 1.96* prop.fore$se

L = prop.fore$pred – 1.96* prop.fore$se#算出95%置信区间

ts.plot(prop, prop.fore$pred,col=1:2)#作时序图,含预测。

lines(U, col="blue", lty="dashed")

lines(L, col="blue", lty="dashed")#在时序图中作出95%置信区间

例题3.9

d=scan("a1.22.txt")

x=diff(d)

arima(x, order = c(1,0,1),method="CSS")

tsdiag(arima(x, order = c(1,0,1),method="CSS"))

第一点:

对于第三讲中的例2.5,运行命令arima(prop, order = c(1,0,0),method="ML")之后,显示:Call:

arima(x = prop, order = c(1, 0, 0), method = "ML")

Coefficients:

ar1 intercept

0.6914 81.5509

s.e. 0.0989 1.7453

sigma^2 estimated as 15.51: log likelihood = -137.02, aic = 280.05

注意:intercept下面的81.5509是均值,而不是截距!虽然intercept是截距的意思,这里如果用mean会更好。(the mean and the intercept are the same only when there is no AR term,均值和截距是相同的,只有在没有AR项的时候)

如果想得到截距,利用公式计算。int=(1-0.6914)*81.5509= 25.16661。课本P81的例2.5续中的截距25.17是正确的。

第二点:

如需计算参数的t统计量值和p值,利用下面的公式。

ar的t统计量值=0.6914/0.0989= 6.9909

(注:数值与课本略有不同,因为课本用sas算的se= 0.1029,R计算的se=0.0989)

p值=pt(6.9909,df=48,lower.tail = F)*2

pt()为求t分布求p值的函数,6.99为t统计量的绝对值,df为自由度=数据个数-参数个数,lower.tail = F表示所求p值为P[T > t],如不加入这个参数表示所求p值为P[T <=t]。

乘2表示p值是双侧的(课本上的p值由sas算出,是双侧的)

均值的t统计量值和p值同理。

在时间序列中对参数显著性的要求与回归模型不同,我们更多的是考察模型整体的好坏,而不是参数。所以,R中的arima拟合结果中没有给出参数的t统计量值和p值,如果题目没有特别要求,一般不需要手动计算。

第三点:

修正第三讲中的错误:

例2.5中,我们用下面的语句对拟合arima模型之后的残差进行了LB检验:

a=arima(prop, order = c(1,0,0),method="ML")

r=a$residuals

a=arima(prop, order = c(1,0,0),method="ML")

r=a$residuals

#用r来保存残差

Box.test(r,type="Ljung-Box",lag=6)

#对残差进行纯随机性检验

最后一句不完整,需要加上参数fitdf=1,修改为

Box.test(r,type="Ljung-Box",lag=6,fitdf=1)

fitdf表示p+q,number of degrees of freedom to be subtracted if x is a series of residuals,当检验的序列是残差到时候,需要加上命令fitdf,表示减去的自由度。

运行Box.test(r,type="Ljung-Box",lag=6,fitdf=1)后,显示的结果:

Box.test(r,type="Ljung-Box",lag=6,fitdf=1)

Box-Ljung test

data: r

X-squared = 5.8661, df = 5, p-value = 0.3195

“df = 5”表示自由度为5,由于参数lag=6,所以是滞后6期的检验。

第四讲

# example4_1 拟合线性模型

x1=c(12.79,14.02,12.92,18.27,21.22,18.81,25.73,26.27,26.75,28.73,31.71,33.95)

a=as.ts(x1)

is.ts(a)

ts.plot(a)

t=1:12

t

lm1=lm(a~t)

summary(lm1) # 返回拟合参数的统计量

coef(lm1) #返回被估计的系数

fitted(lm1) #返回模拟值

residuals(lm1) #返回残差值

fit1=as.ts(fitted(lm1))

ts.plot(a);lines(fit1,col="red") #拟合图

#eg1

cs=ts(scan("eg1.txt",sep=","))

cs

ts.plot(cs)

t=1:40

lm2=lm(cs~t)

summary(lm2) # 返回拟合参数的统计量

coef(lm2) #返回被估计的系数

fit2=as.ts(fitted(lm2)) #返回模拟值

residuals(lm2) #返回残差值

ts.plot(cs);lines(fit2,col="red") #拟合图

#example4_2 拟合非线性模型

t=1:14

x2=c(1.85,7.48,14.29,23.02,37.42,74.27,140.72,265.81,528.23,1040.27,2064.25,4113.73,8212.21, 16405.95)

x2

plot(t,x2)

m1=nls(x2~a*t+b^t,start=list(a=0.1,b=1.1),trace=T)

summary(m1) # 返回拟合参数的统计量

coef(m1) #返回被估计的系数

fitted(m1) #返回模拟值

residuals(m1) #返回残差值

plot(t,x2);lines(t,fitted(m1)) #拟合图

#读取excel中读取文件,逗号分隔符

a=read.csv("example4_2.csv",header=TRUE)

t=a$t

x=a$x

x

ts.plot(x)

m2=nls(x~a*t+b^t,start=list(a=0.1,b=1.1),trace=T)

summary(m2) # 返回拟合参数的统计量

coef(m2) #返回被估计的系数

fitted(m2) #返回模拟值

residuals(m2) #返回残差值

plot(t,x);lines(t,fitted(m2)) #拟合图

#eg2

I<-scan("eg2.txt")

I

x=ts(data=I,start=c(1991,1),f=12) #化为时间序列

x

plot.ts(x)

t=1:130

t2=t^2

m3=lm(x~t+t2)

coef(m3) #返回被估计的系数

summary(m3) # 返回拟合参数的统计量

#去不显著的自变量,再次模拟

m4=lm(x~t2)

coef(m4) #返回被估计的系数

summary(m4) # 返回拟合参数的统计量

m2=fitted(m4) #返回模拟值

y=ts(data=m2,start=c(1991,1),f=12)

y

ts.plot(x);lines(y)

#平滑法

#简单移动平均法

x=c(5,5.4,5.8,6.2)

x

y=filter(x,rep(1/4,4),sides=1)

y

#指数平滑

for(i in 1:3)

{

x[1]=x[1]

x[i+1]=0.25*x[i+1]+0.75*x[i]

}

#HoltWinters Filter

a=ts(read.csv("holt.csv",header=F),start=c(1978,1),f=1)

a

m=HoltWinters(a,alpha=0.15,beta=0.1,gamma=FALSE,l.start=51259,b.start=4325) m

fitted(m)

plot(m)

plot(fitted(m))

#综合

cs=ts(read.csv("eg3.csv",header=F),start=c(1993,1),f=12) #读取数据

cs

ts.plot(cs) #绘制时序图

cs.sea1=rep(0,12)

cs.sea1

for(i in 1:12){

for(j in 1:8){

cs.sea1[i]=cs.sea1[i]+cs[i+12*(j-1)]

}

}

cs.sea=(cs.sea1/8)/(mean(cs))

cs.sea

cs.sea2=rep(cs.sea,8)

x=cs/cs.sea2

x

plot(x)

t=1:96

m1=lm(x~t)

coef(m1)

summary(m1)

m=ts(fitted(m1),start=c(1993,1),f=12)

ts.plot(x,type="p");lines(m,col="red")

r=residuals(m1)

Box.test(r) #白噪声检验

第五讲

########################

#回顾

#例5.1

sha=ts(scan("sha.csv"),start=1964,freq=1)

ts.plot(sha)

diff(sha)

par(mfrow=c(2,1))

ts.plot(diff(sha))

acf(diff(sha))

#例5.2

car=ts(read.csv("car.csv",header=F),start=1950,freq=1) car

par(mfrow=c(3,1))

ts.plot(car)

ts.plot(diff(car))

ts.plot(diff(car,differences=2))

#例5.3

milk=ts(scan("milk.txt"),start=c(1962,1),freq=12)

milk

par(mfrow=c(3,1))

ts.plot(milk)

ts.plot(diff(milk))

dm1=diff(diff(milk),lag=12)

ts.plot(dm1)

acf(dm1)

#例5.5

x=ts(cumsum(rnorm(1000,0,100)))

###########################

#拟合ARIMA模型

#5.8.1

a=ts(scan("581.txt"))

par(mfrow=c(2,2))

ts.plot(a)

da=diff(a)

ts.plot(da)

acf(da,20)

pacf(da,20)

Box.test(da,6)

fit1=arima(a,c(1,1,0),method="ML")

predict(fit1,5)

#############################

incom=ts(read.csv("incom.csv",header=F),start=1952,freq=1)

incom

ts.plot(incom)

dincom=diff(incom)

ts.plot(dincom)

acf(dincom,lag=18) #自相关图

Box.test(dincom,type="Ljung-Box",lag=6) #白噪声检验

Box.test(dincom,type="Ljung-Box",lag=12)

Box.test(dincom,type="Ljung-Box",lag=18)

pacf(dincom,lag=18)

fit1=arima(dincom,order=c(0,0,1),method="CSS")

fit2=arima(incom,order=c(0,1,1),xreg=1:length(incom),method="CSS") # 见https://www.sodocs.net/doc/d89217065.html,/stoffer/tsa2/Rissues.htm

Box.test(fit2$resid,lag=6,type="Ljung-Box",fitdf=1)

fore=predict(fit2,10,newxreg=(length(incom)+1):(length(incom)+10))

#疏系数模型

#例5.8

w=ts(read.csv("w.csv"),start=1917,freq=1)

w=w[,1]

par(mfrow=c(2,2))

ts.plot(w)

ts.plot(diff(w))

acf(diff(w),lag=18)

pacf(diff(w),lag=18)

dw=diff(w)

fit3=arima(dw,order=c(4,0,0),fixed=c(NA,0,0,NA,0),method="CSS") Box.test(fit3$resid,lag=6,type="Ljung-Box",fitdf=2)

Box.test(fit3$resid,lag=12,type="Ljung-Box",fitdf=2)

fit4=armaFit(~arima(4,0,0),fixed=c(NA,0,0,NA),include.mean=F,data=dw,method="CSS") summary(fit4)

#例5.9

ue=ts(scan("unemployment.txt"),start=1962,f=4) #读取数据

par(mfrow=c(2,2)) #绘制时序图

ts.plot(ue)

#差分

due=diff(ue)

ddue=diff(due,lag=4)

ts.plot(ddue)

Box.test(ddue,lag=6)

#平稳性检验

acf(ddue,lag=30)

pacf(ddue,lag=30)

arima(ddue,order=c(0,0,0),method="ML")

arima(ddue,order=c(4,0,0),method="ML")

arma=arima(ddue,order=c(4,0,0),transform.pars=F,fixed=c(NA,0,0,NA),include.mean=F,method=" ML")

#参数估计与检验(加载fArma程序包)

fit2=armaFit(~arima(4,0,0),include.mean=F,data=ddue,method="ML")

summary(fit2)

fit3=armaFit(~arima(4,0,0),data=ddue,transform.pars=F,fixed=c(NA,0,0,NA),include.mean=F,meth od="CSS")

summary(fit3)

#残差白噪声检验

Box.test(arma$resid,6,fitdf=2,type="Ljung")

#拟合

ft=ts(fitted(fit3),start=1963.25,f=4)

dft=ts(rep(0,115),start=1963.25,f=4)

for(i in 1:115){dft[i]=ft[i]+due[i]+ue[i+4]}

ts.plot(ue);lines(dft,col="red")

#####################################

#例5.10 乘积季节模型

wue=ts(scan("wue.txt"),start=1948,f=12)

arima(wue,order=c(1,1,1),seasonal=list(order=c(0,1,1),period=12),include.mean=F,method="CSS" )

###################################

#拟合Auto-Regressive模型

eg1=ts(scan("582.txt"))

ts.plot(eg1)

#因变量关于时间的回归模型

fit.gls=gls(eg1~-1+time(eg1),correlation=corARMA(p=1),method="ML")#see the nlme package summary(fit.gls2) #the results

#延迟因变量回归模型

leg1=lag(eg1,-1)

y=cbind(eg1,leg1)

fit=arima(y[,1],c(0,0,0),xreg=y[,2],include.mean=F)

第六讲

#回顾

#例5.1

sha=ts(scan("sha.csv"),start=1964,freq=1)

ts.plot(sha)

diff(sha)

par(mfrow=c(2,1))

ts.plot(diff(sha))

acf(diff(sha))

#例5.2

car=ts(read.csv("car.csv",header=F),start=1950,freq=1) car

par(mfrow=c(3,1))

ts.plot(car)

ts.plot(diff(car))

ts.plot(diff(car,differences=2))

#例5.3

milk=ts(scan("milk.txt"),start=c(1962,1),freq=12)

milk

par(mfrow=c(3,1))

ts.plot(milk)

ts.plot(diff(milk))

dm1=diff(diff(milk),lag=12)

ts.plot(dm1)

acf(dm1)

#例5.5

x=ts(cumsum(rnorm(1000,0,100)))

ts.plot(x)

###########################

#拟合ARIMA模型

#上机指导5.8.1

a=ts(scan("581.txt"))

par(mfrow=c(2,2))

ts.plot(a)

da=diff(a)

ts.plot(da)

acf(da,20)

pacf(da,20)

Box.test(da,6)

fit1=arima(a,c(1,1,0),method="ML")

predict(fit1,5,newxreg=(length(a)+1):(length(a)+5))

fit2=armaFit(~arima(1,1,0),data=a,xreg=1:length(a),method="ML")

summary(fit1)

summary(fit2)#截距项不显著,故舍去

fit3=arima(a,c(1,1,0),method="ML")

predict(fit3,5)

#############################

#例5.8

incom=ts(read.csv("incom.csv",header=F),start=1952,freq=1)

incom

ts.plot(incom)

dincom=diff(incom)

ts.plot(dincom)

acf(dincom,lag=18) #自相关图

Box.test(dincom,type="Ljung-Box",lag=6) #白噪声检验

pacf(dincom,lag=18)

fit=arima(incom,order=c(0,1,1),xreg=1:length(incom),method="CSS")

#见https://www.sodocs.net/doc/d89217065.html,/stoffer/tsa2/Rissues.htm

AutocorTest(fit$resid) #加载FinTS包

fore=predict(fit,10,newxreg=(length(incom)+1):(length(incom)+10))

#疏系数模型

#例5.8

w=ts(read.csv("w.csv"),start=1917,freq=1)

w=w[,1]

par(mfrow=c(2,2))

ts.plot(w)

ts.plot(diff(w))

acf(diff(w),lag=18)

pacf(diff(w),lag=18)

dw=diff(w)

fit3=arima(dw,order=c(4,0,0),fixed=c(NA,0,0,NA,0),method="CSS")

Box.test(fit3$resid,lag=6,type="Ljung-Box",fitdf=2)

Box.test(fit3$resid,lag=12,type="Ljung-Box",fitdf=2)

fit4=armaFit(~arima(4,0,0),fixed=c(NA,0,0,NA),include.mean=F,data=dw,method="CSS") #加载fArma包,检验参数

summary(fit4)

#例5.9

#读取数据

ue=ts(scan("unemployment.txt"),start=1962,f=4)

#绘制时序图

par(mfrow=c(2,2))

ts.plot(ue)

#差分

due=diff(ue)

ddue=diff(due,lag=4)

ts.plot(ddue)

Box.test(ddue,lag=6)

#平稳性检验

acf(ddue,lag=30)

pacf(ddue,lag=30)

arima(ddue,order=c(0,0,0),method="ML")

arima(ddue,order=c(4,0,0),method="ML")

arma=arima(ddue,order=c(4,0,0),transform.pars=F,fixed=c(NA,0,0,NA),include.mean=F,method=" ML")

#参数估计与检验(加载fArma程序包)

fit2=armaFit(~arima(4,0,0),include.mean=F,data=ddue,method="ML")

summary(fit2)

fit3=armaFit(~arima(4,0,0),data=ddue,transform.pars=F,fixed=c(NA,0,0,NA),include.mean=F,meth od="CSS")

summary(fit3)

#残差白噪声检验

Box.test(arma$resid,6,fitdf=2,type="Ljung")

#拟合

ft=ts(fitted(fit3),start=1963.25,f=4)

dft=ts(rep(0,115),start=1963.25,f=4)

for(i in 1:115){dft[i]=ft[i]+due[i]+ue[i+4]}

ts.plot(ue);lines(dft,col="red")

#####################################

#例5.10 乘积季节模型

wue=ts(scan("wue.txt"),start=1948,f=12)

arima(wue,order=c(1,1,1),seasonal=list(order=c(0,1,1),period=12),include.mean=F,method="CSS" )

###################################

#拟合Auto-Regressive模型

eg1=ts(scan("582.txt"))

ts.plot(eg1)

#因变量关于时间的回归模型

fit=arima(eg1,c(1,0,0),xreg=time(eg1),include.mean=F,method="ML")

AutocorTest(fit$resid)#残差白噪声检验

###另一种方法

fit.gls=gls(eg1~-1+time(eg1),correlation=corARMA(p=1),method="ML")#see the nlme package summary(fit.gls2) #the results

#延迟因变量回归模型

leg1=lag(eg1,-1)

y=cbind(eg1,leg1)

fit=arima(y[,1],c(0,0,0),xreg=y[,2],include.mean=F)

AutocorTest(fit$resid)#残差白噪声检验

#p206 583拟合GARCH模型

library(tseries)

library(fGarch)

library(FinTS)

a=ts(scan("583.txt"))

ts.plot(a)

fit=lm(a~-1+time(a))

r=resid(fit)

summary(fit)

pacf(r^2)

acf(r)

acf(r^2)

AutocorTest(r) #残差是否存在序列相关

ArchTest(r) #是否存在ARCH效应

fit1=garchFit(~arma(2,0)+garch(1,1),data=r,algorithm="nlminb+nm",trace=F,include.mean=F) summary(fit1)

#单位根检验

b=ts(read.csv("6_1.csv",header=T))

x=b[,1]

y=b[,1]

summary(ur.df(x,type="trend",selectlags="AIC")) #更多的单位根检验方法看帮助文档

#单位根检验更好的函数加了画图的功能

library(fUnitRoots)

urdfTest(x)

#协整检验

fit=arima(b[,2],xreg=b[,1],method="CSS")

r=resid(fit)

summary(ur.df(r,type="drift",lag=1))

Box.test(r,lag=6,fitdf=1)

时间序列分析作业

时间序列分析作业 1、数据收集 通过长江证券金长江网上交易软件收集中信证券(600030)股价数据(2010-7-1~2011-5-9,共200组),保存文件,命名为“股价数据”。 2、工作表建立 打开eviews,点击file下拉菜单中的new项选择workfile项,弹出窗口如下: (1)、在datespecification中选择integer date。 (2)、在start和end中分别输入“1”“200” (3)、在wf项后面的框中输入工作表名称hr,点击ok。 窗口如下: 3、数据导入 在hr工作文件的菜单选项中选择pro,在弹出的下拉菜单中选择import,然后再下拉二级菜单中选择read text-lotus-excell,找到数据,双击弹出如下对话框:

默认date order,选择右边upper-left data cell下面的空格填写,输入excel中第一个有效数据单元格地址B6,在names for series or number if named in file 中输入序列名称,不妨设为s,点击ok,导入数据。 4、平稳性检验 点击s序列,选择菜单view/correlogram,弹出correlogram specification对话框,如下图,在对话框中默认level,lags to include 改为20(200/10),可得下图:

序列的自相关系数没有很快的趋近0,说明原序列是非平稳的序列。 5、对原序列做对数差分处理 A、在主窗口输入smpl 2 200,对样本数据进行选取, B、在主命令窗口输入series is=log(s)-log(s(-1)) 可以得到新的序列is 对is序列做同上的平稳性检验可以得到如下图:

时间序列分析习题

第8章时间序列分析 一、填空题: 1.平稳性检验的方法有__________、__________和__________。 2.单位根检验的方法有:__________和__________。 3.当随机误差项不存在自相关时,用__________进行单位根检验;当随机误差项存在自相关时,用__________进行单位根检验。 4.EG检验拒绝零假设说明______________________________。 5.DF检验的零假设是说被检验时间序列__________。 6.协整性检验的方法有__________和__________。 7.在用一个时间序列对另一个时间序列做回归时,虽然两者之间并无任何有意义的关系,但经常会得到一个很高的2R的值,这种情况说明存在__________问题。 8.结构法建模主要是以______________________________来确定计量经济模型的理论关系形式。 9.数据驱动建模以____________________作为建模的主要准则。 10.建立误差校正模型的步骤为一般采用两步:第一步,____________________;第二步,____________________。 二、单项选择题:

1. 某一时间序列经一次差分变换成平稳时间序列,此时间序列称为()。 A.1阶单整 ??? B.2阶单整??? C.K阶单整 ?? ?D.以上答案均不正确 2.? 如果两个变量都是一阶单整的,则()。 A.这两个变量一定存在协整关系 B.这两个变量一定不存在协整关系 C.相应的误差修正模型一定成立 D.还需对误差项进行检验 3.当随机误差项存在自相关时,进行单位根检验是由()来实现。 A DF检验 B.ADF检验 C.EG检验 D.DW检验 4.有关EG检验的说法正确的是()。 A.拒绝零假设说明被检验变量之间存在协整关系 B.接受零假设说明被检验变量之间存在协整关系 C.拒绝零假设说明被检验变量之间不存在协整关系 D.接受零假设说明被检验变量之间不存在协整关系

时间序列分析上机指导

上机指导 第五章 5.8.1 拟合ARIMA模型 由于ARMA模型是ARIMA模型的一种特例,所以在SAS系统中这两种模型的拟合都放在了ARIMA 过程中。我们已经在第3章进行了ARMA模型拟合时介绍了ARIMA过程的基本命令格式。再次以临时数据集example5_1的数据为例介绍ARIMA模型拟合与ARMA模型拟合的不同之处。 data example5_1; input x@@; difx=dif(x); t=_n_; cards; 1.05 -0.84 -1.42 0.20 2.81 6.72 5.40 4.38 5.52 4.46 2.89 -0.43 -4.86 -8.54 -11.54 -1 6.22 -19.41 -21.61 -22.51 -23.51 -24.49 -25.54 -24.06 -23.44 -23.41 -24.17 -21.58 -19.00 -14.14 -12.69 -9.48 -10.29 -9.88 -8.33 -4.67 -2.97 -2.91 -1.86 -1.91 -0.80 proc gplot; plot x*t difx*t; symbol v=star c=black i=join; run; 输出时序图显示这是一个典型的非平稳序列。如图5-49所示 时序图49 -序列x图5在原程序基础上添加同时考察查分后序列的平稳性,1阶差分运算,考虑对该序列进行相关命令,程序修改如下:data example5_1; input x@@; difx=dif(x); t=_n_; cards; 1.05 -0.84 -1.42 0.20 2.81 6.72 5.40 4.38 5.52 4.46 2.89 -0.43 -4.86 -8.54 -11.54 -1 6.22

时间序列分析练习题

第二十七章时间序列分析 一、单项选择题 1、以下关于发展水平的说法中,错误的是()。 A、在绝对数时间序列中,发展水平是绝对数 B、在相对数时间序列中,发展水平表现为相对数 C、发展水平是时间序列中对应于具体时间的指标数值 D、平均数时间序列中,发展水平表现为绝对数 2、()也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数,它可以概括性描述现象在一段时期内所达到的一般水平。 A、发展水平 B、发展速度 C、平均发展水平 D、平均发展速度 我国2005—2017年平均每年第三产业就业人数是()万人。 A、12 480 B、12 918 C、14 000 D、14 412 4、环比发展速度等于()。 A、逐期增长量与其前一期水平之比 B、累计增长量与最初水平之比 C、报告期水平与最初水平之比 D、报告期水平与其前一期水平之比 5、已知一个序列的环比发展速度为102%、103%、105%,则该序列的定基发展速度为()。 A、103% B、105% C、110% D、112% 6、以相对数形式表示的两个不同时期发展水平的比值是()。 A、增长量 B、发展水平 C、增长速度 D、发展速度 7、已知某地区2012-2016年社会消费品零售总额的环比增长速度分别为5%、7%、10%、11%,则这一时期该地区社会消费品零售总额的定基增长速度为()。 A、5%×7%×10%×11% B、(5%×7%×10%×11%)+1

C、105%×107%×110%×111% D、(105%×107%×110%×111%)-1 8、甲企业某种商品前11个月的实际销售量如下表所示。采用移动平均数法预测,取k=3,则第 A、303 B、350 C、384 D、394 9、目前计算平均发展速度通常采用()。 A、众数 B、几何平均法 C、算术平均法 D、增长1%的绝对值法 10、某企业2010年—2016年销售收入的年平均增长速度是27.6%,这期间相应的年平均发展速度是()。 A、4.6% B、17.6% C、127.6% D、72.4% 11、平均增长速度与平均发展速度的数量关系是()。 A、平均增长速度=1/平均发展速度 B、平均增长速度=平均发展速度-1 C、平均增长速度=平均发展速度+1 D、平均增长速度=1-平均发展速度 12、我们经常统计的城镇人口比重属于()。 A、平均数时间序列 B、相对数时间序列 C、时期序列 D、时点序列 13、下列统计指标中,属于相对指标的是()。 A、社会消费品零售总额 B、人口性别比 C、房屋建筑面积 D、城镇居民人均可支配收入 14、已知一个有关发展速度的时间序列的指标值是70%、80%、-5%、99%,其平均发展速度()。 A、61% B、50%

时间序列分析上机操作题教学提纲

情况如6月澳大利亚季度常住人口变动(单位:千人)199320.1971年9月—年 问题:(1)判断该序列的平稳性与纯随机性。 (2)选择适当模型拟合该序列的发展。 (3)绘制该序列拟合及未来5年预测序列图。 针对问题一:将以下程序输入SAS编辑窗口,然后运行后可得图1. data example3_1; input x@@; time=_n_; ; cards55.4 50.2 49.5 67.9 55.8 63.2 53.1 61.7 45.3 48.1 49.9 55.2 42.1 30.4 59.9 49.5 33.8 30.6 36.6 44.1

45.5 32.9 28.4 35.8 37.3 29 34.2 39.5 49.8 48.8 43.9 49 47.6 37.3 47.6 39.2 48.9 60.8 65.4 65.4 51.2 67 49.6 55.1 47.3 67.6 62.5 57.3 47.9 45.5 49.1 48 44.5 48.8 60.9 51.4 55.8 59.4 60.9 51.6 60.3 71 64 62.1 58.6 64.6 75.4 83.4 79.4 59.9 80.2 55.9 59.1 21.5 69.5 65.2 58.5 62.5 33.1 62.2 60 170 35.3 -47.4 34.4 43.4 58.4 42.7 ; =example3_1; data proc gplot; 1plot x*time==star; v=join =red symbol1cI;run 该序列的时序图1 图这两个异常数据外,该时序图显示澳大-47.4和由图1可读出:除图中170附近随机波动,没有明显的趋势或周期,基60利亚季度常住人口变动一般在在本可视为平稳序列。5. 再接着输入以下程序运行后可输出五方面的信息。具体见表1-表arima data proc= example3_1;

时间序列分析作业讲解

《时间序列分析与应用》 课程作业 地震数据(COP.BHZ-24)时间序列分析 一.前言 本次作业选取了第24号文件,共1440个数据。截取前1200个数据进行理分析,然后建立模型。之后再对数据进行预测,然后对1200之后的30个数据进行更新,将更新结果与原观测值进行比对分析,最后得出结论。 二.数据处理

1. 数据读取与画图 首先将文件“COP.BHZ.txt”保存到E盘根目录下,以便于读取。用scan()函数将数据读入,并保存到sugar2文件中。如图1所示。 图1 数据读取 然后,画出该时间序列图。横轴表示时间,单位是*10ms,纵轴表示高程,单位是um。代码及图示如图2、图3所示。 图2 时序图代码 图3 前1200个数据散点图 2. 平稳性检验 从图中看出,该组数据随时间变化基本平稳,仅有小幅波动。最高点与最低点相差也仅在250um之内。通过adf.test()函数可以验证该假设,可以看出该序列是平稳的(stationary)。如图4所示。然后用求平均函数mean()求出这1200个数据的平均值a,可以从图5看到结果。

图4 平稳性检验结果 图5 求平均值 然后,将原始数据减去平均值,得到一组零均值的新数据,命名为sugar3。 3. 数据建模分析 接下来绘制震前数据的自相关函数和偏自相关函数图像,初步判断其大概符合什么模型。图6为画出图像的代码,新序列sugar3的ACF、PACF图像如下所示。 图6 ACF、PACF、EACF图像代码

图7 ACF图 图8 PACF图 从ACF、PACF图可以看出,序列一阶之后相关性较强,虽然在第19阶滞后处有超限的情况,但从总体来看,两个图都是拖尾的情况。因此要借助于EACF 图来做进一步判断。扩展自相关函数EACF图如下。 图9 EACF图 3 模型识别 由EACF图可以看出此时间序列符合ARMA(0,1)或ARMA(2,2),根据以上信息尚不能明确判断出具体的模型,要建立确定的模型,就需要排除上述模型中的一种,用模型诊断的方法可以实现。模型诊断,或模型评价,涉及检验模型的拟合优度,并且如果拟合程度很差,要给出适当的调整建议。模型诊断的方法有两种:分析拟合模型的残差和分析过度参数化的模型。下面先使用残差法。 3.1 ARMA(0,1)模型诊断

时间序列分析——var模型实验

基于VAR模型的我国房地产市场与汇率 波动的因果关系 ————VAR模型实验

第一部分实验分析目的及方法 现选取人民币对美元汇率以及商品房房价作为变量构建VAR模型。对于不满足单位根检验的序列采取对数化或差分处理,使其成为平稳序列再进行模型的拟合。对于商品房房价这一变量,由于全国各省市差异较大,故此处采用全国房地产开发业综合景气指数这一变量。此外,为了消除春节假期不固定因素带来的影响,增强数据的可比性,按照国家统计制度,从2012年起,不单独对1月份统计数据进行调查,1-2月份数据一起调查,一起发布。所以国房景气指数p这一序列缺少每年一月份的相关数据,属于非随机、不可忽略缺失,在此采用平均值填充的方法,补足数据。 第二部分实验样本 2.1数据来源 数据来源于中经网统计数据库。具体数据见附录表。 2.2所选数据变量 由于我国于2005年7月实行第二次汇改,此次汇改以市场供求为基础、参考一篮子货币进行调节、有管理的浮动汇率制度取代了过去人民币汇率长达10年的紧盯美元的固定汇率体制。故本实验拟选取2005年07月到2014年10月我国以月为单位的数据。,用以上两个变量来构建VAR模型,并利用该模型进行分析预测。 第四部分模型构建 4.1判断序列的平稳性 4.1.1汇率E序列 首先绘制出E的折线图,结果如下图:

图4.1 汇率E的曲线图 从图中可以看出,汇率E序列较强的趋势性,由此可以初步判断该序列是非平稳的。为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下: 图4.2 lm的曲线图

对数化后的趋势性减弱,但仍存在一定的趋势性,下面对lm进行一阶差分处理,去除趋势性,得到新变量dlm,观察dlm的曲线图。 图4.3 DLE的曲线图 从图中可以看出,dle序列的趋势性基本已经消除,且新变量dle基本围绕0上下波动,因此选择形式为y t=y t-1+u t进行单位根检验: 表4.1 单位根输出结果 Null Hypothesis: DLE has a unit root Exogenous: Constant Lag Length: 2 (Automatic - based on SIC, maxlag=12) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.031673 0.0351 Test critical values: 1% level -3.491928 5% level -2.888411 10% level -2.581176 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(DLE) Method: Least Squares Date: 11/15/14 Time: 20:20 Sample (adjusted): 2005M11 2014M10 Included observations: 108 after adjustments

第九章 时间序列分析习题

第九章时间序列分析习题 一、填空题 1.时间序列有两个组成要素:一是,二是。 2.在一个时间序列中,最早出现的数值称为,最晚出现的数值称为。 3.时间序列可以分为时间序列、时间序列和时间序列三种。其中是最基本的序列。 4.绝对数时间序列可以分为和两种,其中,序列中不同时间的数值相加有实际意义的是序列,不同时间的数值相加没有实际意义的是序列。 5.已知某油田1995年的原油总产量为200万吨,2000年的原油总产量是459万吨,则“九五”计划期间该油田原油总产量年平均增长速度的算式为。 6.发展速度由于采用的基期不同,分为和两种,它们之间的关系可以表达为。 7.设i=1,2,3,…,n,a i为第i个时期经济水平,则a i/a0是发展速度,a i/a i-1是发展速度。 8.计算平均发展速度的常用方法有方程式法和. 9.某产品产量1995年比1990年增长了105%,2000年比1990年增长了306.8%,则该产品2000年比1995增长速度的算式是。 10.如果移动时间长度适当,采用移动平均法能有效地消除循环变动和。 11.时间序列的波动可分解为长期趋势变动、、循环变动和不规则变动。 12.用最小二乘法测定长期趋势,采用的标准方程组是。 二、单项选择题 1.时间序列与变量数列( ) A都是根据时间顺序排列的B都是根据变量值大小排列的 C前者是根据时间顺序排列的,后者是根据变量值大小排列的 D前者是根据变量值大小排列的,后者是根据时间顺序排列的 2.时间序列中,数值大小与时间长短有直接关系的是( ) A平均数时间序列B时期序列C时点序列D相对数时间序列 3.发展速度属于( ) A比例相对数B比较相对数C动态相对数D强度相对数 4.计算发展速度的分母是( ) A报告期水平B基期水平C实际水平D计划水平 则该车间上半年的平均人数约为( ) A 296人 B 292人 C 295 人 D 300人 6.某地区某年9月末的人口数为150万人,10月末的人口数为150.2万人,该地区10月的人口平均数为( ) A150万人B150.2万人C150.1万人D无法确定 7.由一个9项的时间序列可以计算的环比发展速度( ) A有8个B有9个C有10个D有7个 8.采用几何平均法计算平均发展速度的依据是( )

时间序列分析--习题库

说明:答案请答在规定的答题纸或答题卡上,答在本试卷册上的无效。 一、填空题(本题总计25分) 1. 常用的时间序列数据,有年度数据、( )数据和( ) 数据。另外,还有以( )、小时为时间单位计算的数据。 2. 自相关系数j ρ的取值范围为( );j ρ与j -ρ之间的关系是( );0ρ=( )。 3.判断下表中各随机过程自相关系数和偏自相关系数的截尾性,并用 2. 如果随机过程{}t ε为白噪音,则 t t Y εμ+= 的数学期望为 ;j 不等于0时,j 阶自协方差等于 ,j 阶自相关系数等于 。因此,是一个 随机过程。 1.(2分)时间序列分析中,一般考虑时间( )的( )的情形。 3. (6分)随机过程{}t y 具有平稳性的条件是: (1)( )和( )是常数,与 ( )无关。 (2)( )只与( )有关,与 ( )无关。 7. 白噪音的自相关系数是:

1.白噪音{}t y 的性质是:t y 的数学期望为 ,方差为 ;t y 与j -t y 之间的协方差为 。 1.(4分)移动平均法的特点是:认为历史数据中( )的数据对未来的数值有影响,其权数为( ),权数之和为( );但是,( )的数据对未来的数值没有影响。 2. 指数平滑法中常数α值的选择一般有2种: (1)根据经验判断,α一般取 。 (2)由 确定。 3. (5分)下述随机过程中,自相关系数具有拖尾性的有( ),偏自相关系数具有拖尾性的有( )。 ①平稳(2) ②(1) ③平稳(1,2) ④白噪 音过程 4.(5分)下述随机过程中,具有平稳性的有( ),不具有平稳性的有( )。 ①白噪音 ②t t y 1.23t+ε=+ ③随机漂移过程 ④t t t 1y 16 3.2εε-=++ ⑤t t y 2.8ε=+ 2.(3分)白噪音{}t ε的数学期望为( );方差为( );j 不等于0时,j 阶自协方差等于( )。 (2)自协方差与( )无关,可能与 ( )有关。 3. (5分)下述随机过程中,自相关系数具有截尾性的有( ),偏自相关系数具有截尾性的有( )。

时间序列分析实验报告汇总.doc

《时间序列分析》课程实验报告

一、上机练习(P124) 1.拟合线性趋势 12.79 14.02 12.92 18.27 21.22 18.81 25.73 26.27 26.75 28.73 31.71 33.95 程序: data xiti1; input x@@; t=_n_; cards; 12.79 14.02 12.92 18.27 21.22 18.81 25.73 26.27 26.75 28.73 31.71 33.95 ; proc gplot data=xiti1; plot x*t; symbol c=red v=star i=join; run; proc autoreg data=xiti1; model x=t; output predicted=xhat out=out; run; proc gplot data=out; plot x*t=1 xhat*t=2/overlay; symbol2c=green v=star i=join; run; 运行结果:

分析:上图为该序列的时序图,可以看出其具有明显的线性递增趋势,故使用线性模型进行拟合:x t=a+bt+I t,t=1,2,3,…,12 分析:上图为拟合模型的参数估计值,其中a=9.7086,b=1.9829,它们的检验P值均小于 0.0001,即小于显著性水平0.05,拒绝原假设,故其参数均显著。从而所拟合模型为: x t=9.7086+1.9829t.

分析:上图中绿色的线段为线性趋势拟合线,可以看出其与原数据基本吻合。 2.拟合非线性趋势 1.85 7.48 14.29 23.02 37.42 74.27 140.72 265.81 528.23 1040.27 2064.25 4113.73 8212.21 16405.95 程序: data xiti2; input x@@; t=_n_; cards; 1.85 7.48 14.29 23.02 37.42 74.27 140.72 265.81 528.23 1040.27 2064.25 4113.73 8212.21 16405.95 ; proc gplot data=xiti2; plot x*t; symbol c=red v=star i=none; run; proc nlin method=gauss; model x=a*b**t; parameters a=0.1 b=1.1; der.a=b**t; der.b=a*t*b**(t-1); output predicted=xh out=out; run; proc gplot data=out; plot x*t=1 xh*t=2/overlay;

(整理)8章 时间序列分析练习题参考答案.

第八章 时间数列分析 一、单项选择题 1.时间序列与变量数列( ) A 都是根据时间顺序排列的 B 都是根据变量值大小排列的 C 前者是根据时间顺序排列的,后者是根据变量值大小排列的 D 前者是根据变量值大小排列的,后者是根据时间顺序排列的 C 2.时间序列中,数值大小与时间长短有直接关系的是( ) A 平均数时间序列 B 时期序列 C 时点序列 D 相对数时间序列 B 3.发展速度属于( ) A 比例相对数 B 比较相对数 C 动态相对数 D 强度相对数 C 4.计算发展速度的分母是( ) A 报告期水平 B 基期水平 C 实际水平 D 计划水平 B 5.某车间月初工人人数资料如下: 则该车间上半年的平均人数约为( ) A 296人 B 292人 C 295 人 D 300人 C 6.某地区某年9月末的人口数为150万人,10月末的人口数为150.2万人,该地区10月的人口平均数为( ) A 150万人 B 150.2万人 C 150.1万人 D 无法确定 C 7.由一个9项的时间序列可以计算的环比发展速度( ) A 有8个 B 有9个 C 有10个 D 有7个 A 8.采用几何平均法计算平均发展速度的依据是( ) A 各年环比发展速度之积等于总速度 B 各年环比发展速度之和等于总速度 C 各年环比增长速度之积等于总速度 D 各年环比增长速度之和等于总速度 A 9.某企业的科技投入,2010年比2005年增长了58.6%,则该企业2006—2010年间科技投入的平均发展速度为( ) A 5 %6.58 B 5%6.158 C 6 %6.58 D 6%6.158 B 10.根据牧区每个月初的牲畜存栏数计算全牧区半年的牲畜平均存栏数,采用的公式是( ) A 简单平均法 B 几何平均法 C 加权序时平均法 D 首末折半法 D 11.在测定长期趋势的方法中,可以形成数学模型的是( ) A 时距扩大法 B 移动平均法 C 最小平方法 D 季节指数法

eviews时间序列分析实验

实验一ARMA 模型建模 一、实验目的 学会检验序列平稳性、随机性。学会分析时序图与自相关图。学会利用最小二乘法等方法对ARMA 模型进行估计,以及掌握利用ARMA 模型进行预测的方法。学会运用Eviews 软件进行ARMA 模型的识别、诊断、估计和预测和相关具体操作。 二、基本概念 1平稳时间序列: 定义:时间序列{zt}是平稳的。如果{zt}有有穷的二阶中心矩,而且满足: (a)ut= Ezt =c; (b)r(t,s) = E[(zt-c)(zs-c)] = r(t-s,0) 则称{zt}是平稳的。 2 AR 模型: AR 模型也称为自回归模型。它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测。具有如下结构的模型称为P 阶自回归模型,简记为AR(P)。 x t = 0 + 1x t-1 + 2x t-2 + + p x t- p + t p0 E(t) = 0,Var(t) = 2 ,E(t s) = 0,s t Ex = 0,s t 3 MA 模型: MA 模型也称为滑动平均模型。它的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。具有如下结构的模型称为Q 阶移动平均回归模型,简记为MA(q)。 x t= +t-1t-1 -2t-2 - -q t-q q0 E() = 0,Var( ) = 2, E( ) = 0, s t 4 ARMA 模型: ARMA模型:自回归模型和滑动平均模型的组合,便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA。具有如下结构的模型称为自回归移动平均回归模型,简记为ARMA(p,q)。 x t= 0 + 1x t-1 + + p x t- p+ t- 1t-1 - - q t-q

第七章 时间序列分析习题

第七章时间序列分析习题 一、填空题 1.时间序列有两个组成要素:一是,二是。 2.在一个时间序列中,最早出现的数值称为,最晚出现的数值称为。 3.时间序列可以分为时间序列、时间序列和时间序列三种。其中是最基本的序列。 4.绝对数时间序列可以分为和两种,其中,序列中不同时间的数值相加有实际意义的是序列,不同时间的数值相加没有实际意义的是序列。 5.已知某油田1995年的原油总产量为200万吨,2000年的原油总产量是459万吨,则“九五”计划期间该油田原油总产量年平均增长速度的算式为。 6.发展速度由于采用的基期不同,分为和两种,它们之间的关系可以表达为。 7.设i=1,2,3,…,n,a i为第i个时期经济水平,则a i/a0是发展速度,a i/a i-1是发展速度。 8.计算平均发展速度的常用方法有方程式法和. 9.某产品产量1995年比1990年增长了105%,2000年比1990年增长了306.8%,则该产品2000年比1995增长速度的算式是。 10.如果移动时间长度适当,采用移动平均法能有效地消除循环变动和。 11.时间序列的波动可分解为长期趋势变动、、循环变动和不规则变动。 12.用最小二乘法测定长期趋势,采用的标准方程组是。 二、单项选择题 1.时间序列与变量数列( ) A都是根据时间顺序排列的B都是根据变量值大小排列的 C前者是根据时间顺序排列的,后者是根据变量值大小排列的 D前者是根据变量值大小排列的,后者是根据时间顺序排列的 2.时间序列中,数值大小与时间长短有直接关系的是( ) A平均数时间序列B时期序列C时点序列D相对数时间序列 3.发展速度属于( ) A比例相对数B比较相对数C动态相对数D强度相对数 4.计算发展速度的分母是( ) A报告期水平B基期水平C实际水平D计划水平 则该车间上半年的平均人数约为( ) A 296人 B 292人 C 295 人 D 300人 6.某地区某年9月末的人口数为150万人,10月末的人口数为150.2万人,该地区10月的人口平均数为( ) A150万人B150.2万人C150.1万人D无法确定 7.由一个9项的时间序列可以计算的环比发展速度( ) A有8个B有9个C有10个D有7个 8.采用几何平均法计算平均发展速度的依据是( )

时间序列分析上机操作题

` 情况如千人)920.1971年月—1993年6月澳大利亚季度常住人口变动(单位:下 问题:(1)判断该序列的平稳性与纯随机性。 (2)选择适当模型拟合该序列的发展。 (3)绘制该序列拟合及未来5年预测序列图。 针对问题一:将以下程序输入SAS编辑窗口,然后运行后可得图1. data example3_1; input x; time=_n_; cards; 63.2 67.9 55.8 49.5 50.2 55.4 53.1 49.9 45.3 48.1 55.2 61.7 42.1 30.4 49.5 59.9 30.6 33.8 36.6 44.1 28.4 35.8 32.9 45.5 34.2 29 49.8 37.3 39.5 48.8 49 47.6 37.3 47.6 43.9 39.2 67 65.4 60.8 65.4 51.2 48.9 47.3 49.6 62.5 55.1 67.6 57.3 48 49.1 44.5 47.9 48.8 45.5 55.8 60.9 51.6 51.4 59.4 60.9

64 62.1 71 64.6 58.6 60.3 55.9 59.9 75.4 79.4 83.4 80.2 62.5 69.5 59.1 21.5 58.5 65.2 170 -47.4 62.2 60 35.3 33.1 34.4 42.7 43.4 58.4 ; =example3_1; gplotproc data 文档Word ` plot x*time=1; symbol1c=red I=join v=star; ;run 图1 该序列的时序图 由图1可读出:除图中170和-47.4这两个异常数据外,该时序图显示澳大利亚季度常住人口变动一般在在60附近随机波动,没有明显的趋势或周期,基本可视为平稳序列。 再接着输入以下程序运行后可输出五方面的信息。具体见表1-表5. proc arima data= example3_1; identify Var=x nlag=8; ;run表1 分析变量的描述性统计 从表1可读出分析变量的名称、该序列的均值;标准差及观察值的个数(样本容量)。 表2 样本自相关图

时间序列的分析课后作业

《应用时间序列分析》 实训报告 实训项目名称时间序列预处理 实训时间 2013年10月14日 实训地点实验楼309 班级统计1004班 学号 1004100415 姓名范瑛

《应用时间序列分析》 实训(实践) 报告 实训名称时间序列预处理 一、实训目的 目的:熟悉平稳性检验方法和纯随机性检验方法的相关理论和软件实现的过程,并对结果给出解释,加深对理论的理解,提高动手能力。 任务:Eviews软件的常用菜单方式和命令方式操作;时间序列的自相关函数计算;序列的初步分析,并序列进行平稳性和纯随性进行检验,并写出实训报告。 二、实训要求 1、掌握Eviews软件的工作文件建立方法; 2、对时间序列进行初步分析,总结特征; 3、学会用Eviews软件计算时间序列分析相关函数的; 4、对序列进行平稳性和纯随性检验; 5、在上完机后要写出实验报告。 三、实训内容 1、熟悉Eviews软件的菜单操作和命令操作,包括工作文件的建立、数据的输入 与编辑、新序列的产生、在工作文件窗口中删除、更名变量、序列的各种观察(线图、各种统计量)以及时间序列的差分运算和相关函数的计算。本部分主要由教师来演示介绍。 2、初步对序列进行观察,对序列进行观察分析,求出序列的自相关函数和Q-统 计量,并对序列进行平稳性检验和纯随机性检验。 四、实训分析与总结 第一题 根据Eviews分析所得时间序列图如图1所示:

图1:系列样本序列时序图 该时序图显示系列样本有明显的递增趋势,所以它一定不是平稳序列。 Autocorrelation Partial Correlation AC PAC Q-Stat Prob . |****** | . |****** | 1 0.729 0.729 12.293 0.000 . |**** | . | . | 2 0.511 -0.042 18.682 0.000 . |*** | . | . | 3 0.342 -0.033 21.712 0.000 . |**. | . | . | 4 0.215 -0.025 22.983 0.000 . |* . | . | . | 5 0.124 -0.016 23.435 0.000 . | . | . | . | 6 0.063 -0.008 23.560 0.001 . | . | . | . | 7 0.026 -0.002 23.584 0.001 . | . | . | . | 8 0.008 0.003 23.586 0.003 . | . | . | . | 9 0.001 0.005 23.586 0.005 . | . | . | . | 10 0.000 0.003 23.586 0.009 . | . | . | . | 11 0.000 -0.001 23.586 0.015 . | . | . | . | 12 0.000 -0.001 23.586 0.023 图2:系列样本序列自相关图 从图中我们发现序列的自相关系数递减到零的速度相当缓慢,在很长的延迟 时期里,自相关系数一直为正。这是具有单调趋势的非平稳序列的一种典型的自 相关图形式。这和该序列时序图显示的显著的单调递增性是一致的。 第二题 根据Eviews分析所得时间序列图如图3所示:

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

时间序列分析习题

第8 章时间序列分析 一、填空题: 1.平稳性检验的方法有___________ 、_________ 和__________ 。 2.单位根检验的方法有:__________ 和___________ 。 3.当随机误差项不存在自相关时,用____________ 进行单位根检验;当随机误差 项存在自相关时,用___________ 进行单位根检验。 4. ___________________________________________________ EG检验拒绝零假设说明_______________________________________________________ 。 5. __________________________________________ DF检验的零假设是说被检验时间序列___________________________________________ 。 6. ____________________________ 协整性检验的方法有和。 7. 在用一个时间序列对另一个时间序列做回归时,虽然两者之间并无任何有意 义的关系,但经常会得到一个很高的R2的值,这种情况说明存在____________ 问题。 8. ________________________________________________ 结构法建模主要是以____________________________________________________________ 来确定计量经济模型的理论关系形式。 9. _________________________________ 数据驱动建模以作为建模的主要准则。 10. 建立误差校正模型的步骤为一般采用两步:第一步,______________________

时间序列分析作业

1、某股票连续若干天的收盘价如下表: 304 303 307 299 296 293 301 293 301 295 284 286 286 287 284 282 278 281 278 277 279 278 270 268 272 273 279 279 280 275 271 277 278 279 283 284 282 283 279 280 280 279 278 283 278 270 275 273 273 272 275 273 273 272 273 272 273 271 272 271 273 277 274 274 272 280 282 292 295 295 294 290 291 288 288 290 293 288 289 291 293 293 290 288 287 289 292 288 288 285 282 286 286 287 284 283 286 282 287 286 287 292 292 294 291 288 289 选择适当模型拟合该序列的发展,并估计下一天的收盘价。 解:根据上面的图和SAS软件编辑程序得到时序图,程序如下: data shiyan7_1; input x@@; time=_n_; cards; 304 303 307 299 296 293 301 293 301 295 284 286 286 287 284 282 278 281 278 277 279 278 270 268 272 273 279 279 280 275 271 277 278 279 283 284 282 283 279 280 280 279 278 283 278 270 275 273 273 272 275 273 273 272 273 272 273 271 272 271 273 277 274 274 272 280 282 292 295 295 294 290 291 288 288 290 293 288 289 291 293 293 290 288 287 289 292 288 288 285 282 286 286 287 284 283 286 282 287 286 287 292 292 294 291 288 289 ; proc print data=shiyan7_1; proc gplot data=shiyan7_1; plot x *time=1; symbol1c=red v=star i=spline; run; 通过SAS运行上述程序可得到如下结果:

R语言常用上机命令分功能整理——时间序列分析为主-13页word资料

第一讲 应用实例 ?R的基本界面是一个交互式命令窗口,命令提示符是一个大于号,命令的结果马上显示在命令下面。 ?S命令主要有两种形式:表达式或赋值运算(用’<-’或者’=’表示)。在命令提示符后键入一个表达式表示计算此表达式并显示结果。赋值运算把赋值号右边的值计算出来赋给左边的变量。 ?可以用向上光标键来找回以前运行的命令再次运行或修改后再运行。 ?S是区分大小写的,所以x和X是不同的名字。 我们用一些例子来看R软件的特点。假设我们已经进入了R的交互式窗口。如果没有打开的图形窗口,在R中,用:> x11() 可以打开一个作图窗口。然后,输入以下语句: x1 = 0:100 x2 = x1*2*pi/100 y = sin(x2) plot(x2,y,type="l") 这些语句可以绘制正弦曲线图。其中,“=”是赋值运算符。0:100表示一个从0到100 的等差数列向量。第二个语句可以看出,我们可以对向量直接进行四则运算,计算得到的x2 是向量x1的所有元素乘以常数2*pi/100的结果。从第三个语句可看到函数可以以向量为输入,并可以输出一个向量,结果向量y的每一个分量是自变量x2的每一个分量的正弦函数值。plot(x2,y, type="l",main="画图练习",sub="好好练", xlab="x轴",ylab='y轴') 有关作图命令plot的详细介绍可以在R中输入help(plot) 数学函数 abs,sqrt:绝对值,平方根log, log10, log2 , exp:对数与指数函数sin,cos,tan,asin,acos,atan,atan2:三角函数sinh,cosh,tanh,asinh,acosh,atanh:双曲函数 简单统计量 sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量,sort,order,rank 与排序有关,其它还有ave,fivenum,mad,quantile,stem等。 下面我们看一看S的统计功能: > marks <- c(10, 6, 4, 7, 8) > mean(marks) > sd(marks) > min(marks) > max(marks) 第一个语句输入若干数据到一个向量,函c()用来把数据组合为一个向量。后面用了几个函数来计算数据的均值、标准差、最小值、最大值。 可以把若干行命令保存在一个文本文件中,然后用source函数来运行整个文件: > source("C:/l.R") 注意字符串中的反斜杠。 例:计算6, 4, 7, 8,10的均值和标准差,把若干行命令保存在一个文本文件(比如C:\1.R)中,然后用source函数来运行整个文件。 a<- c(10, 6, 4, 7, 8) b<-mean(a) c<-sd(a) source("C:/1.R") 时间序列数据的输入

相关主题