搜档网
当前位置:搜档网 › LOGIT模型参数估计方法研究_金安

LOGIT模型参数估计方法研究_金安

LOGIT模型参数估计方法研究_金安
LOGIT模型参数估计方法研究_金安

第4卷第1期2004年2月

交通运输系统工程与信息

Jo ur nal of T r anspo rt atio n Sy stems Eng ineer ing and Infor matio n T echno lo gy

Vo l.4No.1Febr uar y 2004

文章编号:1009-6744(2004)01-0071-05

LOGIT 模型参数估计方法研究

金 安

(广州市规划局交通研究所,广州510030)

摘要: 离散选择模型,特别是L OG IT 模型在交通需求模型建立过程中,应用非常广泛,许多实际的交通政策问题都涉及到方式选择,然而L OG IT 模型的建立非常困难,尤其是效用函数及参数估计.本文重点就L O GIT 模型参数估计的有关问题进行讨论,特别是运用统计方法如何对效用函数的变量进行选取及比较不同形式效用函数.

关键词: L O GI T 模型;参数估计;t 检验;似然率检验中图分类号: N 945.12

On Methodology of Parameter Estimation in L OGIT Model

JIN An

(Instit ute o f T r aspo r tatio n,G uang zho u P la nning Bur eau,Guang zho u 510030,China )

Abstract : Disagg reg ate choice mo del ,especially L O GIT m odel ,hav e been used w idely in dev elo pment of tr avel demand mo del ,many pr actical tr anspor tation policy issues ar e concerned w ith mode choice.But pro cedure o f development of L OG IT mo del is difficult,especially mo del calibr atio n and for m of utility functio n.T his paper discuss r elat ional pr oblems o n development of L OG IT model,P articular emphasis is placed o n pr actical pr ocedur es for selection the co rr ect ex planato ry var iables and on compar ing differ ent ver sions of utility functio n using st atistical metho ds.Keywords : L OG IT mo del;par ameter est imation;t -test;likeliho od test

CLC number : N 945.12

收稿日期:2003-11-24

金安:广州市规划局交通研究所工程师,工学硕士.研究方向为交通规划及交通需求模型.

1 引 言

实践过程中,LOGIT 模型效用函数不可能预先知道,模型师在建立LOGIT 模型最初阶段几乎没有效用函数任何信息,最多认为在效用函数中会有哪些可能的变量,但也不能确定所有的变量是否都需要,更不可能知道哪些变量需要进行函数变换或效用函数参数的具体数值是多少.这些问题只有通过拟合合适的观测数据,并检验这些模型来确定哪一个最能够描述观测数据.本文主要介绍拟合和测试LOGIT 模型方法.

2 数据的要求

估计和检验过程的第一步是选择合适的观测数据,用于建立LOGIT 方式选择模型所需的数据有:

(1)对个体实际方式选择行为的观测.例如,

要建立工作出行方式选择模型,需要对上班出行者方式选择进行观测的数据.

(2)所有被选择和没有被选择方式的相关属性值.这些属性可能作为模型中的变量.例如,假设总出行时间被认为是模型中的一个变量,则对于样本中每一个个体而言,所需数据包括每一种可能方式的总出行时间.如果属性数据仅包含被选择方式,LOGIT 模型就不能建立.

(3)任何可能作为变量的个体属性值.例如,汽车拥有水平,则需要样本中每个个体家庭汽车拥有水平数.

3 模型的设定

所需数据收集后,下一步工作是设定一种或多种效用函数形式.设定步骤包括确定效用函数中变量、属性的函数变换以及效用函数的形式.这个步

骤通常不确定效用函数参数值.例如,建立LOGIT 方式选择模型,可以设定如下两种比选效用函数形式:

形式1

V DA=a1T DA+a2A+a3(1a)

V CP=a1T CP+a4A+a5(1b)

V B=a1T B(1c) 形式2

V DA=b1log(T DA)+b2A+b3(2a)

V CP=b1log(T CP)+b4A+b5(2b)

V B=b1lo g(T B)(2c) 在这些等式中,T表示出行时间(分),A表示出行者家庭汽车拥有量,a1~a5和b1~b5是参数.这个阶段设定的形式(1)和(2)并不意味着模型师必然相信其中一个是正确的,而是(1)和(2)都是模型师认为值得去估计和检验的效用函数形式.在估计和检验过程中,可以获取有助于确定是否这些形式应该修正的信息(例如从一个或两个形式中剔除一个或几个变量),以及提供确定哪一种函数形式能够更好地解释观测样本值.

4 估计结果的解释——模型检验

LOGIT模型一般采用最大似然估计法进行参数估计,LOGIT估计软件输出结果,除了模型参数的估计值外,还有许多用来解释估计参数的信息,用来决定哪一个参数应该包含在模型中,以及模型之间的比较.

4.1 估计的精确度——估计的标准误

大多数LOGIT估计软件的输出结果,除了参数估计值外,还有一套称为估计值的标准误.由于随机抽样误差的存在,某一参数估计值的标准误用来指示参数估计值偏离真值的大小.因此,估计值标准误是被估计参数精确度的指标.假如模型被正确的设定,则有0.95的概率相信真参数值落在估计值的1.96s(估计的标准误)范围内.换句话说,假如b est是参数的估计值,b tr ue是未知真值,s是估计的标准误,下面不等式以0.95的概率满足:

b est- 1.96s

4.2 决定是否保留变量——t统计量

除了参数估计的标准误外,大多数LOGIT软件还输出称为参数的t统计量.参数的t统计量通过参数估计值除以估计标准误来获取,即t=b est/s.

参数的t统计量用来确定与参数相对应变量在描述或解释观测值是否显著,因此t统计量决定一个变量是否应该留在还是剔除出模型非常有用.有显著解释能力的变量应该留下,而那些没有什么解释能力的变量应该剔除.一般来说,具有较大正或负t统计量的变量比t统计量在1和-1之间的变量更具有解释能力.因此,具有较大正或负t统计量的变量应该保留,而t统计量在1和-1之间的变量则可以从模型中剔除.不存在唯一t统计量分界线来区分变量去留与否.经验表明,t统计量大于1.0或小于-1.0的变量一般应当保留.但是如果参数的t统计量在这范围之外,它的符号却同理论不一致,则该模型不正确.例如方式选择模型中,出行费用的参数应该是负数,然而在模型中出行费用的参数是+0.50,t统计量为2.7,这个模型是不正确的,应该重新建立.

现实中t统计量较小并意味着相应的变量必须从模型中剔除.错误设定效用函数也可能引起一个或多个t统计量较小,甚至这些变量所表示的属性值对方式选择非常重要.例如,假如某一属性正确的表示是ln(X),但是在估计模型中,该属性被错误表示成X,则X参数的t统计量可能比较小,甚至X所表示的属性对方式选择非常重要,在这种情况下,假如用变量ln(X)代替X重新进行估计就有可能获得非常高的t统计量,因此,在根据t 统计量推断某一属性是否出现在效用函数中之前,应使用属性的不同函数变换进行比较实验.

另外一种情形,虽然是小的t统计量,但与此同时有两个或多个参数也是小的t统计量,这时就不表明该变量应该剔除.有这种可能,几个参数的t统计量比较小,但与之对应变量联合一起却有显著解释能力.换句话说,单个变量有低的解释能力,但一组这样的变量却有很高的解释能力.在这种情形下,就不能剔除其中的任何变量,尽管它们参数的t统计量比较小.

假设在汽车(A)和公交车(B)的方式选择模型中,效用函数表示成:

V A=b1+b2IVT T A+b3OVT T A

+b4C A+b5A+b6D(4a) V B=b2IVT T B+b3OVTT B+b4C B(4b)其中IVTT表示车内出行时间,OVTT表示车外出行时间,C表示出行费用,A表示出行者家庭汽车拥有量,D等于1假如出行的工作地在中央商务区,否则为0.假设估计结果如表1所示.

72交通运输系统工程与信息2004年2月

表1 t统计量估计结果

参数变量估计值标准误t统计量

b1In tercept 1.450.39 3.72

b2IVTT-0.00897-0.00632-1.42

b3OVT T-0.0308-0.0106-2.91

b4C-0.115-0.0262-4.39

b5A0.770.244 3.16

b6D-0.5610.783-0.716

b6的t统计量在-1.0和1.0之间,这意味着变量D解释能力很低,该变量可以从模型中剔除.没有其他变量的t统计量在- 1.0和1.0之间,因此,再没有其它变量可以剔除.

4.3 决定是否保留一组变量——似然率检验

大多数LOGIT估计软件输出样本LOG似然值.这个最大LOG似然值提供了决定一组变量是否可以从模型中剔除,这个过程称为似然率检验.直观地工作流程如下:

假如一组变量几乎没有什么解释能力,那么将它们从模型中剔除应该对最大LOG似然值没有什么影响,剔除一个或多个变量一般来说使最大LOG似然值减少,但如果变量没有什么解释能力的话,最大LOG似然值减少应该很少.换句话说,假如一组变量没什么解释能力,有、无这些变量对估计模型的LOG似然值差值接近于0.

似然率检验按以下步骤进行:

(1)对包括所有变量的模型进行估计.令LOG L1表示最大LOG似然值.

(2)剔除有问题的变量,重新估计模型.令LOG L2表示最大LOG似然值.

(3)计算LR=2(LOG L1-LOG L2).LR 称为似然率检验统计量,通常手工计算,一般为正值.

(4)假如LR超过合适的临界值CV,则被检验的变量应该保留在模型中,尽管它们所有的参数值的t统计量在-1.0和1.0之间.假如LR小于CV,则可以将这些变量从模型中剔除.

临界值CV,对于似然率检验统计量来说,同检验的变量数目有关.表2列出检验2到5个变量的合理临界值.单变量的似然率检验相当于4.2中所描述的t-检验.因此,对单个变量就没有必要实施似然率检验.

表2 似然率检验统计量的临界值

检验变量数临界值

2 2.408

3 3.665

4 4.878

5 6.064

假设LOGIT模型的估计满足表3结果.

表3 L OG IT模型的估计值

参数变量估计值标准误t统计量

b1Intercept 1.450.39 3.72

b2IVTT-0.00897-0.00632-1.42

b3OVT T-0.0308-0.0106-2.91

b4C-0.115-0.0262-4.39

b5A0.770.244 3.16

b6D-0.5610.783-0.716

log L=-374.4

假设无法确定变量IVT T和D对模型是否有显著的解释能力.为了确定是否这些变量应该从模型中剔除,利用如下的效用函数重新估计模型: V A=b1+b3OVT T A+b4C A+b5A(5a)

V B=b3OVTT B+b4C B(5b) 假设估计的结果如表4.则似然率检验统计量

表4 利用新效用函数的估计值

参数变量估计值标准误t统计量

b1Intercept 2.670.438 6.1

b3OVT T-0.0291-0.0143-2.04

b4C-0.175-0.0482-3.63

b5A0.5670.163 3.48

log L=-377.2

是LR=2[(-374.4)-(-377.2)]= 5.60.两个变量被检验,根据表2,两个变量似然率统计量的临界值是2.408.因此LR超过这个值,变量IVT T和D联合在一起具有显著的解释能力,尽管它们中的任何一个t统计量都在- 1.0和1.0之间.虽然每一个变量对选择结果的影响非常不准确,两变量任何一个都不能从模型中剔除.如果剔除这两个变量,会在剩余的参数估计上产生重大偏差,导致更大的预测误差.换句话,该模型不能够精确预测改变车内时间或工作地对方式选择影响,但是必须将这些变量保留在模型中防止其它变量变化影响预测的偏差.

73

第1期L O GIT模型参数估计方法研究

4.4 模型的比较——修正的似然率检验

到目前为止,所有模型检验的讨论都只是检验是否某一或一组变量应该从模型中剔除.并不是所有的检验都可以采用这种方法.例如,假设有两套方式选择LOGIT模型,要求确定哪一个模型能够更好地解释观测数据.假设这些模型的效用函数如下:

M odel1:V=a1T+a2C(6)

M odel2:V=b1lo g T+b2C(7)其中T和C分别表示出行时间和出行费用,a1、a2和b1、b2是常参数.前面讨论的t和似然率检验就不能用来确定哪一个模型更好,这是因为没有一个模型能够通过增加一个变量或剔除一个变量从另外一个中推导出来.这种不能通过增加一个变量或剔除一个变量从另外一个中推导的模型称为No n-Nested.

直觉上认为,假如两个Non-Nested模型中一个比另外一个能更好解释观测数据,则更好的模型应该有更大的LOG似然值.因此,期望建立有如同似然率检验类似的一种检验来测试No n-Nested 模型.

修正的似然率检验过程如下:

假设No n-Nested模型叫做模型1和2,LOG L1和LOG L2分别表示模型1和2的最大LOG 似然值,K1和K2分别表示两个模型中参数的数目,(例如在等式(6)和(7)中,K1=K2=2),假如LOG L2

定义修正的似然率检验统计量如下:

M LR=(lo g L1-K1/2)-(lo g L2-K2/2)

(8)假如M LR> 1.35,则模型1在解释观测数据优于模型2.

考虑LOGIT方式选择模型,其效用函数如下:

M odel1:V=a1logIVT T+a2log OVTT+a3C

(9) M odel2:V=b1T+b2C(10)其中T、IVT T、OVT T和C分别表示总出行时间,车内出行时间,车外出行时间和出行费用,a1、a2、a3和b1、b2、b3是常参数.假设两个模型的最大似然估计结果是log L1=-437.7和log L2=-440.2.模型1中有3个参数,模型2中有2个参数,因此K1 =3和K2=2.修正的似然率检验统计量是:

M LR=(-437.7-3/2)

-(-440.2-2/2)= 2.00

由于MLR超过1.35,模型1比模型2更好解释观测数据.

5 另外一些估计的问题

有几种设定错误使LOGIT模型不能用最大似然法估计,这时估计软件将会异常终止,并产生错误或警告提示,在这些情况下的任何估计都是无意义的.

(1)使用太多的特定方案(alter native-specific)常量.

在大多数的实际问题中,LOGIT方式选择模型的效用函数包括特定方案常量,而模型中这些常量的数目不应超过交通方式数减1.假如特定方案常量等于交通方式数,则就不可能有唯一的参数解集满足样本LOG似然值最大.这通常会引起估计软件异常中断或产生一些提示估计发生的问题.

(2)错误设定社会经济变量.

社会经济变量,如收入和汽车拥有水平,对于所有的方案来说都是相同的.这些变量当且仅当以特定方式(mode specific)或乘以或除以一个属性值(其值在各方案中是不同的)进入到LOGIT模型中.假如它们以一般性(g eneric)变量进入到LOGIT模型的效用函数中,则这些变量对选择概率不发生作用.结果一般性的社会经济变量同LOGIT模型中其他变量不发生相互作用,也就不存在唯一的参数解集满足样本LOG似然值最大,估计软件将会异常终止.

以特定方式表示的社会经济变量的数目不能超过模型中交通方式数减1,违反这条规则将导致参数估计失败,LOGIT估计软件异常终止或产生错误信息.

(3)变量的完全多种相关性.

完全多种相关性指的是这样情形,效用函数中一个或多个变量恰恰是其它几个变量的线性组合.例如,假设T,IVTT,和OVTT分别表示全部出行时间,车内出行时间和车外出行时间.假设LOGIT的效用函数设定如下:

V=b1T+b2IVT T+b3OVT T+其它项

(11)则完全多种相关性存在,因为T恰恰是IVTT和OVT T的线性组合.即T=IV TT+OVT T.完全多种相关性对估计引起的问题可以通过重写

74交通运输系统工程与信息2004年2月

(11)解释:

V=b1(IVT T+OVT T)+b2IVTT

+b3OVT T+其它项(12) =(b1+b2)IVT T+(b1+b3)OVT T+其它项

(13)等式(13)显示选择预测仅仅依赖b1+b2和b1+b3的值.但是有无穷多种b1、b2、b3组合满足相同的b1 +b2和b1+b3的值.结果就不可能找到唯一b值满足样本LOG似然值最大.

6 结论

本文着重解释了估计LOGIT选择模型的方法.同时也描述了统计过程,用来指导变量的选择和LOGIT模型的检验.这些统计过程在建立模型时非常关键,但必须清楚地认识到任何统计方法都不能孤立保证建立一个满意的模型.与其说建模是门科学,不如说更像一门艺术,判断和经验都是其重要组成部分.

即使有客观的统计方法存在时,也需要判断和经验,这主要是统计检验不能确定一个模型正确与否,它们仅能确定一个模型是否错误,统计方法很少能够洞察为什么模型是错误的,以及如何修正.模型师必须用判断和经验确定错误最有可能来源,之后修改模型消除错误.修改后的模型也需进一步统计检验以确定它们错误与否.因此,实际建立模型的过程经常是统计分析和判断交替进行的活动.

参考文献

[1] M Ben-A kiva and S.R.L erman.Discr ete Choice

Analysis:T heor y and A pplication to T rav el

Demand[M].T he M.I.T.Pr ess,Cambr idg e,

M A,1985.

[2] Br uce D.Spear.A pplications of New T rav el

Demand F or ecast ing T echniques t o T ranspo rt atio n

Planning:A Study o f Indiv idua l Choice M odels.U.

S.Depar tment of T ranspo r tatio n,1977.

[3] J.d.D.O r t zar and L.G.W illumsen.M odelling

T r anspor t[J].John Wiley&So ns,1994.

[4] Hag ue Consulting Gr oup.A L OG IT 4.0help-file.

(上接第70页)

在此基础上,参考华北地区其它收费公路的费率标准,拟定低费率方案如表3所示。

表3 津蓟公路项目收费费率低方案

路段车型费率(元/车公里)

津蓟高速公路A型车0.50 B型车0.80 C型车 1.20 D型车 1.60

津围及九园高速公路A型车0.25 B型车0.50 C型车0.65 D型车 1.00

注:同表2

另外,考虑到未来经济发展因素,建议收费标准每隔5年按20%增长。

结合本文中模型建立及求解过程,尚有以下两个方面有待改进:一是上层模型以规划管理者行为为导向,对高速公路社会效益的量化模拟不够充分;其次收费问题的双层规划模型存在许多局部最优解,如果路网规模较大,最优费率的获得对于运算速度和收敛效果的要求比较高。因此,如何建立更有效、完善的约束和引入智能求解算法是作者下一步要开展的工作。

参考文献

[1] 黄海军.城市交通网络平衡分析理论与实践[M].北

京:人民交通出版社,1994.

[2] 刘伟铭,等.高速公路收费系统理论与方法[M].北

京:人民交通出版社,2001.

[3] 高自友,四兵峰.市场经济条件下铁路旅客票价分析

优化模型与求解算法[M].北京:中国铁道出版社,

2001.

[4] 宋一凡,高自友.连续平衡网络设计问题的双层规划

模型及其求解算法[J].公路交通科技,1999.3

[5] 李志纯,等.弹性需求下拥挤道路收费的模型与算法

研究[J].交通运输工程学报,2001.9

[6] T obin R L,F riesz T L.Sensitiv ity analysis fo r

equilibr ium net wo rk flow[J].T ranspo rt atio n

Science,1988,22:242-250.

[7] Yang H.Sensitiv ity analy sis for queuing equilibrium

net wo rk flow and its applicatio n t o tr affic co ntro l

[J].M ath.Co mp.M o deling,1995,22A:247-258.

75

第1期L O GIT模型参数估计方法研究

时间序列分析与综合--ARMA模型的阻尼最小二乘法

论文题目:ARMA模型的阻尼最小二乘法班级: 姓名: 学号: 指导教师:

摘要 ARMA模型是将实际问题利用时间序列建立起的模型,只要把ARMA模型的参数估计出来,实际问题就能解决了。本文只对讨论了ARMA模型参数的优化理论估计方法的一种:阻尼最小二乘法。非线性时间序列ARMA模型参数的优化估计法一阻尼最小二乘法,它结合了Newton法和最速下降法的优点,既保证了迭代计算的收敛性,又加快了收敛的速度。当初值的精度较差时,更宜采用阻尼最小二乘法。本文给出实例的MATLAB程序,并利用t统计量检验出阻尼最小二乘法要比最小二乘法的参数估计值更为显著,拟合模型更优。 关键词:非线性;阻尼最小二乘法;ARMA;MATLAB Abstract ARMA model is to establish a real problem using time series models, As long as the ARMA model parameters estimated from the actual problem can be solved. Nonlinear time series ARMA model parameter optimization estimation method—Damped least squares method, It combines the advantage of Newton method and the steepest descent method, It not only ensures the convergence of iterative calculations, but also accelerate the speed of convergence. When the accuracy of the original value is poor, it better to using qualified damped least squares method. This paper gives examples of the MATLAB program,And use the t-statistic tests the damped least squares method more significant than the method of least squares parameter estimates, and better fitting model. Keywords: Nonlinear; Damped least squares method; ARMA; MATLAB

基于Logit模型的上市公司评级研究

基于Logit模型的上市公司评级研究 摘要:本文选用Altman的ZETA模型中7个变量,利用Logit 模型对我国上市公司进行了评级分类,结论表明Logit模型能够将估计样本中的71.89%的公司进行正确评级分类,而能将预测样本中62.50%的公司进行正确评级分类,Logit 模型对我国上市公司的评级具有一定的效力。 关键词:Logit模型;上市公司;评级 一、引言 我国股票市场和债券市场的扭曲发展不仅使得资本市场的资源配置作用并未得到有效发挥,而且使得股票市场独自承担了所有的市场风险,从而导致了股票市场的巨大波动。然而,引起我国债券市场发展滞后的主要原因之一就是债券评级制度的不成熟。因此,对上市公司能够做出独立且正确的信用评级,不仅可以引导投资者做出正确的投资决策,完善市场结构,还对我国债券市场乃至整个资本市场的健康发展具有重要的意义。 随着资本市场的资本配置作用日益显著,公司的信用评级研究在国内外都有了巨大的发展。Altman(1968)与Altman等(1977)利用多元判别分析(MAD)分别建立了著名的得分模型和第二代信用评分模型,即ZETA模型。Ohlson (1980)将Logit模型引入到公司财务危机预测上来,发现logit模型能够将具有不同财务质量的公司做出有效的分类。李湛和徐一骞(2009)运用Altman的Z 得分模型,检验了2006-2007年由中诚信所作信用评级的34家企业,结果表明我国企业存在众多信用评级相背离的现象。刘瑞霞、张晓丽、陈小燕以及郝艳丽(2008)将多元有序Logit模型应用于我国的信用评级,并选取我国53家上市公司作为样本对Logit模型的适用性进行了检验,但未对结果做出详细的分析。 本文将659家具有五种不同财务质量的公司分为估计样本和测试样本,以Altman的ZETA模型中的7个变量作为本文的解释变量,应用Logit模型对我国上市公司进行信用评级,结论表明Logit模型对我国上市公司具有较好的分辨能力,能够把不同财务质量的上市公司进行有效区分。 二、变量及数据 在大量的实证检验中,由于Altman的ZETA模型具有较高的信用分辨能力,因此,本文直接采用ZETA模型由财务指标构造的的7个变量,分别是:资产收益率、收益稳定性指标、留存收益/总资产、利息保障倍数、资本化率、流动比率和规模。下表是对本文变量的简要说明。 表1 变量说明 对于因变量y,本文从我国A股市场一共选取了659家上市公司,根据其风险属性将这659家公司分成5类不同的风险级别。并且将样本分为估计样本和预

基于Logit模型的中小企业信贷风险实证分析

基于Logit模型的中小企业信贷风险实证分析 【摘要】中小企业普遍存在的“融资难”现象影响了中小企业的发展。文章分析了中小企业的信贷风险,适当选取2013年上市公司为样本,利用SPSS统计软件,运用因子分析方法对中小企业信贷风险指标进行了筛选,构建了基于Logit回归模型的中小企业信贷风险度量模型。实证分析表明,模型具有较高的有效性和准确性,可作为中小企业信贷风险评估的科学依据。 【关键词】中小企业;信贷风险;因子分析;Logit回归模型 一、引言 中小企业在国民经济发展中具有重要地位,在推动技术创新、缓解就业压力、方便群众生活、保持社会稳定等方面发挥着重要作用。但是,相对于大型企业而言,中小企业一般规模较小、员工素质不高、研发投入不足、把握市场能力较弱,在激烈的市场竞争中缺乏应变能力,使商业银行对其设置了严格的融资约束和限制,普遍出现“融资难”的情况,导致经营状况、财务状况越来越差,进一步加剧了中小企业获取资金的难度。为了改善中小企业经营环境,促进中小企业健康发展,中国人民银行先后发布了有关服务中小企业的货币信贷政策和指导意见,加大了对中小企业的信贷支持。工业和信息化部发布的《“十二五”中小企业成长规划》指出,中小企业成长面临着国际和国内经济巨大变革带来的历史机遇和严峻挑战,提出了完善政策、加强金融支持等一系列保障措施。根据中国人民银行发布的《2013年金融机构贷款投向统计报告》,金融机构(含商业银行及农村合作社、城市信用社和外资银行等)全年中小企业贷款余额增加1.63万亿元,占全部企业新增贷款的43.5%;年末小企业贷款余额13.21万亿元,同比增长14.2%。因此,研究中小企业面临的信贷风险,分析其来源和表现形式,科学地度量其风险水平,对于提高中小企业风险控制能力具有重要的理论价值和现实意义。 二、中小企业信贷风险分析 目前,中小企业财务融资和信贷风险主要表现在:融资渠道单一、融资成本较高、信贷支持不够等方面。现有的信贷风险分析的方法和度量模型,大多数针对大型上市公司,并没有一套完全适合我国中小企业信贷风险的评价体系。针对我国中小企业自身的特点,结合我国的经济发展状况和中小企业面临的环境,分析中小企业信贷现状和存在的风险,是建立中小企业信贷风险度量模型的基础。 与大型企业不同,中小企业信贷风险来源广泛,主要是宏观经济风险、金融机构的风险、企业自身的风险等方面。 1.宏观经济风险。宏观政策风险——宏观政策的调整(产业政策调整、信贷政策紧缩及出口退税政策等)可能为中小企业带来不可抗力的市场风险;利率风险——当财政和货币政策较为宽松时,贷款利率降低,融资成本较低,反之会增大企业的融资风险;汇率风险——对涉及进出口、外贸型的中小企业,汇率变动风险也是不可忽略的。

Logit模型

Logit模型 LOGLINEAR vary (1,2) BY devolve(1,2) data(1,2) /CRITERIA=DELTA(0) /PRINT=ESTIM /DESIGN=vary vary by devolve vary by data . CROSSTABS /TABLES=vary BY devolve BY data /FORMAT= A V ALUE TABLES /CELLS= COUNT . 饱和模型和分层模型 HILOGLINEAR data(1 2) vary(1 2) devolve(1 2) /METHOD=BACKWARD /CRITERIA MAXSTEPS(10) P(.05) ITERATION(20) DELTA(0) /PRINT=ASSOCIATION /DESIGN . try’s data analyze HILOGLINEAR str(1 2) in(1 2) mea(1 2) /METHOD=BACKWARD /CRITERIA MAXSTEPS(10) P(.05) ITERATION(20) DELTA(0) /PRINT=ASSOCIATION /DESIGN . LOGLINEAR str (1,2) BY in(1,2) mea(1,2) /CRITERIA=DELTA(0) /PRINT=ESTIM /DESIGN=str str by in str by mea . CROSSTABS /TABLES=str BY in BY mea /FORMAT= A V ALUE TABLES /CELLS= COUNT . LOGLINEAR ch (1,2) BY stan(1,2) ore(1,2) sit(1,4) /CRITERIA=DELTA(0) /PRINT=ESTIM /DESIGN=ch ch by stan ch by ore ch by sit .

ARMA模型的参数估计主要内容(精)

第六章 ARMA 模型的参数估计—主要内容 §6.1 AR(p)模型的参数估计 问题: 已知p 的AR(p): 1 ,0p t j t j t j X a X t ε-==+≥∑,2~WN(0,)t εσ.(1.1) 由12{,,,}N x x x 去估计12(,,,)T p a a a =a 和2σ. 1. AR(p)模型的Yule-Walker 估计 自回归系数p a 由自协方差函数{}k γ惟一确定.

1111210 2212 0p p p p p p a a a γγγγγγγγγγγγ----?????? ?????? ??=??????????????? ??????? 白噪声的方差2σ由2 0T p p σγ=-γa 决定. 现获12{,, ,}N x x x , N p >, 则作 (1) ,1~t t N y x x t N =-=; (2) 1 1 ?,0,1, ,N k k j j k j y y k p N γ-+== =∑;

(3) 只要12,, ,N x x x 不全同, 则?p Γ正定, 得惟一 1???p p p -=a Γγ, 2100????????T T p p p p p σγγ-=-=-γa γΓγ. 实用中, Levinson 递推公式(无需求逆, 快): (1)2 001,1 10222 1,1,11,2 1,1,101,12,2,1,,1,1,1????????(1)???????...????????...????,1,k k k k k k k k k k k k k k k k k k k j k j k k k k j a a a a a a a a a a a a a j k k p σγγγσ σγγγγγγγγ-+-++++++-?=?=??=-??----?=?----? =-≤≤≤??

基于Logit模型的上市公司财务预警模型研究以及实证分析

基于Logit模型的上市公司财务预警模型研究以及实证分析 【摘要】上市公司是现代公司的最高形式,上市公司的数量和质量直接影响着证券市场的兴衰。在上海和深圳证券交易所上市公司需要连续三年盈利,上市之后如果连续两年亏损,就会被戴上ST的帽子,这标志着上市公司陷入了财务困境。本文以沪深A股市场上于2015年被ST和未被ST的上市公司为研究的总体,随机抽取样本90个,并结合公司的财务数据,尤其是代表公司经营状况的动态指标,来预测企业在未来一年内是否会有财务危机,给公司的财务人员预警,同时也有利于投资者判断一家公司的发展状况,做出合理决策。 【关键字】上市公司财务预警Logit模型 一、引言 (2) 1.1财务预警模型的研究背景 (2) 1.2财务预警模型的研究概况 (2) 1.3本文的创新之处 (2) 二、Logit模型简介 (2) 三、样本和财务指标的确定 (3) 3.1样本采集 (3) 3.2财务指标的初步选择 (3) 四、财务预警模型的实证分析 (4) 4.1案例处理摘要 (4) 4.2模型汇总 (4) 4.3Hosmer-Lemeshow检验结果 (5) 4.4预测分类结果 (5) 4.5逐步回归过程 (7) 4.6不在方程中的统计变量 (9) 4.7预测概率直方图 (9) 五、模型的改进和对上市公司风险防范的建议 (11) 5.1模型的改进 (11) 5.2对上市公司的建议 (11) 参考文献 (12)

一、引言 1.1财务预警模型的研究背景 现代企业从创业到发展,都在追求一个目标——上市。而在我国的股票市场上,公司上市需要最近三年连续盈利,上市后的公司要接受社会的监督,定期公布财务报告以及其他信息,因此我们可以很容易得到上市公司的财务指标,相比通过经验来判断公司的财务状况,财务指标是量化的,更容易分析。 一个公司的财务指标一定程度上反映了该公司的财务状况,从财务状况我们可以看出该公司的经营管理情况以及发展情况,如果一个公司财务发生了危机,那么整个公司的现状也令人担忧。因此,正确的预测企业财务危机将有助于保护投资者和债权人的权益、有助于经营者防范财务危机、有助于政府管理部门监控上市公司质量和证券市场的风险,所以建立企业财务危机预警模型具有重要意义。 各种不同的原因共同导致了公司的财务危机,既有企业内部的原因,也有企业外部不可控制的原因。以下我们归纳归属于企业自身的原因: 1.公司管理者盲目追求扩张,决策缺乏科学性。 2.企业筹资方式不当,资本结构不合理 3.企业内控制度不完善,公司治理结构不合理。 如果企业不对其存在的问题作出快速的反映,在不断创新和变革的时代,最终会走向破产,因此财务预警能够在公司财务危机发生前进行预测,避免其陷入财务困境。 1.2财务预警模型的研究概况 对上市公司的财务预测和预警的常用模型是上市公司信用风险度量,我国关于财务风险预警分析的研究起步较晚,而国外开始相关领域的研究比较早,已有企业将财务风险预警模型投入实际运用中。信用风险的度量和管理的探索大致可分为三个阶段;第一个阶段是1970年以前,主要分析工具有5C分析法、LAPP 法、五级分类法,大多数金融机构基本上是依据银行专家的经验和主管分析来评估信用风险。第二个阶段是建立于基于财务报表的信用评级模型,主要有Logit 模型、线性比率模型、Probit模型、判别分析模型等。第三个阶段是进入20世纪90年代以来,西方若干商业银行以风险价值为基础,开始运用数学工具、现代金融理论来定量研究信用风险,建立了以违约概率、预期损失率为核心指标的度量模型。 1.3本文的创新之处 我国财务预警模型处于发展初期,复杂的财务预警模型在实践中运用较少。简单而又实用的预警模型应属Logit模型,多数学者已对Logit模型进行了实证分析,肯定了Logit模型有较好的预测能力。本文拟对Logit模型在上市公司财务危机预警分析与评估应用方面进行研究,避开大多数研究者选取的盈利指标等静态指标,以与上市公司经营状况有关的财务指标为变量(包括两个动态指标)通过实证分析验证改进结果。 二、Logit模型简介 Logit方法采用logistic回归建立一个非线性模型,其曲线是s型或倒s 型。因变量的取值在O~1之间,回归方程为:

时间序列ARMA模型及分析

ARMA模型及分析 本次试验主要是通过等时间间隔,连续读取70个某次化学反应的过程数据,构成一个时间序列。试对该时间序列进行ARMA模型拟合以及模型的优化,最后进行预测。以下本次试验的数据: 表1 连续读取70个化学反应数据 47 64 23 71 38 64 55 41 59 48 71 35 57 40 58 44 80 55 37 74 51 57 50 60 45 57 50 45 25 59 50 71 56 74 50 58 45 54 36 54 48 55 45 57 50 62 44 64 43 52 38 59 55 41 53 49 34 35 54 45 68 38 50 60 39 59 40 57 54 23 资料来源:O’Donovan, Consec. Readings Batch Chemical Proces, https://www.sodocs.net/doc/0c14185606.html,ler et al. 下面的分析及检验、预测均是基于上述数据进行的,本次试验是在Eviews 6.0上完成的。 一、序列预处理 由于只有对平稳的时间序列才能建立ARMA模型,因此在建立模型之前,有必要对序列进行预处理,主要包括了平稳性检验和纯随机检验。 序列时序图显示此化学反应过程无明显趋势或周期,波动稳定。见图1。

图2 化学反应过程相关图和Q统计量 从图2的序列的相关分析结果:1. 可以看出自相关系数始终在0周围波动,判定该序列为平稳时间序列2.看Q统计量的P值:该统计量的原假设为X的1期,2期……k期的自相关系数均等于0,备择假设为自相关系数中至少有一个不等于0,因此如图知,该P值在滞后2、3、4期是都为0,所以拒接原假设,即序列是非纯随机序列,即非白噪声序列(因为序列值之间彼此之间存在关联,所以说过去的行为对将来的发展有一定的影响,因此为非纯随机序列,即非白噪声序列)。 二、模型识别 由于检验出时间序列是平稳的,且是非白噪声序列,因此可以建立模型,在建立模型之前需要识别模型阶数即确定阶数。阶数确定要借助于时间序列的相关图,即序列的自相关函数和偏自相关函数,并根据他们之间的理论模式进行阶数最后的确定。 下面给出自相关函数和偏自相关函数之间的理论模式:

Logistic模型应用模板

基于logistic模型的2014年影响中国各省城市化水平的 经济地理因素分析 摘要:本文利用2013年中国31个省份的数据,从经济与地理位置两个因素出发,运用logistic回归的方法在SPSS软件上进行分析。结果显示:中国城市化发展水平不仅与经济密切相关,而且与其地理位置也有很大的关系,地区间城市化发展水平差距较明显,城市化各方面的因素水平发展不平衡。 关键词:logistic模型,城市化水平,SPSS软件

目录 一、引言 (3) 二、Logistic模型 (3) 1. 基本概念 (3) 2. 统计原理 (4) (1)logit变换 (4) (2)Logistic回归模型 (4) (3)统计检验 (4) 三、基于logistic模型的我国各省城市化水平影响因素实证分析 (5) 1.数据来源与说明 (5) 2.模型检验 (5) 3.模型的建立与预测 (6) 四、结论 (7) 参考文献 (8)

一、引言 城市化的定义众多,本文参照《中华人民共和国国家标准城市规划术语》,认为城市化是“人类生产与生活方式由农村型向城市型转化的历史过程,主要表现为农村人口转化为城市人口及城市不断发展完善的过程。”城市化是一个系统的动态过程,包含了人口、经济、社会、城市建设等各方面变化的影响。它是经济发展和社会进步的必然结果,反过来也推动了经济的发展和社会的进步。 中国大陆的城市化进程在不同的时期具有不同的特点,总的来看城市化水平普遍较低,并已成为制约国家经济、社会和谐发展的主要原因之一。因而,各地区普遍把推进城市化进程作为经济、社会发展战略的一项重要目标选择。当前中国大陆已经进入了城市化水平的持续上升发展时期,此时对这样一个过程实施有效、客观、科学、动态的监测,从而及时发现并解决城市化进程中出现的难题,就必须加强对中国大陆城市化水平质与量等方面的考察和研究。这对于我们这样一个人口众多、区域经济发展不平衡的国家尤为重要。 本文不仅分析影响城市化水平的经济因素,还加入了地理位置对其城市化发展的影响。由于地理因素数据不是数值型变量,因此我们引用logistic回归方法对其进行建模。 二、Logistic模型 1.基本概念 Logistic回归分析就是针对因变量是定型变量的回归分析,这与一般的回归分析不同。在实际生活中,我们会经常遇到因变量是定型

基于logit模型的旅客出行选择行为

浅析基于logit模型的旅客出行选择行为摘要:通过分析铁路客流构成和旅客列车分类,将铁路旅客乘车选择行为的影响因素归结为旅客主体特性、列车特性和随机因素。采用随机效用理论建立铁路旅客乘车选择行为非集计模型,给出个体旅客对列车选择概率的多项logit模型,并通过影响因素选择及参数标定等设定求解方法。 关键词:铁路旅客运输;乘车选择行为;影响因素;logit模型abstract: through the analysis of railway passenger traffic composition and classification of passenger trains, railway passengers’ choice behavior will choose the influence factors of subject characteristics, boil down to the passenger train characteristics and random factors. using the random utility theory, a railway passengers’ choice behavior choice disaggregate model given individual passengers on the train choose a number of probability logit model, and through the influence factors such as parameters calibration set choice and the solving method. keywords: railway passenger transportation; bus choice behavior; influencing factors; logit model 中图分类号:f530.32 文献标识码:a 文章编号: 对旅客出行选择行为的研究,向来是铁路运输组织研究的重要

R语言实现ARMA模型的估计

基于R 的ARMA 模型的估计 首先,我们给出一个ARMA 模型:110.60.8t t t t y y εε--=-+- 随机生成一组含200个观测值的时间序列,代码如下: #ARMA(1,1) y[t]=-0.6y[t-1]+x[t]-0.8x[t-1] set.seed(10) x<-rnorm(200) y<-vector(length=2) y[1]=x[1] for(i in 2:200) { y[i]=-0.6*y[i-1]+x[i]-0.8*x[i-1] } y 事实上,在R 中有更简单的语句可以生成ARIMA 时间序列,以上述ARMA (1,1)模型为例: set.seed(10) y<-arima.sim(list(order=c(1,0,1),ar=-0.6,ma=-0.8),n=200) 在本次实验中,我们采用第一种方法生成的时间序列做估计。 时间序列图如下: ts.plot(y) ACF 和PACF 图如下: acf(y,xaxp=c(0,20,20),yaxp=c(-1,1,10)) pacf(y,xaxp=c(0,20,20),yaxp=c(-1,1,10))

下面给出三个模型的估计: 模型1:11t t t y a y ε-=+ 模型2:1111t t t t y a y b εε--=++ 模型3:1122t t t t y a y a y ε--=++ 【模型1】 a<-1;b<-0,c<-0 ARMA<-arima(y,order=c(a,b,c),method="ML") ARMA SBC 准则: #SBC=-2ln(模型中极大似然函数值)+ln(n)(模型中未知参数个数) loglike<-ARMA$loglik SBC<--2*loglike+log(200)*1 SBC 残差平方和: residual<-ARMA$residuals #残差 ssr<-0 for(i in 1:200) { ssr=ssr+(residual[i]^2)

ARMA模型建模与预测指导

实验一ARMA 模型建模与预测指导 一、实验目的 学会通过各种手段检验序列的平稳性;学会根据自相关系数和偏自相关系数来初步判断ARMA 模型的阶数p 和q ,学会利用最小二乘法等方法对ARMA 模型进行估计,学会利用信息准则对估计的ARMA 模型进行诊断,以及掌握利用ARMA 模型进行预测。掌握在实证研究中如何运用Eviews 软件进行ARMA 模型的识别、诊断、估计和预测和相关具体操作。 二、基本概念 宽平稳:序列的统计性质不随时间发生改变,只与时间间隔有关。 AR 模型:AR 模型也称为自回归模型。它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测, 自回归模型的数学公式为: 1122t t t p t p t y y y y φφφε---=++++ 式中: p 为自回归模型的阶数i φ(i=1,2, ,p )为模型的待定系数,t ε为误差, t y 为一个平稳时间序列。 MA 模型:MA 模型也称为滑动平均模型。它的预测方式是通过 过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为: 1122t t t t q t q y εθεθεθε---=---- 式中: q 为模型的阶数; j θ(j=1,2, ,q )为模型的待定系数;t ε为误差; t y 为平稳时间序列。 ARMA 模型:自回归模型和滑动平均模型的组合, 便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA , 数学公式为: 11221122t t t p t p t t t q t q y y y y φφφεθεθεθε------=++ ++---- 三、实验内容及要求 1、实验内容: (1)根据时序图判断序列的平稳性; (2)观察相关图,初步确定移动平均阶数q 和自回归阶数p ; (3)运用经典B-J 方法对某企业201个连续生产数据建立合适的ARMA (,p q )模型,并能够利用此模型进行短期预测。 2、实验要求: (1)深刻理解平稳性的要求以及ARMA 模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARMA 模型;如何利用ARMA 模型进行预测; (3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。 四、实验指导 1、模型识别 (1)数据录入

ARMA模型建模与预测

实验一 ARMA 模型建模与预测 一、实验目的 学会通过各种手段检验序列的平稳性;学会根据自相关系数和偏自相关系数来初步判断ARMA 模型的阶数p 和q ,学会利用最小二乘法等方法对ARMA 模型进行估计,学会利用信息准则对估计的ARMA 模型进行诊断,以及掌握利用ARMA 模型进行预测。掌握在实证研究中如何运用Eviews 软件进行ARMA 模型的识别、诊断、估计和预测和相关具体操作。 二、基本概念 宽平稳:序列的统计性质不随时间发生改变,只与时间间隔有关。 AR 模型:AR 模型也称为自回归模型。它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测, 自回归模型的数学公式为: 1122t t t p t p t y y y y φφφε---=++++ 式中: p 为自回归模型的阶数i φ(i=1,2, ,p )为模型的待定系数,t ε为误差, t y 为一个平稳时间序列。 MA 模型:MA 模型也称为滑动平均模型。它的预测方式是通过 过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为: 1122t t t t q t q y εθεθεθε---=---- 式中: q 为模型的阶数; j θ(j=1,2, ,q )为模型的待定系数;t ε为误差; t y 为平稳时间序列。 ARMA 模型:自回归模型和滑动平均模型的组合, 便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA , 数学公式为: 11221122t t t p t p t t t q t q y y y y φφφεθεθεθε------=++++---- 三、实验内容及要求 1、实验内容: (1)根据时序图判断序列的平稳性; (2)观察相关图,初步确定移动平均阶数q 和自回归阶数p ; (3)运用经典B-J 方法对某企业201个连续生产数据建立合适的ARMA (,p q )模型,并能够利用此模型进行短期预测(2步预测)。 2、实验要求: (1)深刻理解平稳性的要求以及ARMA 模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARMA 模型;如何利用ARMA 模型进行预测; (3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。 (4)完成实验报告

相关主题