多指标面板数据的聚类分析研究

发布时间 : 星期四 文章多指标面板数据的聚类分析研究更新完毕开始阅读

处理,而是直接从横截面个体p维随机变量Xj的联合概率分布出发,定义了由分布概率值构成的相似性指标。

Bonzo和Hermosilla (2002)定义了如下的概率连接函数:

T?k(j1,j2)??atP[?0k(Xj1,t,Xj2,t)??0k(xj1,t,xj2,t)](3-9)

t?1T

其中常数序列

是在时间t上的权重系数,?at=1,在通常

t-1情况下,Bonzo和Hermosilla (2002)认为更加关心近期得到的观察数据,因此通常都把

定义为随时间t非递减的常数序列。

dk(j1,j2)是横截面个体j1与j2在一个概率尺度上的相似性度量,实际上是

马氏距离D0k(Xj1,t,Xj2,t)在时间上的加权概率值,因此也把概率连接函数称作为“概率相似系数”。可以看出,概率连接函数dk(j1,j2)对横截面个体j1与j2在各时间t上都进行了相似性的度量,然后把各期的相似性度量综合起来。因此,概率连接函数作为横截面个体间相似性的度量,具有以下的四个优点。

第一,上述概率连接函数dk(j1,j2)首先在考虑了Xj1,t和Xj2,t的概率分布特征情况下,再来研究马氏距离D0k(Xj1,t,Xj2,t)的概率分布。这里并没有直接釆用马氏距离D0k(Xj1,t,Xj2,t)来度量横截面个体j1与j2在时间t期上的相似性,而是考虑了马氏距离的概率分布,而马氏距离的概率分布情况是由p维随机变量

Xj1,t和Xj2,t的概率分布所决定的。因此,再通过样本观测数据,将概率值P[D0k(Xj1,t,Xj2,t)£D0k(xj1,t,xj2,t)]作为度量在t时刻上横截面个体j1与j2间的相似性指标。因此,概率连接函数dk(j1,j2)能在很大程度上体现横截面个体在其概率分布特征上是否相似。概率连接函数dk(j1,j2)考虑的是横截面个体p维随机变量的联合分布,它不仅包含了各指标的概率分布特征,而且还包含了不同指标间的相关性等特征。因此,概率连接函数充分保留了面板数据的概率性结构。

第二,因为这里直接考虑橫截面个体j1与j2的多维指标变量Xj1,t和Xj2,t的概率分布,不再是对指标进行降维或退化处理,因此,这里直接就不存在指标量纲的问题。

第三,对于指标的数量级问题,在Bonzo和Hermosilla (2002)定义的概率连接函数中D0k(Xj1,t,Xj2,t)是个马氏距离,直接通过该马氏距离就可以将该问题解决。而且Bonzo和Hermosilla (2002)还考虑了该马氏距离的分布情况。

21

第四,对于横截面个体在某些时期的数据出现了异常值的问题,由于概率连接函数dk(j1,j2)是将Pt=P[D0k(Xj1,t,Xj2,t)£D0k(xj1,t,xj2,t)]作为个体j1与j2在时间t期上的相似性度量,而且由概率函数Pt?[0,1]的特性,因此即使面板数据在t*,1£t*£T期出现了异常值,该期的概率函数Pt<1。由dk(j1,j2)在时间t上的加权,只要观测期T较长的话,t*期的异常值也不会对概率连接函数

dk(j1,j2)产生较大的影响。

在给定观测数据的情况下,Bonzo和Hermosilla(2002)考虑到用样本观测数据来估计概率连接函数dk(j1,j2)。若j1,j2?Ck,Bonzo和Hermosilla (2002)又定义了如下的两个马氏距离:

?0k(Xj1,t,Xj2,t)?(Xj1,t?Xk,t)?Sk?,1t(Xj2,t?Xk,t)?0k(xj1,t,xj2,t)?(xj1,t?xk,t)?Sk?,1t(xj2,t?xk,t)(3-10) (3-11)

其中Xk,t为在t时刻Ck类中横截面个体随机变量的均值,也称之为Ck类中横截面个体的重心,xk,t为在t时刻类中横截面个体的样本重心,在t时刻类中不同横截面个体间的样本协方差矩阵,Nk为Ck类所包含的横截面个体的总个数,又Xk,t,xk,t,Sk,t形式分别如下:

Xk,t=1Nk1Nk?Xj?Ckj.t

xk,t=?xj?Ckj.t

Sk,t=1(xj1.t-xk.t)(xj2.t-xk.t)t ??Nk(Nk-1)j1?Ckj2?Ck,j11j2在给定样本观测数据的情况下,Bonzo和Hermosilla(2002)给出了概率连接函数dk(j1,j2)的估计

,其形式如下:

?k(j1,j2)?atP[?0k(Xj1,t,Xj2,t)??0k(xj1,t,xj2,t)](3-12)

t?1?T

22

4 实证研究

4.1 城市竞争力研究综述

随着我国改革开放程度、以及经济市场化程度的进一步加深,伴随着经济全球化和知识经济时代的到来,我国的大中型城市必须走向转型改革的道路。我国现阶段的城市要从建设型城市转向管理、经营和服务型城市,就是要重塑城市资源整合和配置资源机制,提高城市对社会资源的吸引力和创造社会财富的能力,从根本上就是提高城市竞争力。

1994年5月,经中央机构编制委员会第6次会议通过,决定将原来的14个计划单列市和杭州、济南2市正式确定为副省级市(其中,重庆市97年恢复直辖),如图4.1所示。将这15个城市定为副省级市,是中央对于区域经济发展的重要决策,加强了省级机构统筹规划和协调的地位和作用,不仅有利于加快这些城市的经济与社会发展,而且有利于更好的发挥这些中心城市的辐射作用。在国家政策层面和经济决策权待遇同等的情况下,经过近20年的时间,这15个副省级城市的发展出现了很大差异,城市竞争力也日趋呈现差异化。通过选取合适的评价指标,利用多指标面板数据聚类分析的方法处理,来发现这15个城市类别之间的差异,进而以提出相关建议。

图4.1 我国15个副省级城市分布图

23

4.1.1城市竞争力内涵研究综述

20 世纪 80 年代以来,随着经济全球化和一体化趋势越来越明显,各国

的城市进入国际发展的范畴,在全球范围内形成新的城市等级体系,城市竞争力的研究也扩展到全球范围。作为一个新的研究领域,尽管国内外学术界对城市竞争力已经做过许多有益的探索,但目前为止,尚未能形成公认的理论体系,关于城市竞争力的概念,不同的学者从各自的研究领域进行了不同的理解。 (1)国外学者的主要观点

国外学者关于城市竞争力的研究要早于国内,早在上世纪八十年代国外就有学者开始了城市竞争力的研究,经过20多年的探索,国外学者提出的城市竞争力的概念主要有以下几种:

① Paul Cheshire认为城市竞争力就是指一个城市相对其他城市而言,能够给自身城市创造更多的就业机会和提高其收入水平的能力。

② Douglas Webster 指出,城市竞争力是指一个城市能够生产和销售比其它城市更好的产品,非交易性劳务也是竞争力的一个重要组成部分。

③ Ivan 和 William借鉴英国政府白皮书关于企业竞争力的定义、OECD 关于国家竞争力的定义,总结出城市竞争力的定义:城市竞争力就是城市生产产品和提供服务,能够满足区域、国家和国际市场,同时能够提高居民实际收入、改善居民生活水平和促进可持续发展的能力。

④ Iain 认为城市竞争力是一个城市在自由、公平的市场经济条件下,为满足国际、区际或者城市间市场的需要而生产产品和提供服务的能力,并且能够同时增加其居民长远的实际收入。

⑤ Kresl是少数几个试图清晰地定义城市竞争力的学者之一,他提出了影响城市竞争力的6个要素:给居民提供的工作应该是高技术、高收入的工作;生产的产品应一该是符合环保要求的;生产的产品应该是质量优良,并且其需求的收入弹性较大;经济增长率能够满足充分就业的需求;在专业化发展中,城市能自主地控制自己的未来,而不是被动地接受命运的安排;城市政府能够不断改进行政管理绩效。 (2)国内学者的主要观点

在国内,关于城市竞争力的研究还是一个比较新的课题,较早提出城市竞争力概念的是南开大学的郝寿义教授等人,然后一些科研机构和高等院校研究

24

联系合同范文客服:xxxxx#qq.com(#替换为@)