引论:我们为您整理了13篇复杂网络分析范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。
篇1
0、引言
随着当今社会科学的不断发展和进步,各学科的发展都需要与周围的众多学科产生关系,因此复杂性学科应运而生。复杂性学科的引入能够更加充分、全面地对事物进行研究。复杂性学科是系统学科和非线性学科相结合的产物,其不仅具有两者身上的优点,更是对两者的补充和发展,因此复杂性学科已经成为了现代科学研究中最有效和常用的研究领域。而在上世纪末小世界效应和无标度特性的发现,为人们提供了一个新的研究复杂性学科的角度,让复杂网络在更多的领域里得到了应用,并取得了不错的效果。随着城市的不断发展,城市交通网络也成为了越来越重要的问题。近年来,复杂网络在城市交通网络领域中的不断应用,大大提高了城市交通网络的分析准度率和效率,也让人们看到了复杂网络在城市交通网络应用的光明前景。
1、复杂网络在城市交通网络分析中应用的可行性
关于复杂网络在城市交通网络中的应用,各方观点不一,很多人认为由于城市交通规模不足,城市交通网络的研究条件距离复杂网络研究还有很大差距,复杂网络不能够准确地在城市交通网络分析中进行应用。而另一些人则认为,随着城市交通网络的不断发展,城市交通网络已经成为了一个复杂的、庞大的网络系统,因此在某些研究上能够完全遵循复杂网络的研究方向。虽然城市交通网络在很多方面还不能完全符合复杂网络的研究标准,但是在很多方面具有较大的相似性,并且相关实验数据也能够证实复杂网络所描述的城市交通网络与实际相符,因此复杂网络能够在城市交通系统中应用。
在笔者看来,复杂网络在城市交通网络上的应用是可行的,主要因为以下3点内容:
(1)虽然城市交通网络在某些方面具有规则网络的某些特征,因此具有拓扑统计的相关性质。但在研究城市交通问题时可以对简单的拓扑进行抽象研究,这样就能够将城市交通网络中复杂的拓扑现象展现出来,从而反应出城市交通网络其它方面的重要特征。
(2)由于城市交通在不断地流动和变化过程中,因此在特征上具有明显的复杂性。例如:在每个路口处,即复杂网络中的每个节点处,都会有不同的变化,这些变化并不能确定其变化的方向,因此能够采用复杂网络对其进行研究。
(3)在交通网络的不断演变过程中,拓扑在交通网络上的应用对交通网络的分布和发展起到了重要的推动作用,因此将复杂网络应用在城市交通中对城市交通意义重大,符合城市网络交通的发展规律。
2、复杂网络在城市交通系统中的相关应用
2.1 复杂网络对城市交通网络的描述
由于城市内部交通复杂,交通模式不同,因此在复杂网络上会产生很大的不同。当今社会发展迅速,交通网络也随着社会的发展而不断变化,在交通网络的变化过程中,受到了包括地理、经济、规划等多种因素的影响,而复杂网络对于这些复杂因素的问题有着极强的处理能力。在研究城市交通网络时,只需要将城市网络抽象成复杂网络,然后对其进行研究。一般理论上对城市交通的抽象方法有两种:第一种是原始法,只需要简单地将交叉路口视为节点,并将连接这些节点的马路当做边,这种方法较为直观,容易理解;而第二种方法和第一种完全相反,其将交叉路口当作边,而把连接的马路当作节点,这样的方式虽然不直白,但在很多研究中有着第一种方法所没有的好处。
2.2 研究中面临的问题
目前,复杂网络理论已经在多个领域内取得了不错的发展,但是在城市交通网络上并没有太长时间的研究,在与城市交通网络的融合和描述上还有出入。但随着复杂网络在城市交通网络中的不断运用,会有更多的相关研究成果,这样能够促进两者更好地融合,从而为城市交通网络的发展做出更大的贡献。笔者分别从网络实证研究和网络演化机制两个方面来对城市交通网络复杂性进行阐述。
2.2.1 网络实证研究
网络实证研究能够有效地确定每个参数的基本意义,对一些忽略的系统宏观性质进行探寻。从目前的情况来看,网络的实证研究主要在于城市的网络道路建设和城市的公共交通网络建设。
(1)城市的网络道路。有关城市的网络道路建设早在十多年前就进行了研究,科学家通过对不同国家城市道路网络的研究得出,一般的道路交通量服从幂律分布,并且通过进一步研究发现,这些研究中的城市网络均为无标度网络,这就体现出了复杂网络中小世界的特征。
(2)城市的公共交通网络。相比于城市的道路交通网络,城市的公共交通网络的数据更加准确,研究起来也相对简单。根据中国相关城市的公共交通网络进行分析,公共汽车网络的分布呈指数分布。在此基础上对公共汽车网络的演化过程进行了模拟,结果与理论符合情况良好。此外,据国外文献记载,在对国外众多城市的公共交通网络进行研究后可以看到,这些网络都存在小世界的特性,城市交通网络均符合幂律分布或指数分布。上文已经介绍了城市交通网络的描述方法及一些常用的统计参数,但仅有这些还不够,还需要寻找更好的描述方法和更为有效的统计参数来刻画、分析城市交通网络的复杂性。
2.2.2 网络演化机制
网络演化机制研究是探索具有特定统计性质的网络形成机理的重要手段,主要涉及网络演化中的5类事件:加点、加边、重连、去边、去点。此后,涌现了大量关于网络演化机制的研究,为发现复杂网络形成机理以及进一步研究复杂网络上的动力学行为奠定了坚实的基础。就城市交通网络而言,主要研究网络无标度性和流量集中性两个方面。
(1)网络无标度性。目前,对无标度网络的演化机制研究主要集中在优先连接和Hub节点形成这两个方面,这些研究大多是对抽象的网络进行研究,而对于实体城市交通网络的研究并不常见。文献通过建立模型将优先连接和距离选择联系起来,从而搭建了无标度性与空间网络的桥梁。文献提出了一种基于预期效用最大的加点模型,并深入分析了地理信息的引入对网络度分布、聚类系数和匹配方式的影响。此外,对于无标度网络的演化机制研究,文献的部分研究结果也可借鉴。
篇2
物流网络是物流活动的重要体现,也是衡量物流活动有效性的重要指标。随着人工,仓租以及燃油费用的上升,企业要想有效地控制物流成本和提升服务客户的能力,就必须清楚地认识物流网络的结构和功能,以及合理地对物流网络进行管理,在达到满足客户需求的基础上最大程度地降低物流成本的目的,从而大大增加企业的价值。
物流网络系统是动态的复杂网络系统,是复杂网络系统的一个子集,因而它具有复杂网络系统的大部分特征。复杂网络理论的研究方法可以用来深入分析和准确研究物流网络系统运行的客观规律、物流网络系统的结构和功能以及物流网络系统的动态发展趋势和规律。
2.物流网络的研究现状
Mortiz Fleischmann等对不同行业的产品回收物流网络设计研究并概括产品回收网络的一般特征,并比较它们与传统的物流结构,此外,为不同类型的回收网络得出一个分类方案【1】。姚卫新等探讨了在电子商务环境下,为满足客户需要所形成闭环供应链物流网络的特点【2】。王建华等针对具有批量折扣和转运的供应链优化问题特征,提出供应物流网络的概念及其优化参数:节点、线路和流量【3】。杨光华等分析了区域物流网络的结构并阐述了物流宏观层面的特征,建立了基于加权网络的区域物流网络模型;从节点度和强度的分布、边的权重差异度等对区域物流网络的结构进行了定量分析【4】。吉迎东基于物流网络的整体性和动态性,分析了中国煤炭物流网络的特征【5】。韩舒怡等认为网络化是物流发展的方向,物流网络协同服务是物流网络化的主要表现形式之【6】。
从研究方法看,目前从复杂网络、复杂性来分析物流网络的研究较少,对物流网络系统的结构演化以及网络演化的内部规律探讨较少。从研究理论的视角来看,当前的研究往往基于静态、局部的视角,通常把物流网络系统的结构看成是相对稳定的、静止的,并试图优化网络系统中的物流、资金流和信息流,而没有充分注意到物流网络系统的动态适应性问题,没有从系统的整体运行规律上来考虑问题。在实际操作中,物流网络系统的结构是可根据企业的整体需要来改变的,目前的研究不能说明物流网络的形成演化机制,不同行业的物流网络为何有显著差别等问题。因此,有必要深入挖掘复杂网络理论、复杂性理论在物流网络分析中的应用价值。
3.物流网络的复杂网络特征
物流网络的小世界网络特征。研究表明:小世界网络具有高集聚系数和较小的平均路径长度。物流网络的聚集系数和平均路径长度反映了小世界的复杂性网络特征:
(1)平均路径长度是指网络中所有节点对之间的平均最短距离。网络中任意两个节点i和j之间的距离 定义为连接两个节点的最短路径。网络的直径为网络中任意两个节点之间距离的最大值,记为D= 。在无向网络中,网络中节点对之间最短距离的算术平均值为平均路径长度L,其公式为:L= 。其中,N表示网络中的节点总数。平均路径长度公式中包含了每个点到自身的距离(为0)。对于物流网络来言,平均路径可以表示产品交付给客户的时间也可以表示配送产品或者中间产品到客户的费用。随着商品生命周期不断缩短的同时客户对配送时间要求的提高,如何以最小费用、最短时间内将产品交付客户成为节点企业生存与发展的战略问题。物流网络中的任何一个节点企业为了在激烈的竞争中保持优势,必须做到以下几点:注重信息网络的建设,加快信息流通的速度,减少产品运输距离,提高自身协调和反应能力,建立配送物流中心,使物流网络具有较小的平均路径长度。
(2)聚集系数是衡量网络集聚特性的统计量,其定义有很多种不同的表述方式,本文介绍一个Watts等人提出的定义【7】: 假设网络中的某个节点i有 个节点与它相连,这 个节点就称为节点i的邻节点,这 个节点之中最多可能有 条边, 因此这 个节点之间实际存在的边数 和总的可能边数为 之比为节点i的集聚系数 : = 。对于度为0或1的节点,上式中的分子和分母均为0,故认为集聚系数 =0。所有节点i的集聚系数 的平均值是网络的集聚系数C,记为:C= 。对物流网络而言,平均聚类系数是物流网络节点企业之间相互连接和交流的程度。随着计算机技术和互联网技术的高速发展,越来越多的企业应用信息技术和互联网建立连接,如ERP、EDI系统的使用等。通过信息共享,使得物流网络中各节点企业之间的联系更加紧密,交流更加频繁。因此,物流网络具有较高的聚集系数。
度分布是网络的一个重要统计特征,节点的度指是与节点连接的边数【8】。Barabdsi和Albert在1999年提出了著名的BA模型,准确地描述了无标度网络形成的机制。无标度网络最大的特点在于网络的度分布自相似性结构和存在节点度很大的节点。一个节点的度越大,表示它在网络中的重要性就越大。节点的度可以根据其邻接矩阵来定义,将其定义为: 。网络中节点的度分布可用函数P(k)来表示,它表示网络中任意的一个点,度值为k的概率。从统计学上来讲,即为网络中度数为k的节点个数与网络节点总数的比值:P(k)= 。其中, 表示网络中度数为k的节点个数,而N表示网络中总节点个数,即网络的规模。网络的节点平均度为网络中所有节点i的度 的平均值。从目前的研究来看,两种度分布较为常见:一种是指数度分布,P(k)随着k的增大以指数形式衰减;另一种分布是幂律分布,即P(k)- 。物流网络中,通常都有一个或者多个核心企业,众多的节点企业围绕核心企业建立的生产、营销、库存、配送网络体系,极大地体现了复杂网络的无标度性。近年来,基于低成本、高服务质量而建立的第三方、第四方物流的物流网络更是集中体现了复杂网络的无标度性。
4.物流网络的复杂性分析
首先,现实中的物流网络一般都有大量的节点数,其拓扑结构以及数量巨大的节点相互作用下“涌现”网络演化的规律和网络动力学的特性。物流网络中的节点数量不仅众多,而且各自的种类多样。从网络的拓扑结构来看,物流网络通常具有多层次性,由众多的子网络构成。子网络一层一层往下拓展,从而形成了复杂的空间拓扑排列,如图1.4所示【9】。
第二,节点之间的线路是不确定的。由于节点之间相互作用的关系是不确定的,那么节点之间的线路也是时刻在变化的。节点之间的线路意义很多,可以表示路径,也可以表示流量,还可以表示相互之间的策略选择等。物流网络内节点之间的连接是有机的,连接的方式是按节点企业之间的协议来进行的。从图上来看,物流网络内节点之间的连接是按非线性方式进行转化;连接各个节点的边所代表的内容多种多样,可表示配送线路的连接、有无库存供货的合作、合作的紧密度等,其连接方式呈现立体动态结构。物流网络内节点是相互影响,相互关联的,并逐步扩大为不同物流网络之间的相互连接、相互影响、相互作用,以复杂的耦合方式推动不同网络之间的演进,从而形成一个纷繁复杂的大世界。
第三,物流网络的动态性。物流网络是动态网络,而且网络具有实时动态演进的特征,这又导致了网络结构和功能的实时变化,并通过涌现和自组织的机理产生网络的复杂效应。物流网络随着时间的变化而变化,经过网络内部和外界环境的相互作用,不断适应、调节网络的结构和功能,同时通过自组织作用,整个网络向更高级的有序化发展,不断涌现出复杂网络独特的行为与特征。
第四,物流网络的运行环境是不确定的。物流网络的运行环境是瞬息万变的。从宏观环境来讲,经济、科技、信息的全球化使得信息的传播迅速且广泛,信息数量之多使得网络的反馈系统任务繁重。“牵一发而动全身”,由于宏观环境的任何一个细微的变化都有可能造成物流网络巨大的震荡。从微观环境而言,物流网络中的任何一个节点所处的外界环境都是不同的,而且每个节点对待环境的变化所持的策略和态度各异,因此对整个物流网络的作用而言是非常复杂且是不确定的。物流网络是开放的动态系统,它与外部世界相互联系、相互作用,系统与外界环境是紧密相关的。物流网络时刻与外界进行物质、能量、资源和信息的交换。只有通过交换,物流网络才能得以生存和发展。任何一个复杂网络,只有在开放的条件下才能形成,才能维持,才能发展。
第五,物流网络的自组织。物流网络都具有自组织能力,能通过反馈系统进行自控和自我调节,以达到适应外界变化的目的。物流网络一旦建立,在运行中无不表现出系统的自组织属性。物流网络的各个节点企业通过契约、合作、战略联盟等方式进行物流、资金流、现金流的交换,在市场的作用下进行物质和能量的交换,优胜劣汰。在物流网络系统远离平衡态的情况下,有些节点企业发展较好,获得的资源较多,技术力量也日渐雄厚;反之,有些节点企业在市场竞争的角逐下,日渐衰弱,从而推出原有的物流网络系统。
第六,物流网络的混沌性。物流网络也受自身结构和功能的种种参数约束。如物流网络中的牛鞭效应,充分说明了物流网络有时受初值的影响是巨大的,物流网络在动态演化的过程中,只要起始状态(初始值)稍微有一点点微笑的变化,这种变化会迅速积累和成倍地放大,最终导致物流网络行为发生巨大的变化。简单假设一个物流网络系统,这个网络只有1个零售商、1个批发商、1个分销商和1个制造商。零售商预测客户需求,然后向批发商订货,批发商向分销商订货,而分销商则向制造商订货,制造商根据分销商的订货量进行生产的同时保持一定的安全库存。如果客户需求是n,假设每个节点企业上的安全库存率是10%,那么零售商、批发商、分销商的订货量分别为1.1n, n, n,那么制造商的生产量应为 n(即为1.62n)。因为可以看出第1个时间段,制造商最后的产量是客户需求量的160%,那么第t个时间段,制造商的产量是客户需求的 倍,其中t大于等于1。因此,只要这个初始值n发生一个小小的变动,即可产生巨大变化。针对物流网络中产生的混沌效应,节点企业必须重视需求预测,信息共享,每个节点企业缩短供货的时间,尽量减少不确定性,建立战略伙伴关系,设置合理的安全库存。
第七,物流网络的稳定性。物流网络具有一定的稳定性,在一定的外界条件下能保证网络结构的稳定和基本功能的正常发挥,换句话说物流网络具有一定的抗干扰性,如网络的鲁棒性。网络的鲁棒性是指网络系统在一定的外界环境作用下,网络的某些结构发生变化、节点数量的增减或则是出现运行故障的情况下,网络系统仍能保持其正常的相关性能进行运转,网络系统的这种稳定的、自我调整、自我适应的能力称为“鲁棒性”。刘楚燕在她的硕士论文中提出集聚型供应链网络的内部存在多个核心节点企业,这些企业在战略、战术、资源和信息方面相互依赖、相互交互,以信息流、资金流、物流的交换方式构成一个复杂的供应链网络,而这种网络具有较强的鲁棒性【10】。浙江大学李刚的博士论文研究了供应链的网络鲁棒性,将鲁棒性具体分为静态鲁棒性和动态鲁棒性;关于静态鲁棒性,文中提出随机删除节点, 删除目标节点,随机删除连接边和删除目标连接边四种规则对其模拟研究,结果显示,供应链物流网络针对不同类型的破坏呈现出不同的鲁棒性能【11】。在物流网络中,由于受到突发事件的影响,如果有些节点不能正常运转,或者需要临时增加网络节点来满足需求,很多情况下,物流网络的整体运作是不受影响的,换句话说还是能正常完成其系统特有的功能的。这就说明,物流网络具有一定的稳定性。
随着经济、信息全球化的程度加深,竞争的加剧,内外部环境的不确定性增加,物流网络涉及到的节点企业越来越多,结构越来越复杂,功能的变化也趋于复杂。利用复杂网络的理论和复杂性理论来揭示物流网络的性质,研究物流网络的动态生成演化过程机制,探索物流网络节点企业之间的协调机制,分析各个节点的脆弱性、不确定性,以及整个网络的鲁棒性和适应性,以此来实现物流网络的优化。
参考文献
【1】Mortiz Fleischmann, Hans Ronald Krikke, Rommert Dekker, Simme Douwe P. Flapper. A characterisation of logistics networks for product recovery. Omega, Volume 28, Issue 6, December 2000, Pages 653-666;
【2】姚卫新.电子商务条件下闭环供应链物流网络的设计.管理科学.2005年06期;
【3】王建华,李南,徐斌.具有批量折扣的供应物流网络优化遗传算法研究.中国管理科学,2007年03期;
【4】杨光华,李夏苗,谢小良.加权区域物流网络结构分析.计算机工程与应用.2009年26期;
【5】吉迎东.煤炭物流网络风险分析与应对研究.物流工程与管理,2012年12期;
【6】韩舒怡,徐杰.物流网络协同服务影响因素的实证研究.物流工程与管理,2012年03期;
【7】Watts D J, Strogatz S H. Collective dynamics of 'small-world' networks[J]. Nature, 1998, 393:440-442;
【8】R.Albert and A.L Barabasi,tatistical mechanics of complex networks,Rev,Mod,Phys.74,2002;
【9】李靖, 张永安.复杂网络理论在物流网络研究中的应用.中国流通经济2011年第5期;
篇3
在1978年之前,中国一直实行建立于社会主义制度上的经济和金融系统。中国人民银行(PBC)不仅发行货币,而且是国家经济计划的中心。从1979到1992年经历了第一阶段的改革,形成了两个银行体系,从中国人民银行(中央银行)中分离出四大国有银行。当时四大国有银行之间的功能高度细分,明确的分工范围使它们互相之间并无竞争。1992年之后,为了提高银行业的竞争,政府建立了新的小以及中等大小的商业银行。在这一阶段,四大国有银行仍处于垄断地位,与其他商业银行之间的竞争并不明显。在1994年又先后建立三家政策性银行(国家开发银行,中国进出口银行,中国农业发展银行)将政策性业务从商业银行中分离开来。在这一阶段还建立了城市商业银行,农村商业银行,农村信用合作社,邮政储蓄银行等,使中国银行业形成了多层次的银行体系。多层次的银行体系使银行业务重复并且交叉混合,而企业与银行的关系也逐渐改变,企业融资向多银行信用关系转变,银行与银行之间的竞争不断加剧。
自从Watts[1]等提出了小世界网络,Barabási[2]等提出了无标度网络,复杂网络理论的应用已经逐渐渗透到自然,工程,生物,物理,社会科学等各个领域。Allen[3]等应用复杂网络方法对金融问题进行分析,发现银行网络结构的不同对风险的传播程度以及传播途径具有一定影响。Souma[4]等将复杂网络方法应用于日本经济系统,构建了包含银行和企业两种类型节点的网络,实证分析发现银行网络具有无标度特性,度分布服从幂率分布。万阳松[5]等对银行网络结构特征进行研究,发现银行间市场网络具有同质性的特征。厉浩[6]等通过应用复杂网络理论对银行间的网络结构进行分析,构建了随机-无标度混合演化网络模型和扩展随机-无标度演化网络模型,研究发现随着银行间市场的择优行为程度的增加,网络会从随机演化网络向BA无标度演化网络演化。
以上大量国内外研究表明,银行网络的确存在典型的复杂网络结构特征,如无标度特征,集聚性特征,层次结构特征等。而采用复杂网络方法对银行竞争关系的研究却比较少,本文通过复杂网络分析方法,以沪深A股上市公司长期贷款数据为研究样本构建银行竞争关系共同网络模型和加权竞争关系网络模型。研究银行网络的拓扑结构属性,分析银行竞争结构,有利于描述银行贷款竞争关系,促进银行业的有效竞争和健康发展,对维护银行系统稳定以及规范银行市场竞争行为有一定意义。
二、银行贷款竞争网络模型的构建
(一)银行贷款竞争关系共同网络模型
银行与企业的信用关系可以构成一个网络,而这个网络中包含企业与银行两个对象,所以称为二分网络(bipartite network),又称为隶属网络。通过网络映射的方式使银行与企业信用关系的二分网络转化为只有银行这一个对象存在的银行竞争关系共同网络。在这个网络中以银行为节点,如果两家银行与相同的公司存在信用关系,则就在这两家银行之间连一条边表示银行之间的竞争关系,从而构建出银行竞争关系共同网络模型。数学表达式为,其中代表银行集合,代表银行,代表银行之间贷款竞争关系的邻接矩阵。
(二)加权竞争关系网络模型
不同的银行具有不同的能力以及影响力,从而形成了在市场上不同的竞争地位。对于一个银行来说,面对地位不同的竞争对手,其感受到的竞争压力也是不同的。因此引入了市场共同度的概念。市场共同度(market commonality)[7]是指目标企业A和竞争对手企业B共享市场的程度。根据市场共同度的概念,采用银行贷款额对银行间的竞争压力进行量化。从而在银行竞争关系共同网络模型的基础上,将银行间的竞争压力作为边权构建加权竞争关系网络模型(weighted competitive relationship network)。市场共同度如下式所示
(1)
其中, 为银行B相对于银行A的市场共同度;k为向银行贷款的公司,k=1,2,3…;PAK为银行A贷款给公司k的金额;PBK为银行B贷款给公司k的金额;PA为银行A的贷款额总和,Pk为公司k的贷款额总和。PAk/PA是k公司在A银行的贷款额占A银行总贷款额的比例,表示k公司的贷款对于A银行的重要程度;PBk/Pk是k公司在B银行的贷款额占k公司的总贷款额,表示B银行的入侵规模。所以银行B相对于银行A的市场共同度为银行B在所有公司贷款业务上给A公司施加的压力,即B银行给A银行带来的竞争压力。
三、样本数据的选择与说明
数据的可获得性是在经济社会方面进行复杂网络建模所面临的困难之一,其原因有两个,首先个人难以获得并收集大规模的经济数据;其次一些涉及营业额,利润,市场份额的数据属于商业机密无法获取,这导致了复杂网络这种需要一定数据量的分析方法无法应用于许多经济商业领域。为了保证数据的权威性,合法性以及代表性,本文研究的银行贷款竞争网络的数据样本是沪深A股上市公司在2012年的银行长期借款。这保证了数据的可获得性,短期借款受客观条件如金融大环境,信贷政策,和主观条件如公司的经营情况的影响较大,而长期借款则减少了这些影响。
根据前述的竞争网络建模规则,利用样本数据,构建了银行贷款竞争网络拓扑结构形态图。其中包括一个最大连通子网络和两个孤立点,两个孤立点分别属于城市商业银行和农村信用合作联社,它们都只向一家公司发放贷款,而相对的公司也只与这一家银行存在信贷关系。
四、银行贷款竞争网络模型特征分析
(一)节点度及节点度分布
节点度,简称为点度(degree)指一个顶点拥有的连线数量,即
(2)
其中N为网络的节点集合。在银行贷款竞争网络中,一个代表银行的节点的点度越高,表示银行的竞争力能直接影响和支配更多的银行,所以这个节点在整个网络中拥有更高的地位以及重要性。在网络中节点最大度为76,为中国银行,最小点度为1,为天津银行,南京银行等,平均值为14。通过软件对节点度分布经行拟合,得到节点度分布的幂率指数为,可决系数。因此节点度符合幂率分布。
(二)节点度与节点强度相关性分析
节点强度(vertex strength),也称为点权,指与节点关联的边权之和,即
(3)
其中,Ni为节点的邻点集合,Wij为连接节点i和j之间边的权重。加权竞争关系网络模型是在银行竞争网络模型基础之上,根据银行间的市场共同度为边权构建起来的,节点的强度表现了不同银行贷款的竞争能力。节点度与节点强度之间的相关系数可以衡量与银行贷款有竞争关系的银行数目和该银行竞争实力之间的相关程度。节点度-节点入度权相关系数为0.878,大于0,表现出强相关,节点度-节点出度权相关系数为-0.230,小于0,表现出弱相关。即指在市场中银行所拥有的竞争对手数量与其施加于对手的竞争压力强正相关,而银行所拥有的竞争对手数量与其所受到的竞争压力弱负相关。这表明银行的竞争实力越强,就有越多的竞争对手,而收到越少的竞争压力;并且,银行的竞争实力越弱,竞争对手越少,而受到的竞争压力却越强。
(三)同配性
为了研究银行贷款竞争网络是否具有同配性,从节点的邻点平均度进行研究。邻点平均度(ANND,Average Nearest-Neighbor Degree)[8]是指与节点i相邻的节点的节点度的平均值,可以用于度量节点的邻接节点在网络中的连接程度。点度大的银行与点度大的银行进行竞争的现象称为同配性;而节点度大的银行与节点度小的银行进行竞争的现象称为异配性。在银行贷款竞争网络中分析邻点平均度与节点度的相关性,ND-ANND相关系数为-0.593,小于0,说明银行贷款竞争网络为异配性网络,存在节点度大的银行与节点度小的银行竞争的现象。这可以在银行贷款竞争网络中存在紧密联系着的并且拥有较大的竞争力和影响力银行云集团,而这些拥有较大竞争力的银行同时也与较小的银行存在竞争关系。
(四)聚类系数
我们发现在许多网络中存在节点的邻点互为邻点的情况,这种性质称为集聚性,网络的集聚性可以用网络聚类系数(Network clustering coefficient)加以描述。网络聚类系数可以通过各个顶点的顶点聚类系数计算出来。顶点聚类系数指在该顶点的邻点中,直接相连的邻点对占所有可能存在的邻点对的比例。即
(4)
其中 表示与节点直接相连的节点数, 表示 在个节点间可能存在的最大边数, 表示实际存在的边数。由此可见,只有一个节点至少拥有两个邻点才能够算出顶点聚类系数。网络聚类系数为所有顶点聚类系数的平均值,即
(5)
C的取值在0到1之间,当C=1时表示在这个网络中所有节点两两之间都直接连接。银行竞争贷款网络的网络聚类系数为0.40349,数值较大。这反映出银行贷款竞争网络的集团化程度较大,一个银行的对手银行之间互相也存在竞争关系,说明银行之间存在较为激烈的竞争,这也说明银行贷款客户的重合性非常高,银行之间的竞争趋向同质化。
(五)平均最短路径长度
网络中两个节点之间经历边数最少的一条简单路径的边数称为两节点之间的距离[9]。网络的直径D定义为所有距离中的最大值。平均最短路径长度L定义为所有节点对之间距离的平均值,即
(6)
其中N为节点数, 为节点i与节点j之间的距离。银行贷款竞争网络的网络直径为4,平均最短距离为1.97875,这表明在银行竞争网络中,一个银行平均只需要通过2个中间银行就能找到有与之有竞争关系的其他银行。其平均最短距离较小,而聚类系数较大,说明银行贷款竞争网络具有小世界特征。
五、结论
本文以沪深A股上市公司2012年的银行长期借款为样本构建了银行贷款竞争关系共同网络模型,并以此为基础将市场共同度构建作为边权构建了加权竞争关系网络模型。实证研究发现银行竞争网络的节点度服从幂率分布;点度-节点入度权为强相关,节点度-节点出度权为弱相关;较大的集聚系数与较小路径长度表明此网络具有小世界特性;通过对银行竞争网络模型进行分析,发现国有大型商业银行在银行系统中仍然拥有较高地位,虽然竞争对手众多但是受到的竞争压力却并不大,全国股份制商业银行内部的竞争非常激烈,受到较大的竞争压力。随着竞争的加剧以及银行竞争的趋向同质性,国有大型银行的影响力将会下降,将有更多的全国股份制商业银行加入网络的核心集团对银行系统产生更大的影响力。
本文只采用复杂网络方法对银行贷款竞争关系进行了初步的探索,仅仅分析了其网络模型的一些拓扑结构属性,还有许多问题有待进一步的研究,比如银行竞争网络模型的演化机制,银行竞争地位的变化对贷款定价的影响,对银行间风险的分担以及对整个银行系统的影响。
参考文献:
[1] Duncan J Watts,Steven H Strogatz .Collective dynamics of‘small-world’networks [J].Nature,1998,393(6684):440-442.
[2] Albert-Laszlo Barabási,R Albert .Emergence of scaling in random networks [J].Science,1999,286(5439) :509-512.
[3] Allen F,D Gale.Financial Contagion [J].Journal of Political Economy,2000(108):1-33.
[4] Souma W,Fujiwara Y,Aoyama H .Complex Networks and Economics [J].Physica A:Statistical Mechanics and its Applications,2003,324(1/2):396-401.
[5] 万阳松,,陈晓荣 .复杂银行网络的宏观结构模型及其分析[J].上海交通大学学报,2007,41(7):l161-1164.
[6] 厉浩,陈庭强,何建敏 .复杂网络理论的银行间市场网络结构演化模型[J].北京理工大学学报,2012,14(2):71-76.
[7] Mcpherson M .An ecology of affiliation [J].American Sociological Review,1983,48(4):519-532
篇4
Fuzzy clustering and information mining in complex networks
ZHAO Kun,ZHANG Shao-wu,PAN Quan
(School of Automation, Northwestern Polytechnical University, Xi’an 710072, China)
Abstract:There is seldom a method which is capable of both clustering the network and analyzing the resulted overlapping communities. To solve this problem, this paper presented a novel fuzzy metric and a soft clustering algorithm. Based on the novel metric, two topological fuzzy metric, which include clique-clique closeness degree and inter-clique connecting contribution degree, were devised and applied in the topological macro analysis and the extraction of key nodes in the overlapping communities. Experimental results indicate that, as an attempt of analysis after clustering, the new indicators and mechanics can uncover new topology features hidden in the network.
Key words:network fuzzy clustering; clique-node similarity; clique-clique closeness degree; inter-clique connection contribution degree; symmetrical nonnegative matrix factorization(s-NMF); network topology macrostructure
团结构是复杂网络普遍而又重要的拓扑属性之一,具有团内连接紧密、团间连接稀疏的特点。网络团结构提取是复杂网络分析中的一个基本步骤。揭示网络团结构的复杂网络聚类方法[1~5]对分析复杂网络拓扑结构、理解其功能、发现其隐含模式以及预测网络行为都具有十分重要的理论意义和广泛的应用前景。目前,大多数提取方法不考虑重叠网络团结构,但在多数网络应用中,重叠团结构更为普遍,也更具有实际意义。
现有的网络重叠团结构提取方法[6~10]多数只对团间模糊点进行初步分析,如Nepusz等人[9,10]的模糊点提取。针对网络交叠团结构的深入拓扑分析,本文介绍一种新的团—点相似度模糊度量。由于含有确定的物理含意和更为丰富的拓扑信息,用这种模糊度量可进一步导出团与团的连接紧密程度,以及模糊节点对两团联系的贡献程度,并设计出新指标和定量关系来深度分析网络宏观拓扑连接模式和提取关键连接节点。本文在三个实际网络上作了实验分析,其结果表明,本方法所挖掘出的网络拓扑特征信息为网络的模糊聚类后分析提供了新的视角。
1 新模糊度量和最优化逼近方法
设A=[Aij]n×n(Aij≥0)为n点权重无向网络G(V,E)的邻接矩阵,Y是由A产生的特征矩阵,表征点—点距离,Yij>0。假设图G的n个节点划分到r个交叠团中,用非负r×n维矩阵W=[Wki]r×n来表示团—点关系,Wki为节点i与第k个团的关系紧密程度或相似度。W称为团—点相似度矩阵。令
Mij=?rk=1WkiWkj(1)
若Wki能精确反映点i与团k的紧密度,则Mij可视为对点i、j间相似度Yij的一个近似。所以可用矩阵W来重构Y,视为用团—点相似度W对点—点相似度Y的估计:
W ?TWY(2)
用欧式距离构造如下目标函数:
minW≥0 F?G(Y,W)=Y-W ?TW?F=?12?ij[(Y-W ?TW)。(Y-W ?TW)]ij(3)
其中:?F为欧氏距离;A。B表示矩阵A、B的Hadamard 矩阵乘法。由此,模糊度量W的实现问题转换为一个最优化问题,即寻找合适的W使式(3)定义的目标函数达到最小值。
式(3)本质上是一种矩阵分解,被称为对称非负矩阵分解,或s-NMF (symmetrical non-negative matrix factorization)。?s-NMF的求解与非负矩阵分解NMF[11,12]的求解方法非常类似。非负矩阵分解将数据分解为两个非负矩阵的乘积,得到对原数据的简化描述,被广泛应用于各种数据分析领域。类似NMF的求解,s-NMF可视为加入限制条件(H=W)下的NMF。给出s-NMF的迭代式如下:
Wk+1=W?k。[W?kY]/[W?kW ?T?kW?k](4)
其中:[A]/[B]为矩阵A和B的Hadamard矩阵除法。
由于在NMF中引入了限制条件,s-NMF的解集是NMF的子集,即式(4)的迭代结果必落入NMF的稳定点集合中符合附加条件(H=W)的部分,由此决定s-NMF的收敛性。
在求解W之前还需要确定特征矩阵。本文选扩散核[13]为被逼近的特征矩阵。扩散核有明确的物理含义,它通过计算节点间的路径数给出任意两节点间的相似度,能描述网络节点间的大尺度范围关系,当两点间路径数增加时,其相似度也增大。扩散核矩阵被定义为
K=exp(-βL)(5)
其中:参数β用于控制相似度的扩散程度,本文取β=0.1;L是网络G的拉普拉斯矩阵:
Lij=-Aiji≠j
?kAiki=j(6)
作为相似度的特征矩阵应该是扩散核矩阵K的归一化?形式:
Yij=Kij/(KiiKjj)??1/2(7)
基于扩散核的物理含义,团—点相似度W也具有了物理含义:团到点的路径数。实际上,W就是聚类结果,对其列归一化即可得模糊隶属度,需要硬聚类结果时,则选取某点所对应列中相似度值最大的团为最终所属团。
2 团—团关系度量
团—点相似度W使得定量刻画网络中的其他拓扑关系成为可能。正如W ?TW可被用来作为点与点的相似度的一个估计,同样可用W来估计团—团关系:
Z=WW ?T(8)
其物理含义是团与团间的路径条数。很明显,Z的非对角元ZJK刻画团J与团K之间的紧密程度,或团间重叠度,对角元ZJJ则刻画团J的团内密度。?
以图1中的对称网络为例,二分团时算得
Z=WW ?T=1.337 60.035 3
0.035 31.337 6
由于图1中的网络是对称网络,两团具有同样的拓扑连接模式,它们有相同的团内密度1.337 6,而团间重叠度为?0.035 3。
3 团间连接贡献度
ZJK度量了团J与团K间的重叠程度:
ZJK=?na=1WJaWKa(9)
其中:WJaWKa是这个总量来自于点a的分量。下面定义一个新指标来量化给定点对团间连接的贡献。假设点i是同时连接J、K两团的团间某点,定义点i对团J和团K的团间连接贡献度为
B?i=[(WJiWKi)/(?na=1WJaWKa)]×100%(10)
显然,那些团间连接贡献大的点应处于网络中连接各团的关键位置,它们对团间连接的稳定性负主要责任。将这种在团与团间起关键连接作用的点称为关键连接点。为了设定合适的阈值来提取团间关键连接点,本文一律取B>10%的点为关键连接点。
4 实验与结果分析
下面将在三个实际网络上展开实验,首先根据指定分团个数计算出团—点相似度W,然后用W计算团—团关系和B值,并提取关键连接点。
4.1 海豚社会网
由Lusseau等人[14]给出的瓶鼻海豚社会网来自对一个62个成员的瓶鼻海豚社会网络长达七年的观测,节点表示海豚,连线为对某两只海豚非偶然同时出现的记录。图2(a)中名为SN100 (点36)的海豚在一段时间内消失,导致这个海豚网络分裂为两部分。
使用s-NMF算法聚类,海豚网络分为两团时,除30和39两点外,其他点的分团结果与实际观测相同,如图2(a)所示。计算B值并根据阈值提取出的五个关键连接点:1、7、28、36、40(虚线圈内),它们对两团连接起到至关重要的作用。图2(b)为这五点的B值柱状图。该图显示,节点36(SN100)是五个关键连接点中B值最大者,对连接两团贡献最大。某种程度上,这个结果可以解释为什么海豚SN100的消失导致了整个网络最终分裂的影响。本例说明,s-NMF算法及团间连接贡献程度指标在分析、预测社会网络演化方面有着独具特色的作用。
4.2 Santa Fe 科学合作网
用本算法对Newman等人提供的Santa Fe科学合作网络[15]加以测试。271个节点表示涵盖四个学术领域的学者,学者合作发表文章产生网络连接,构成了一个加权合作网络。将本算法用于网络中一个包含118个节点的最大孤立团,如图3(a)所示。
图3(a)中,四个学科所对应的主要组成部分都被正确地分离出来,mathematical ecology(灰菱形)和agent-based models(白方块)与文献[15]的结果一致,中间的大模块statistical physics又被细分为四个小块,以不同灰度区分。计算了24个点的团间连接度贡献值B,从中分离出11个B值大于10%的点作为关键连接点:1、2、4、6、11、12、20、47、50、56、57,其标号在横轴下方标出,见图3(b),并在图3(a)中用黑色圆圈标记,这些连接点对应那些具有多种学科兴趣、积极参与交叉研究的学者。除去这11个点时,整个网络的连接布局被完全破坏,见图3(a)下方灰色背景缩小图,可见关键连接点的确起到重要的沟通各模块的作用。
4.3 杂志索引网络
在Rosvall等人[16]建立的2004年杂志索引网络上进行测试。网络节点代表杂志,分为物理学(方形)、化学(方形)、生物学(菱形)、生态学(三角形)四个学科领域,每个学科中各选10份影响因子最高的刊物,共40个节点,若某刊物文章引用了另一刊物文章,则两刊间有一条连线,形成189条连接。使用s-NMF对该网4分团时,聚类结果与实际分团情况完全一致,如图4(a)所示。
由本算法得出的团—点相似度W在网络宏观拓扑结构的挖掘方面有非常有趣的应用,如第2章所述,用W计算团—团相似度矩阵Z=WW?T,其对角元是团内连接密度,非对角元表征团与团的连接紧密程度,故Z可被视为对原网络的一种“压缩表示”。如果将团换成“点”,将团与团之间的连接换成“边”,利用Z的非对角元,就能构造出原网络的一个压缩投影网络,如图4(b)所示。这是原网络的一个降维示意图,也是团与团之间关系定量刻画的形象表述,定量地反映了原网络在特定分团数下的“宏观(全局)拓扑轮廓”,图上团间连线色深和粗细表示连接紧密程度。由图4(b)可以看到,physics和chemistry连接最紧密,而chemistry与biology和biology与?ecology次之。由此推测,如果减少分团数,将相邻两团合并,连接最紧密的两团必首先合并为一个团。实际情况正是如此:分团数为3时,biology和ecology各自独立成团,physics 和?chemistry合并为一个大团,这与文献[11]结果一致。
5 讨论
网络模糊聚类能帮助研究者进一步对团间的一些特殊点进行定量分析,如Nepusz等人[9]用一种桥值公式来刻画节点在多个团间的共享程度,即节点从属度的模糊程度。而本文的团间连接贡献度B反映出节点在团间连接中所起的作用大小。本质上它们是完全不同的两种概念,同时它们也都是网络模糊分析中所特有的。团间连接贡献度指标的提出,将研究引向对节点在网络宏观拓扑模式中的影响力的关注,是本方法的一个独特贡献。无疑,关键连接点对团间连接的稳定性起到很大作用,如果要迅速切断团间联系,改变网络的宏观拓扑格局,首先攻击关键连接点(如海豚网中的SD100)是最有效的方法。团间连接贡献度这一定义的基础来自于对团与团连接关系(Z)的定量刻画,这个定量关系用以往的模糊隶属度概念无法得到。由于W有明确的物理含义,使得由W导出的团—团关系Z也具有了物理含义,这对网络的宏观拓扑分析非常?有利。
6 结束语
针对复杂网络交叠团现象,本文给出了一个新的聚类后模糊分析框架。它不仅能对网络进行模糊聚类,而且支持对交叠结构的模糊分析,如关键点的识别和网络宏观拓扑图的提取。使用这些新方法、新指标能够深入挖掘潜藏于网络的拓扑信息。从本文的聚类后分析不难看出,网络模糊聚类的作用不仅在于聚类本身,还在于模糊聚类结果能够为网络拓扑深入分析和信息挖掘提供支持,而硬聚类则不能。今后将致力于对团间连接贡献度指标进行更为深入的统计研究。
参考文献
[1]
赵凤霞,谢福鼎.基于K-means聚类算法的复杂网络社团发现新方法[J].计算机应用研究,2009,26(6):2041-2043,2049.
[2]汪小帆,刘亚冰.复杂网络中的社团结构算法综述[J].电子科技大学学报,2009,38(5):537-543.
[3]NEWMAN M E J.Modularity and community structure in networks[J].Proceedings of the National Academy of Sciences of the United States of America,2006,103(23):8577-8582.
[4]WHITE S,SMYTH P.A spectral clustering approach to finding communities in graphs[C]//Proc of SIAM International Conference on Data Mining.2005.
[5]ENRIGHT A J,DONGEN S V,OUZOUNIS C A.An efficient algorithm for large-scale detection of protein families[J].Nucleic Acids Research,2002,30(7):1575-1584.
[6]BEZDEK J C.Pattern recognition with fuzzy objective function algorithms[M].New York:Plenum Press,1981.
[7]PALLA G,DERENYI I,FARKAS I,et al.Uncovering the overlapping community structures of complex networks in nature and society[J].Nature,2005,435(7043):814-818.
?[8]REICHARDT J,BORNHOLDT S.Detecting fuzzy community structures in complex networks with a potts model[J].Physical Review Letters,2004,93(21):218701.
?[9]NEPUSZ T,PETROCZI A,N?GYESSY L,et al.Fuzzy communities and the concept of bridgeness in complex networks[J].Physical Review E,2008,77(1):016107.
[10]ZHANG Shi-hua,WANG Rui-sheng,ZHANG Xiang-sun.Identification of overlapping community structure in complex networks using fuzzy C-means clustering[J].Physical Review A:Statistical Mechanics and Its Applications,2007,374(1):483-490.
[11]PAATERO P,TAPPER U.Positive matrix factorization:a non-negative factor model with optimal utilization of error estimates of data values[J].Environmetrics,1994,5(2):111-126.
[12]ANTTILA P,PAATERO P,TAPPER U,et al.Source identification of bulk wet deposition in Finland by positive matrix factorization[J].Atmospheric Environment,1995,29(14):1705-1718.
[13]KONDOR R I,LAFFERTY J.Diffusion kernels on graphs and other discrete structures[C]//Proc of the 19th International Conference on Machine Learning.San Francisco:Morgan Kaufmann,2002.
篇5
战略网络是由不同利益成员构成的系统,由于各成员目标可能不同,每个成员都以自身利益最大化为目的参与合作,所以战略网络中存在不可避免的矛盾。目前国内外对于战略网络节点管理的研究角度多偏向于生态学理论、博弈论及系统论,对企业战略网络节点选择、节点数量及节点的进退机制进行研究。复杂网络研究的不同之处在于:从统计的角度出发,考察网络中的大规模节点以及节点之间的连接性质,这些性质的不同意味着网络内部结构的不同,而内部的结构不同将导致网络系统的功能不同。利用复杂网络理论,可以分析网络中各节点的重要程度,反映各个环节的瓶颈问题。还可以用来发现网络中的关键节点,从而对网络进行有针对性的优化,进而达到整体网络的优化。
复杂网络理论在企业网络中的应用
科学家们发现大量的真实网络既不是规则网络, 也不是随机网络,而是具有与前两者都不同的统计特征的网络,这样的一些网络被科学家们叫做复杂网络(Albert R,Albert-Laszlo B,2002;Newman M E J,2003)。复杂网络被发现具有很多与规则网络和随机网络不同的统计特征,其中最突出的是小世界效应和无尺度特性(Drik Helbing,2006;Christian Kuhnert,Dirk Helbing,2006;Marco Laumanns,Erjen Lefeber,2006)。由于现代企业网络越来越具有复杂性和不稳定性特点,复杂网络理论在企业网络方向上的应用也逐渐成为研究热点。
李守伟、钱省三(2006)在对产业网络供应链的复杂性研究中发现,我国的半导体产业的供应链条符合无标度网络的特征。此外,阮平南、李金玉(2010)将复杂网络理论用于战略网络,阐述了战略网络的无标度特征,建立了BA演化模型,解释了无标度网络演化的过程,进而解释了战略网络中核心节点的形成。庞俊亭等(2012)探索了集群创新网络所具有的小世界和无标度结构特性及集群网络在受到攻击时所具有的稳健性和脆弱性。
目前多数研究侧重定性研究网络的复杂网络特性及演化研究,有充分考虑企业网络的动态适应性问题,没有考虑到系统整体运行规律。另外,以网络效率为标准,研究网络中的节点重要性方面的文献还是很缺乏的。本文试图以复杂网络理论为基础,从这一全新视角来研究战略网络中重要节点识别问题。
战略网络的复杂网络特性分析
(一)战略网络拓扑结构
战略网络就是由那些具有战略意义的组织或个人组成的社会网络。它是由消费者、市场中介、供应商、竞争对手、其他产业的企业、利益相关者、其他组织和企业本身等节点构成的(见图1)。
用复杂网络理论研究战略网络,首先应将战略网络抽象成拓扑模型。将战略网络中的企业、科研机构、政府等作为网络中的节点。节点确定以后,根据各节点的实际联系确定是否存在边的关系。作为核心的网络节点企业存在众多的合作关系,这就导致战略网络的节点的边越来越多。为了能比较好地模拟出一个战略网络,根据战略网络的基本结构,描绘出一个简单战略网络拓扑图,如图2所示。
(二)战略网络的复杂特性
1.战略网络的小世界网络的特征。平均路径长度是指在网络中将两点间的距离被定义为连接两点的最短路所包含的边的数目,把所有节点对的距离求平均,就得到了网络的平均距离。网络的平均路径长度L(N)定义为任意两个节点之间的距离的平均值,平均路径长度表示产品的交付时间。为在保持激烈竞争环境中的优势,企业必须采取以下对策:重组整合,减少补给提前期,加快信息的流通速度,减少产品运输距离,提高自身的反应能力和适应变化的能力,建立配送物流中心,以便能够更好地实现准时供货。基于时间的竞争战略对于各节点成员来说是至关重要的,如何以最短的时间将产品交付给客户成为节点企业参与战略网络竞争必须应对的关键战略问题。在战略网络环境中,企业之间的平均最短路径,可以体现为产品或服务从一个环节到另一个环节所需要的平均最少中转数目。整个网络的平均最短路径L的计算公式为:
上述公式中,dij表示产品或服务从环节i到达环节j所需的最少中转次数,N表示战略网络中的企业总数。
聚集系数指与节点相邻的节点之间实际存在的边数与这些节点都互连的最大边数之比,网络中所有节点聚集系数的平均就是网络的聚集系数。对于战略复杂网络而言,平均聚集系数相应于网络节点企业之间相互交流的程度,随着信息高速发展时代的到来,越来越多的企业应用信息技术和互联网的媒介建立彼此之间的连接。通过信息共享的各种途径促使各节点企业之间联系更加紧密,交流更加频繁,这就体现战略网络具有较高的聚集系数。
2.战略网络复杂网络的无标度特征。无标度网络的特点是网络中的大部分节点的度值都很低,但存在着度数非常高的核心节点。各节点企业在企业网络中所处的网络地位不同,战略网络中的核心企业形成占有的知识不均匀,节点间的连接就具有择优性(Boschmma R A,Wal A L J,2007)。战略网络核心节点的形成主要来源于择优连接机制,在战略网络中,组织会倾向于选择连接数目较多的网络节点。通常一些节点企业通过先进的技术、富有竞争力的产品和良好的管理,在非常短的时间内获得大量的关系连接;网络中存在历史较长的企业,有较长的时间来积累与其它组织的关系连接。核心节点的连接数目远远超出了一般的节点,并且网络主要由这些核心节点所支配。
战略网络节点重要性模型构建
在复杂网络中,节点度是单个节点极其重要的属性节,点的度直接反映该节点在网络中与其他节点相联系的广度,定义为邻接矩阵中与该节点连接的其他节点边的数目。传统复杂理论中判断核心节点方法是依据网络中节点度或点强度参数,这个方法是具有很大片面性和局限性的。节点度高的企业只能说明企业与周围企业的联系程度密切,而不能真实地反映出该企业在网络中的作用和地位(朱大智、吴俊,2007)。因此本文将以网络效率为依据,从新的视角出发对战略网络中的节点进行重要性识别。
(一)战略网络的网络效率建模
网络效率指标被用来衡量网络中点与点之间的信息沟通程度。在战略网络中最短路径长度反映了战略网络内各节点企业产品交付时间的效率。路径越长,企业获取资源的时间越长,效率就越低;反之,路径越短,资源获取的时间成本越低,效率越高。为了计算网络效率E,首先要建立这样一个网络模型。假设忽略所有企业内部信息,只考虑企业间的联盟关系;任意两节点间的连接度是等值的。设网络G是一个无重边的无向网络,即网络中的边没有固定的方向,用G=(N,K)来代表,N是网络中节点集合,K是网络中边集合,G的邻接矩阵A=(aij)定义如下:
则A是一个n阶的对称矩阵,如果两个节点之间有联系,aij=1;否则aij=0。
假设节点i与节点j间的连通的效率eij与最短路径成反比,即eij=1/dij。那么,给出如下的战略网络效率计算公式:
(1)
上述公式中,eij表示完全连通情况下两个节点企业之间的效率。在突况下,加入变量wij,即网络效率因子。0≤wij≤1,作为企业连通效率参数。Wij=1表示相关节点企业正常运营。在遭遇突况下,Wij将降低,取0≤wij≤1。这样可以比较真实地模拟出企业在面对不同风险时,网络出现效率变化的情况。随着wij的变化,与该企业有贸易往来的相关企业均会受到一定程度的影响,将导致整个网络的效率会出现非线性的变化。通过评价网络的效率,可以尝试改善网络的构造从而优化网络的效率,网络的效率得以提高,使网络更具稳定性。
(二)战略网络中重要节点的识别建模
网络效率E无疑成为衡量战略网络效率有效的指标,然而它只能表现网络的平均水平,因此需要更深入的研究,识别网络中的关键节点。此方法主要考察的是当从网络中剔除节点i以后,网络的效率变化,根据节点对于网络效率影响能力的大小,可以识别网络中的关键节点。
E=E=E(G)-E(G`) i=1,2,……N (2)
E(G`)表示wij变化时的网络平均效率。根据网络效率变化的大小对网络中节点的重要性指数进行排序,在wij一定的情况下,网络效率变化值较大的节点无疑是网络中重要性相对较高的节点。也就是去除该节点后,网络效率下降越大,说明该企业的重要性越高。针对企业对于网络整体的作用不同,需加强预防工作,做到真正的防患于未然。对于这些重要节点,必须予以重点关注,例如,更加频繁地关注它的运作状况、与其他企业的连通状况,建立完备的预警机制等。
结论
基于网络整体的考虑,本文运用复杂网络理论,侧重从宏观整体的角度去分析单独的点和整体网络之间的关系,通过建立网络拓扑结构、衡量网络效率、识别重要网络节点三个方面,阐述了复杂网络在战略网络管理中的应用前景。建立数学模型比较真实地模拟了网络在正常情况和突况下的网络效率。本文只是从复杂网络理论的角度讨论通过战略网络效率的办法计算节点重要性,而由此识别出来的重要企业也是具有现实意义的。
参考文献:
1.Albert R,Albert-Laszlo B.Statistical mechanics of complex networks[J].Reviews of Modern Physics,2002(74)
2.Newman M E J.The structure and function of complex networks[J].Siam Review,2003(45)
3.Drik Helbing.Information and material flows in complex networks[J].Physica A,2006,363(1)
4.Christian Kuhnert,Dirk Helbing.Scaling laws in urban supply networks[J].Physica A,2006,363(1)
5.Marco Laumanns,Erjen Lefeber.Robust optimal control of material flows in demand-driven supply networks[J].Physica A,2006,363(1)
6.李守伟,钱省三.产业网络的复杂性研究与实证.科学学研究,2006(4)
7.阮平南,李金玉.战略网络中基于无标度网络的核心企业形成研究.科技管理研究,2010(16)
篇6
1.初始设定
网络为给定no个节点,e0条边的网络,初始的e0条边没有重连。其中每条边的权值为wo。
2.增长过程
每一步向网络中增加一个节点k以及m(≤no)条新边。
3.偏好连接
连接节点的选择按照如下的偏好选择规则进行。
这里 ; ,α是一个参数;τ(i)表示的是节点i的邻居的集合;距离L(u,v)用Kleinberg网络模型中的网格距离 来定义。依据“就近原则”,选择距离新增节点k较近的节点进行连接的可能较大。随着α值的增加,新产生的节点与较近的节点之间相连的概率就会越来越大。设新生成边的边权固定为w0。
4.边权值的动态演化
每个时间步网络中各节点的强度与边权值动态演化特征与BBV模型的边权值动态演化特征一致。节点 增加一条新连接后,节点与其邻居连边的权重受到影响,权值变化为:
重复以上过程,直到网络达到要求的规模。
二、基于复杂网络的Internet流量分析
1.FDM模型与BBV模型比较
按照FDM模型的生成方法,选择初始参数mo=eo=10,生成1000个节点的网络模型。选取50个具有较大度的节点作为模型中的中心节点,其余节点作为普通节点。每一次产生N=500个数据包,这些数据包的源节点和目标节点都在普通节点中随机选取,且保证源节点和目标节点不同。数据包允许在网络中传递的最大步数为T,循环产生10次不同的随机数据包,并将Dt的结果取平均后作为网络中数据流量变化的指标。
首先,假设网络中的每一个节点都具有任意的容量和处理速度,即每个节点队列都可以存储所有到达的数据包且可以一次处理完所有的数据包。从中可以知道,就整体而言,模型FDM中的丢包率要明显低于BBV中的丢包率。在BBV模型中,当T=4时,Dt;在FDM模型中,根据仿真结果表明,在T=4时,Dt=0.0020。与上面的数据相比,有大约3%的数据包将不能到达目标节点而被丢弃,这将直接影响到网络的数据包。这表明,在新模型FDM中数据传递比在BBV模型中更流畅。
2.节点的容量和处理速度对网络丢包率的影响
假设Internet网络中路由器的容量和处理速度都是有限制的,所以,在下面的仿真中给节点赋予了特定的值。
篇7
[
关键词 ]股票;相关性;复杂网络;GN算法
[DOI]10.13939/j.cnki.zgsc.2015.22.042
1引言
股票间的相关性对于风险管理、投资决策具有重要影响。对于股票相关性的研究,现代金融理论主要基于经济基本面进行解释,即认为相关性来源于影响资产现金流和影响资产折现率的基本面因素。已有研究表明,股票间相关程度远超出了经济基本面因素的影响,股票市场作为复杂系统日益受到人们的关注。近年来,经济、数学、社会等领域的学者都开始用复杂网络及其相关概念来研究股票市场,进而研究股票间相关性。
2股票间的相关性
研究股票间的相关性对股民来说至关重要。现随机选取沪市A股、沪市B股、深市A股、深市B股、创业板这五类市场中各20只股票在2013年1月1日至2013年8月31日的周开盘价、收盘价和周个股回报率作为量化指标,进行相关性分析。
2.1单个指标的相关系数
选取周开盘价,周收盘价与考虑现金红利再投资的周个股回报率,并用k=1,2,3表示。
Ai(k)表示股票代码为i,指标为k的时间序列矩阵
设随机变量Ai(k)与Aj(k),则协方差为:
Cov(Ai(k),Aj(k))=E(Ai(k)-EAi(k))E(Aj(k)-EAj(k))
相关系数为:
2.2指标权重的设立——变异系数法
2.3综合指标的相关系数
设运用股票i与股票j之间的综合相关系数值为
2.4模型的求解
对原题附件中数据进行处理,依据五类不同的股票市场,依次随机选取20只股票在2013年1月至2013年9月共36周内的周开盘价、收盘价和考虑现金红利再投资的周个股回报率数据。基于模型Ⅱ,运用Matlab编程求解,见表1。
3股票板块的划分
股票板块的划分存在很多依据,常见的有按地域、按行业、按概念等,但这些都是从定性的角度去考察股票与股票内在联系,而通过相关性构建的股票网络,能依据股票与股票间时间序列数据的相关性,从定量角度去划分股票板块。这样的量化处理使得板块内部的波动性更加一致,更利于我们的投资决策。
3.1股票相关性网络模型
①相关系数构成。网络的节点代表股票,边代表股票之间的相关性。任意两只股票i和j的综合相关系数为:
其中i和j代表股票代码,ρij的取值范围为-1,1。若ρij=-1,则表示两只股票完全负先关;若ρij=1,则表示两只股票完全正相关。
②阈值的设定。股票代表网络中的点,如果相关系数ρij≥θ(θ∈-1,1),就认为节点i和j之间有连边,这里的θ即阈值点。通过计算对比得知,当θ=0.05时其到达最佳阈值,股票网络的拓扑性质最稳定,更有利于对股票网络的研究。
③社团结构的构建。由模块度评价函数来衡量社团结构划分好坏,将其推广至加权的模块度评价函数Q定义为:
3.2股票板块划分
(1)基本分块情况。依据社团结构理论,结合GN算法和NetDrew绘图软件见图1。
由图1可知,图像在经过重新排列后,明显呈现出四个板块,说明在这四大板块中,板块内的股票在长期的波动趋势与波动幅度具有较高的一致性。图1的股票来源为沪市A股、沪市B股、深市A股、深市B股、创业板这五类市场中各随机选取的20只股票共100只股票,范围覆盖了中国内地全部股票市场,具有较高的准确性。
(2)找寻关键节点。为了更方便寻找最关键节点,运用Ucinet软件对图形进行处理如图2所示。
每个模块的内部相关性程度很高,那么选取每个模块中最重要节点,用它的性质来近似描述该模块的整体性质。通过软件处理后,使得节点的重要程度与图形的大小成反比,这样更易比较,也更易选出最关键的节点。
依据此,分别取900930(沪普天B)、300120(华测检测)、900951(*ST大化B)002630(华西能源)这四只股票代表图2正上方,左方,正下方,右方区域。
(3)关键节点股票单个股分析。图2区域正上方的板块选取股票900930(沪普天B),观察其2013年1月至9月的周开盘价走势,其一直处在0.6元上下波动,说明其已为成熟期股票,特点为股价稳定,波动幅度小,发展前景较弱。依据此,对图2正上方区域股票归类为成熟板块股票。
图2区域左方的板块选取股票300012(华测检测),观测其走势,其2013年1月至9月的周开盘价曲线,其上涨幅度较快,在第17周的骤降是因为上市公司因为股价
过高或想要再融资,进行增资扩股的情况而非下跌。在短短的几个月内,其股价从第18周的10元附近上涨到15元附近,是一只处于上升期的股票,说明其为成长期的股票,特点为股价不稳定,波动幅度大,发展前景较强。依据此,对图2正上方区域股票归类为成长板块股票。
图2区域正下方的板块选取股票900951(*ST大化B),观测其2013年1月至9月的周开盘价曲走势,其波动幅度一般,股票价格持续低位,在第一周到第八周小幅上涨后,连续几十周的持续下跌,且通过查询股票代码发现其中文名称前标记着*ST,意味着此股票有即将下市的风险,警告投资者谨慎投资。所以这是一直处于衰落期的股票,特征为股票价格低,下跌趋势强,波动程度较大。依据此,对图2正下方区域股票归类为衰落板块股票。
图2区域右方的板块选取股票002630(华西能源),观测其2013年1月至9月的周开盘价曲线走势,其整体趋势是上升的,但上升的比例较小,而且不断波动,在一个个涨跌幅中前进,明显是一只处于萌芽期的股票,其特点为股价不稳定,波动幅度大,处于大幅度震荡上涨的趋势。依据此,对图2右方区域股票归类为萌芽板块股票。
4结论分析与投资建议
现实中的板块划分主要分为两类,一类是地域板块,按照上市公司的所在地划分股票;一类是概念板块,如金融与银行业、化工业等;同时也会有依据股票的表现划分为蓝筹股、垃圾股等。而上述划分是依据时间序列数据的相关性程度划分的,与现实的板块划分有相同也有不同的地方。
相同点:与主流的两类划分的依据相同,其划分主要依据都是因为这类股票有着很强的相关性,在整体系统性风险一定的情况下,局部的系统性风险类似,如银行与金融板块,当央行上调法定存款准备金率时,其板块的股票整体呈下降趋势。
不同点:本文的股票网络模型比较接近与现实生活中的依据股票表现划分的类型,但这不是主流的划分,与按照概念划分和地域划分的板块在度量相关性的指标上有一定的差距。
一是多样化选股。投资股票种类多样化,板块多样化根据社团结构的股票网络图知,当购买股票时,切勿全部购买相同板块的股票,要综合考虑,分散风险。相同板块的股票相关程度高,波动的趋势相同,从一方面来看,若全部购买同一类型股票,将会使板块的非系统性无法避免,提高投资的风险率;从另一方面来看,虽然同一板块股票上涨具有传递效应,但其效应大小远远小于下跌时的连带效应,及时此板块的某些股票暴涨也不一定能带动整个板块所有股票上涨。所以,即使是风险偏好者也应慎重考虑。
二是综合投资与投机,确保利益最大化。作为投资者,在股票市场的最终目的是利益最大化。那么在选股时,不仅要考虑短线低买高卖的投机操作,也要有长期持仓的投资计划。对于投机类股票,结合板块分析可知,应选取处于萌芽期或成长期的股票,这些股票的波动性大,只要能把握好趋势,在短线操作的收益率较高。对于那些风险偏好更高的投资者来说,可以考虑处于衰落期的股票。这类股票,一旦有公司借壳上市,其市值会翻倍的增长;对于投资类股票,可以选取成熟类板块的股票,这类股票波动程度小,股盘大,价格相对稳定,每年会有固定的分红股利,这类股票适合长线持有。
三是选股重看基本面。股票的基本面的好坏是一只股票有没有操盘意义的前提,一般的我们通过分析其每股净收益,单日成交量等基本财务指标来判断其基本面情况。如果一只股票的基本面不好,再多的技术分析也只是空中楼阁。所以对于选股来说,先看基本面,再看技术指标。
四是把握宏观经济基本面,紧跟时事动态。在尚不完善的中国股票市场,投机和跟风是市场普遍的特点。拥有敏锐的宏观经济嗅觉,能够更好地提高投资者对所持股票的掌控度,更有利于投资者资本收益最大化的实现。
引用一句股票市场最流行的一句话,股市有风险,入市需谨慎,在进行投资决策前,一定要量力而行,切忌盲目盲从,要理性判断,做出最优的理财规划,让你和你爱的人过上更加幸福美好的生活。
参考文献:
[1] 康桥,田新民.沪市主板与深市创业板相关性研究及实证分析[J].中国市场,2014(36).
篇8
团结构是复杂网络普遍而又重要的拓扑属性之一,具有团内连接紧密、团间连接稀疏的特点。网络团结构提取是复杂网络分析中的一个基本步骤。揭示网络团结构的复杂网络聚类方法[1~5]对分析复杂网络拓扑结构、理解其功能、发现其隐含模式以及预测网络行为都具有十分重要的理论意义和广泛的应用前景。目前,大多数提取方法不考虑重叠网络团结构,但在多数网络应用中,重叠团结构更为普遍,也更具有实际意义。
现有的网络重叠团结构提取方法[6~10]多数只对团间模糊点进行初步分析,如Nepusz等人[9,10]的模糊点提取。针对网络交叠团结构的深入拓扑分析,本文介绍一种新的团—点相似度模糊度量。由于含有确定的物理含意和更为丰富的拓扑信息,用这种模糊度量可进一步导出团与团的连接紧密程度,以及模糊节点对两团联系的贡献程度,并设计出新指标和定量关系来深度分析网络宏观拓扑连接模式和提取关键连接节点。本文在三个实际网络上作了实验分析,其结果表明,本方法所挖掘出的网络拓扑特征信息为网络的模糊聚类后分析提供了新的视角。
1新模糊度量和最优化逼近方法
设A=[Aij]n×n(Aij≥0)为n点权重无向网络G(V,E)的邻接矩阵,Y是由A产生的特征矩阵,表征点—点距离,Yij>0。假设图G的n个节点划分到r个交叠团中,用非负r×n维矩阵W=[Wki]r×n来表示团—点关系,Wki为节点i与第k个团的关系紧密程度或相似度。W称为团—点相似度矩阵。令Mij=rk=1WkiWkj(1)
若Wki能精确反映点i与团k的紧密度,则Mij可视为对点i、j间相似度Yij的一个近似。所以可用矩阵W来重构Y,视为用团—点相似度W对点—点相似度Y的估计:
WTWY(2)
用欧式距离构造如下目标函数:minW≥0FG(Y,W)=Y-WTWF=12ij[(Y-WTW)。(Y-WTW)]ij(3)
其中:•F为欧氏距离;A。B表示矩阵A、B的Hadamard矩阵乘法。由此,模糊度量W的实现问题转换为一个最优化问题,即寻找合适的W使式(3)定义的目标函数达到最小值。
式(3)本质上是一种矩阵分解,被称为对称非负矩阵分解,或s-NMF(symmetricalnon-negativematrixfactorization)。s-NMF的求解与非负矩阵分解NMF[11,12]的求解方法非常类似。非负矩阵分解将数据分解为两个非负矩阵的乘积,得到对原数据的简化描述,被广泛应用于各种数据分析领域。类似NMF的求解,s-NMF可视为加入限制条件(H=W)下的NMF。给出s-NMF的迭代式如下:
Wk+1=Wk。[WkY]/[WkWTkWk](4)
其中:[A]/[B]为矩阵A和B的Hadamard矩阵除法。
由于在NMF中引入了限制条件,s-NMF的解集是NMF的子集,即式(4)的迭代结果必落入NMF的稳定点集合中符合附加条件(H=W)的部分,由此决定s-NMF的收敛性。
在求解W之前还需要确定特征矩阵。本文选扩散核[13]为被逼近的特征矩阵。扩散核有明确的物理含义,它通过计算节点间的路径数给出任意两节点间的相似度,能描述网络节点间的大尺度范围关系,当两点间路径数增加时,其相似度也增大。扩散核矩阵被定义为K=exp(-βL)(5)
其中:参数β用于控制相似度的扩散程度,本文取β=0.1;L是网络G的拉普拉斯矩阵:
Lij=-Aiji≠j
kAiki=j(6)
作为相似度的特征矩阵应该是扩散核矩阵K的归一化形式:
Yij=Kij/(KiiKjj)1/2(7)
基于扩散核的物理含义,团—点相似度W也具有了物理含义:团到点的路径数。实际上,W就是聚类结果,对其列归一化即可得模糊隶属度,需要硬聚类结果时,则选取某点所对应列中相似度值最大的团为最终所属团。
2团—团关系度量
团—点相似度W使得定量刻画网络中的其他拓扑关系成为可能。正如WTW可被用来作为点与点的相似度的一个估计,同样可用W来估计团—团关系:
Z=WWT(8)
其物理含义是团与团间的路径条数。很明显,Z的非对角元ZJK刻画团J与团K之间的紧密程度,或团间重叠度,对角元ZJJ则刻画团J的团内密度。
以图1中的对称网络为例,二分团时算得
Z=WWT=1.33760.0353
0.03531.3376
由于图1中的网络是对称网络,两团具有同样的拓扑连接模式,它们有相同的团内密度1.3376,而团间重叠度为0.0353。
3团间连接贡献度
ZJK度量了团J与团K间的重叠程度:
ZJK=na=1WJaWKa(9)
其中:WJaWKa是这个总量来自于点a的分量。下面定义一个新指标来量化给定点对团间连接的贡献。假设点i是同时连接J、K两团的团间某点,定义点i对团J和团K的团间连接贡献度为
Bi=[(WJiWKi)/(na=1WJaWKa)]×100%(10)
显然,那些团间连接贡献大的点应处于网络中连接各团的关键位置,它们对团间连接的稳定性负主要责任。将这种在团与团间起关键连接作用的点称为关键连接点。为了设定合适的阈值来提取团间关键连接点,本文一律取B>10%的点为关键连接点。
4实验与结果分析
下面将在三个实际网络上展开实验,首先根据指定分团个数计算出团—点相似度W,然后用W计算团—团关系和B值,并提取关键连接点。
4.1海豚社会网
由Lusseau等人[14]给出的瓶鼻海豚社会网来自对一个62个成员的瓶鼻海豚社会网络长达七年的观测,节点表示海豚,连线为对某两只海豚非偶然同时出现的记录。图2(a)中名为SN100(点36)的海豚在一段时间内消失,导致这个海豚网络分裂为两部分。
使用s-NMF算法聚类,海豚网络分为两团时,除30和39两点外,其他点的分团结果与实际观测相同,如图2(a)所示。计算B值并根据阈值提取出的五个关键连接点:1、7、28、36、40(虚线圈内),它们对两团连接起到至关重要的作用。图2(b)为这五点的B值柱状图。该图显示,节点36(SN100)是五个关键连接点中B值最大者,对连接两团贡献最大。某种程度上,这个结果可以解释为什么海豚SN100的消失导致了整个网络最终分裂的影响。本例说明,s-NMF算法及团间连接贡献程度指标在分析、预测社会网络演化方面有着独具特色的作用。
4.2SantaFe科学合作网
用本算法对Newman等人提供的SantaFe科学合作网络[15]加以测试。271个节点表示涵盖四个学术领域的学者,学者合作发表文章产生网络连接,构成了一个加权合作网络。将本算法用于网络中一个包含118个节点的最大孤立团,如图3(a)所示。
图3(a)中,四个学科所对应的主要组成部分都被正确地分离出来,mathematicalecology(灰菱形)和agent-basedmodels(白方块)与文献[15]的结果一致,中间的大模块statisticalphysics又被细分为四个小块,以不同灰度区分。计算了24个点的团间连接度贡献值B,从中分离出11个B值大于10%的点作为关键连接点:1、2、4、6、11、12、20、47、50、56、57,其标号在横轴下方标出,见图3(b),并在图3(a)中用黑色圆圈标记,这些连接点对应那些具有多种学科兴趣、积极参与交叉研究的学者。除去这11个点时,整个网络的连接布局被完全破坏,见图3(a)下方灰色背景缩小图,可见关键连接点的确起到重要的沟通各模块的作用。
4.3杂志索引网络
在Rosvall等人[16]建立的2004年杂志索引网络上进行测试。网络节点代表杂志,分为物理学(方形)、化学(方形)、生物学(菱形)、生态学(三角形)四个学科领域,每个学科中各选10份影响因子最高的刊物,共40个节点,若某刊物文章引用了另一刊物文章,则两刊间有一条连线,形成189条连接。使用s-NMF对该网4分团时,聚类结果与实际分团情况完全一致,如图4(a)所示。
由本算法得出的团—点相似度W在网络宏观拓扑结构的挖掘方面有非常有趣的应用,如第2章所述,用W计算团—团相似度矩阵Z=WWT,其对角元是团内连接密度,非对角元表征团与团的连接紧密程度,故Z可被视为对原网络的一种“压缩表示”。如果将团换成“点”,将团与团之间的连接换成“边”,利用Z的非对角元,就能构造出原网络的一个压缩投影网络,如图4(b)所示。这是原网络的一个降维示意图,也是团与团之间关系定量刻画的形象表述,定量地反映了原网络在特定分团数下的“宏观(全局)拓扑轮廓”,图上团间连线色深和粗细表示连接紧密程度。由图4(b)可以看到,physics和chemistry连接最紧密,而chemistry与biology和biology与ecology次之。由此推测,如果减少分团数,将相邻两团合并,连接最紧密的两团必首先合并为一个团。实际情况正是如此:分团数为3时,biology和ecology各自独立成团,physics和chemistry合并为一个大团,这与文献[11]结果一致。
5讨论
网络模糊聚类能帮助研究者进一步对团间的一些特殊点进行定量分析,如Nepusz等人[9]用一种桥值公式来刻画节点在多个团间的共享程度,即节点从属度的模糊程度。而本文的团间连接贡献度B反映出节点在团间连接中所起的作用大小。本质上它们是完全不同的两种概念,同时它们也都是网络模糊分析中所特有的。团间连接贡献度指标的提出,将研究引向对节点在网络宏观拓扑模式中的影响力的关注,是本方法的一个独特贡献。无疑,关键连接点对团间连接的稳定性起到很大作用,如果要迅速切断团间联系,改变网络的宏观拓扑格局,首先攻击关键连接点(如海豚网中的SD100)是最有效的方法。团间连接贡献度这一定义的基础来自于对团与团连接关系(Z)的定量刻画,这个定量关系用以往的模糊隶属度概念无法得到。由于W有明确的物理含义,使得由W导出的团—团关系Z也具有了物理含义,这对网络的宏观拓扑分析非常有利。
6结束语
针对复杂网络交叠团现象,本文给出了一个新的聚类后模糊分析框架。它不仅能对网络进行模糊聚类,而且支持对交叠结构的模糊分析,如关键点的识别和网络宏观拓扑图的提取。使用这些新方法、新指标能够深入挖掘潜藏于网络的拓扑信息。从本文的聚类后分析不难看出,网络模糊聚类的作用不仅在于聚类本身,还在于模糊聚类结果能够为网络拓扑深入分析和信息挖掘提供支持,而硬聚类则不能。今后将致力于对团间连接贡献度指标进行更为深入的统计研究。
参考文献:
[1]赵凤霞,谢福鼎.基于K-means聚类算法的复杂网络社团发现新方法[J].计算机应用研究,2009,26(6):2041-2043,2049.
[2]汪小帆,刘亚冰.复杂网络中的社团结构算法综述[J].电子科技大学学报,2009,38(5):537-543.
[3]NEWMANMEJ.Modularityandcommunitystructureinnetworks[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2006,103(23):8577-8582.
[4]WHITES,SMYTHP.Aspectralclusteringapproachtofindingcommunitiesingraphs[C]//ProcofSIAMInternationalConferenceonDataMining.2005.
[5]ENRIGHTAJ,DONGENSV,OUZOUNISCA.Anefficientalgorithmforlarge-scaledetectionofproteinfamilies[J].NucleicAcidsResearch,2002,30(7):1575-1584.
[6]BEZDEKJC.Patternrecognitionwithfuzzyobjectivefunctionalgorithms[M].NewYork:PlenumPress,1981.
[7]PALLAG,DERENYII,FARKASI,etal.Uncoveringtheoverlappingcommunitystructuresofcomplexnetworksinnatureandsociety[J].Nature,2005,435(7043):814-818.
[8]REICHARDTJ,BORNHOLDTS.Detectingfuzzycommunitystructuresincomplexnetworkswithapottsmodel[J].PhysicalReviewLetters,2004,93(21):218701.
[9]NEPUSZT,PETROCZIA,NGYESSYL,etal.Fuzzycommunitiesandtheconceptofbridgenessincomplexnetworks[J].PhysicalReviewE,2008,77(1):016107.
[10]ZHANGShi-hua,WANGRui-sheng,ZHANGXiang-sun.IdentificationofoverlappingcommunitystructureincomplexnetworksusingfuzzyC-meansclustering[J].PhysicalReviewA:StatisticalMechanicsandItsApplications,2007,374(1):483-490.
[11]PAATEROP,TAPPERU.Positivematrixfactorization:anon-negativefactormodelwithoptimalutilizationoferrorestimatesofdatavalues[J].Environmetrics,1994,5(2):111-126.
[12]ANTTILAP,PAATEROP,TAPPERU,etal.SourceidentificationofbulkwetdepositioninFinlandbypositivematrixfactorization[J].AtmosphericEnvironment,1995,29(14):1705-1718.
[13]KONDORRI,LAFFERTYJ.Diffusionkernelsongraphsandotherdiscretestructures[C]//Procofthe19thInternationalConferenceonMachineLearning.SanFrancisco:MorganKaufmann,2002.
篇9
1 网络程序并发性与复杂性简析
网络程序并发性与复杂性是由多方面引起的,以下从环境差距过于明显、设计理念的限制、驱动模式有待优化等方面出发,对于网络程序并发性与复杂性进行了分析。
1.1 环境差距过于明显
网络程序并发性与复杂性主要是因为单机环境和网络环境差距过于明显所导致的。大家都知道随着近年来高质量网络程序的不断开发,之前传统程序设计过程中存在的许多问题都被暴露出来。在这一过程中可以发现网络环境与单机环境之间的巨大差异性成为影响程序开发设计的关键。其次,并发性问题的存在实际上成为了网络程序设计发展的重要限制瓶颈,因此,如何能够对于并发性问题进行有效的解决,成为了摆在程序设计人员面前的要点。与此同时,环境差距过于明显还意味着混合性并发模型发展时间短和实际应用少的缺陷也会暴露出来,因此其对于并发性问题的解决效果还需要进一步的观察。
1.2 设计理念的限制
网络程序并发性与复杂性的存在也跟之前的设计理念被软硬件功能限制有着密切的联系。通常来说网络程序的并发性问题的表现形式通常会以分布性、异构性、异步性和访问延误等形式表现出来。因此工作人员在将问题整合成一个整体后就会发现,并发性问题变得极其难以解决。其次,设计理念上的限制还会使得网络程序设计的整体效率受到非常大的影响。
1.3 驱动模式有待优化
网络程序并发性与复杂性和驱动模式有着千丝万缕的联系。由于网络并发任务处理方法实际上可以根据语义将其分为反应式和前摄式两种。在反应式模型中应用程序必须通过接收到相应的事件通知,然后才能够在此基础上能够更加具有针对性的发出具体的操作指令,在这一过程中如果操作的结果是错误的,则工作人员可以从函数的返回值中即时获知。其次,驱动模式有待优化还指的是操作的错误情况通常会作为完成事件的参数,传递给应用程序如果需要同时发出多个相似的并发操作,则需要在发出操作指令时,增加一个标识参数,从而能够在此基础上对于并发操作进行更加细致的区分。
2 网络程序并发性与复杂性问题应对
网络程序并发性与复杂性问题的应对应当从许多方面出发,以下从优化多线程模型、协调程序运作顺序、开发新型并发模型等方面出发,对于网络程序并发性与复杂性问题的应对进行了分析。
2.1 优化多线程模型
网络程序并发性与复杂性问题应对的第一步是合理优化多线程模型。工作人员在优化多线程模型的过程中首先应当根据多线程并发模型多线程并发模型的线程调度来对其进行分别的分析。其次,工作人员在优化多线程模型的过程中应当确保线程的运行状况与应用层的控制无关,在这一过程中CPU是由调度器来进行控制的,并且调度器对于线程的调度是强制性的。与此同时,工作人员在优化多线程模型的过程中应当合理的实现CPU控制权的强制转移,从而能够在此基础上有效的规避因为上一个线程没有处理好当前线程所需要的各种数据,引发数据竞争,严重的甚因此,在对线程协作复杂或者并发性高的任务进行处理,最终可以减少系统出现崩溃的概率。
2.2 协调程序运作顺序
网络程序并发性与复杂性问题应对的关键是协调程序运作顺序。工作人员在协调程序运作顺利的过程中首先应当理解到与抢占式调度相比CPU的控制权具有更强的优先度,因此这意味着只有在当前线程放弃数据处理后实际上才会将CPU的控制权转移到其他线程。其次,作人员在协调程序运作顺利的过程中还应当确保应用程序的线程操作必须经过系统调用,在这一过程中由于线程代码的移植具有很高的难度,因此实际上非常严重的影响了其普遍适应性,所以只有通过合理的协调才能够确保其运作顺序的合理优化。
2.3 开发新型并发模型
网络程序并发性与复杂性问题应对离不开新型并发模型的开发与利用。工作人员在开发新型并发模型的过程中应当优先对于混合性并发模型进行应用。其次,工作人员在开发新型并发模型的过程中首先应当理解到无论是事件驱动模型还是多线程并发模型实际上都具有各自的优点和不足,因此这导致了其在实际应用中始终存在一定的局限性。对因此设计人员在开发新型并发模型的过程中应当勇于打破常规合理的将这两种模型融合在一起,最终能够期待形成全新的并发模型,最终能够促进程序设计合理性的有效提升。
3 结束语
在网络程序的设计过程中并发性问题实际上是一个难以进行规避的复杂问题。因此工作人员在认清当前的技术条件下应当通过有效的提升网络程序的并发处理能力,并且在此基础上并发模型的性能进行完善,才能够促进网络程序设计效率的有效提升。
参考文献
[1]李慧霸,田甜,彭宇行,等.网络程序设计中的并发复杂性[J].软件学报,2011(1):132-148.
[2]高伟,张学红.关于网络程序设计中的并发复杂性研究[J].网络安全技术与应用,2014(12):49-51.
[3]潘珂,田勇.网络程序设计中的并发复杂性研析[J].科技致富向导,2014(27):84-85.
篇10
文献标识码:A 文章编号文章编号:16727800(2013)007002303
0 引言
具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络称为复杂网络[1]。自然界与社会生活中众多复杂系统都可用复杂网络来描述。近年来,关于复杂网络的研究正处于蓬勃发展阶段,其中复杂网络的传输能力与人们的工作生活关系密切,在现代社会中占据了非常重要的地位。因此,发生在复杂网络拓扑之上的各种动力学过程,如改善复杂网络路由效率以提高网络容量等问题,越来越多地受到统计物理学界和工程界的关注[1]。
1 相关研究
随着网络规模和信息量的大幅增加,拥塞现象成为现实网络中常见的动态特性之一。许多实际网络,如因特网、交通网络等经常发生拥塞,由此导致网络整体性能下降,甚至瘫痪。导致网络拥塞的主要原因有两方面:一是网络中传输的大量数据流(特别是并发数据);二是网络本身的特性,包括节点容量、节点转发数据包能力、网络拓扑结构、通信链路带宽等。
目前,学者们通常用3种方式缓解网络拥塞的问题:一是使用特定的网络拓扑结构;二是提高单个节点转发数据包的能力;三是改进路由策略。第一种方法需要改变现有的拓扑结构,和第二种方法一样都存在成本高、资源浪费等问题。当网络规模较大时这些改变较难实现,单靠升级硬件能带来的改善效果也有限。因此,许多研究人员在改进复杂网络路由策略方面做出了很多有影响力的工作[1]。
广度优先[2]和随机游走[3]是复杂网络中最简单的路由策略,但它们没有考虑网络的拓扑结构,随着网络规模的扩大,网络中会产生大量的重复数据包,从而导致网络拥塞。因此,尽管它们在路由效率的理论分析中被广泛采用,在实际中却难以应用。目前,现实网络中的路由算法多采用基于最短路径路由算法[4],但该算法要求所有节点都知道全局信息,只考虑了网络结构属性而忽略了网络中负载的动态特性。另外,上述研究都基于一种假设,即复杂网络的结构是单层的,所有节点在处理数据包能力等方面一致且每个节点等待队列的长度无限。但实际通信网络中,这些假设很难成立,需要依照实际设计综合考虑网络拓扑和负载动态等问题的更优化的路由策略[5]。另外,在网络的动态演进过程中,由于网络规模大,要每个节点都知道全局信息并不现实。因此,基于局部信息比基于全局信息的动态路由策略更易于部署实施。
在综合考虑网络中节点处理能力、空闲队列长度、聚类性、度等网络拓扑和动态负载参数的基础上,引入层次分析法[6]建模,提出了复杂网络中基于层次分析法的路由策略(Routing Strategy in Complex Network based on Analytic Hierarchy Process,简称RSAHP)。算法利用若干权重因子的组合来选取下一跳转发节点,其中权重因子的组合综合地反映了网络的拓扑属性和动态负载等当前状态。理论分析和实验证明,RSAHP具有如下良好性质:①分布式的网络路由策略在实际网络中易于实现;②具有自适应性,每个接收到数据包的节点在系统的观点下综合判断、决定下一跳转发点,通过合理选择下一跳有效地提高网络通信能力。理论分析和仿真实验表明,RSAHP比最短路径算法更能有效避免拥塞,并能进一步增强复杂网络的网络容量。
造成上述问题的主要原因是SPRS只考虑了网络拓扑结构属性而没有考虑网络中负载的动态特性,要传送的数据包也无法选择其它的路由路径,当最短路径中的节点发生拥塞时,SPRS会使拥塞节点更拥塞,从而进一步降低网络性能,甚至加速网络崩溃。而RSAHP在综合考虑网络中节点处理能力、空闲队列长度、聚类性、度等网络拓扑和动态负载参数的基础上,利用若干权重因子的组合来选取下一跳转发节点,综合地反映了网络的拓扑结构属性和动态负载等当前状态。理论分析和仿真实验表明,RSAHP比SPRS更适合大规模网络,更能有效避免拥塞,并进一步增加了复杂网络的网络容量。
参考文献:
[1] 臧海娟,任彦,薛小平等.复杂网络环境下的路由方法研究[J].计算机应用,2010(8).
[2] SHARMA G,MAZUMDAR R R. Hybrid sensor networks: a small world[C].Proceedings of 6th ACM International Symposium on Mobile Ad Hoc Networking and Computing, 2005.
[3] 席峰. 基于复杂网络理论的无线传感器网络地理路由和信息融合.[D].南京:南京理工大学,2010.
篇11
1武昌城区基本网络结构特点
我们所得到的网络是一个连通的整体,它是由194个相互独立的节点组成的。也就是说,如果用连线来表示两位节点之间有合作,则任意两个不同的节点之间有直接的连线或间接的连线。
在该交通网络中整个网络的度分布情况如下表1所示:
从表1中可以看出,整个网络平均度=3.299大部分的节点数度值都集中于2、3、4。其中,含4个节点的小组最多,有55个。
虽然度值最高的点和聚类系数大的点不一定是实际公交线路中的繁忙点,但是它们却是网络中取的交通规划中流通性最好的站点。在这些站点上如果发生交通堵塞时,公交网络受到的影响并不是很大,公交线路可以很容易的改变继续运行,即该公交网络也具有某种“鲁棒性”。由此可见,当这几个节点发生交通堵塞的时候,整个公交网络的流通性有了明显的下降;即某种意义上,该公交网络也具有“脆弱性”。
在该网络中我们分析了它的全局数字特性,那么下面我们来看看聚类系数与度之间有没有什么关系。(如表2)
我们由前面所给出的度分布可以看出,大多数节点的度值集中于2、3、4;其中,含4个节点的小组最多;而我们通过上表可以看到,尽管度值在4的节点的聚类系数都很低,但整个网络具有比随机网络更高的平均聚类系数,显示了比较明显的聚类效应。
下面我们从该网络中选取几个有代表性的子网进行一下研究:(选取的五个网络的数字特征分别如表3所示。
在这几个子网中,我们可以看到它们的全局效率比整个网络要高的多,聚类系数均高于整个网络的的平均聚类系数。这说明了这几个子网的流通性要比该整体公交网络要好。但我们也可以发现在E子网中,当节点137与节点138的线路堵塞时,该网络被分为两个网络,即该子网具有非常高的脆弱性。因此在以后的公交网络的规划中,我们应该注意在保持局部公交网络的效率不降低的情况下对整个网络进行改造,提升公交网络的整体效率。
2一个公交网络查询系统的开发
篇12
网络信息技术的高速发展,使人们的生活向着自动化、智能化、信息化和现代,推动了我国经济的快速发展。复杂网络背景下的Java程序分析工具中,JPAC工具的应用,大大提高了Java软件系统的可靠性、稳定性和高效性,促进了现代化建设中软件产业的进一步发展。
1 复杂网络背景下的Java程序分析工具的概述
信息技术的发展使网络化环境变得越来越复杂,提高软件技术对系统的支持、管理和维护,成为了当前软件开发的重点,为了更好的开发软件,对复杂网络进行有效的管理,相关软件研发人员根据复杂网络的特点、性质和变化,提出了Java程序分析工具,以促进对Java程序代码的分析和复杂软件系统的研究。JPAC工具的开发和应用,为Java软件系统提供了复杂的网络环境,从而对Java系统软件的网络特征和变化进行深入的研究,促进Java软件系统在复杂网络背景下研究的不断探索和创新。
2 复杂网络背景下的Java程序分析工具工作原理和结构
2.1 JPAC工具的工作原理
利用JPAC可以进行大量的复杂网络研究,降低了研究人员的工作量,大大提高了Java系统软件的复杂网络化,使复杂网络的各种研究变得科学化和高效化。在Java系统软件的结构网络化中,可以运用软件协作图即构建JavaSCG,对Java系统软件的结构进行细致的描述,从而对Java系统软件的复杂网络特征和变化规律等进行分析和研究。另外,在Java系统软件的复杂网络化变化过程中,JPAC工具还可以采用软件演化模型进行Java系统软件复杂网络特征形成的全过程的模拟,从而提高对Java系统软件复杂网络的深入研究和分析。
2.2 JPAC工具的结构
根据对Java系统软件复杂网络的研究和演化过程的分析和对Java程代码的深入研究,可以更好地构建Java系统软件的复杂网络功能,促进软件研发人员对Java系统软件复杂网络特征和变化规律的认识。JPAC工具的结构可以分为以下三个部分:
2.2.1 数据分析
是数据分析层,与JPAC工具结构的其它部分相比,数据分析层是独立运行的,因此,可以根据实际的需求对数据分析层进行不同功能的添加,以提高JPAC工具的实际应用性。在JPAC工具中,数据分析层的作用主要是进行Java代码文件和XML文档的相互交换,并将Java代码文件和XML文档进行打包到网络计算机中,以提高Java系统软件的复杂网络功能。
2.2.2 数据运算
在JPAC工具中,数据运算层是可以进行扩展的层次,因此,可以扩大Java系统软件的应用范围,增强Java系统软件实际应用的高效性。数据运算是通过计算机来进行操作的,在数据分析层提供的网络功能上,进行数据的统计、计算和模拟等运算,实现JPAC工具的网络计算功能。
2.2.3 用户界面
用户界面是JPAC工具的最上层,与计算机操作者直接联系,可以实现JPAC工具的直接操作,将运算结果形象、具体的展示在用户面前,非常直观,使Java系统软件得操作变得可视化。
3 复杂网络背景下的Java程序分析工具的设计
JPAC工具的设计,根据JPAC工具的结构可分为三个方面:数据分析设计、数据运算设计和用户界面设计,以实现JPAC对Java系统软件应用复杂网络的构建,即构建JavaSCG。
3.1 数据分析设计
数据分析设计中,数据分析层主要包括分析Java代码、存取XML文档、计算机网络内部网络功能的生成三个功能,并且JPAC工具的设计中可以运用BCEL技术来进行字节码文的分析和DOM技术进行XML文档的分析。可以构建相应的网络,并进行储存,以提供给高层使用。数据分析层有五种类图:ProgInput、XMLParse、DataLayer、JavaBinDataLayer和RandomDataLaye,共同完成数据分析层的相关功能支持。其中,ProgInput是抽象的类图,可以对Java文件进行读入和解析的操作,实现Java文件的解析;XMLParse是运用的DOM技术对XML文档进行解析,从而实现XML文档的读入以及保存;DataLayer是一种抽象的类图,用于保存构建的网络;JavaBinDataLayer是具体的类图,用于保存Java系统结构构建的网络;RandomDataLayer是具体类图中的一种,用于保存随机网络。另外,用于Java代码读入的类图的含义主要有CustomVMConst和CustomJavaClassConst两种;用于XML文档的读入和保存的类图含义包括XMLConstruct、JavaBinConst和RandomConst三种。
3.2 数据运算设计
在JPAC工具的设计中,基于JavaSCG的构建,数据运算层可以进行多种运算,并根据实际的用户需求进行功能的扩充,因此,JPAC工具的数据运算层可以进行统计分析和演化模拟运算。
3.2.1 统计分析运算
在JPAC工具中,主要是通过元素级特征和网络级特征两个方面来进行JavaSCG的网络统计特征,因此,主要的类图有以下四种:一是,DegreeData可以用来达到度分布的统计,包含了出度、入度以及总的度分布,范围比较全面;二是,StaGraph用来统计网络级特征,包含了平均路径长度与平均聚集系数两个部分;三是,VertexSta用来统计元素级中的相关节点特征,包含了聚集系数、介数等的距离;四是,EdgeSta可以用来统计元素级中相关边的特征,它的主要包含是介数。
3.2.2 演化模拟运算
在JPAC工具中,演化模拟运算主要是运用于对软件模块的演化模型的演化模拟,便于软件研发人员对Java系统软件复杂网络特征和变化规律的深入研究。
3.3 用户界面设计
在JPAC工具中,用户界面的设计运用的是EclipseRCP框架,它具有运转速度快、功能强大、可扩展等特点,是RCP在Eclipse的基础上开发出来的一种客户端应用平台,使JPAC工具具备了以下几个优势:开发了插件功能,根据客户的要求,可以实现JPAC工具的扩展;由于Eclipse和Java具有跨平台的功能,因此,JPAC工具可以在多种平台下进行运行。与此同时,根据Eclipse提供的本地图形接口包,可以实现本地窗口的相关操作;随着Eclipse的开发和应用,JPAC工具的扩展性和实际应用性能得到了快速的提高,使软件研发人员对于对Java系统软件复杂网络的研究更加广泛。
4 复杂网络背景下的Java程序分析工具的实践
以Version1.5的JDK为例,使用JPAC工具的复杂网络统计特征进行计算(主要包括平均聚集系数和平均路径长度等指标)。通过对V1.5版JDK中Java包的分析可以得知:网络的中心节点的度数非常大,在中心周围也分布着少量度数较大的节点,小的节点则主要分布在网络的周围,进而表明了无标度特性的迹象。根据上述分析结可以推断出,IDK系统结构的网络具有小世界效应和幂律的度分布特征,证明复杂网络特征在JDK系统中存在。
由于JDK系统是常见的Java软件系统之一,因此,在一定意义上说明了在复杂网络背景下Java程序分析工具存在复杂网络特征。与此同时,通过相关应用、研究和分析,可以得出Java软件系统也具有演化的特性,为软件研发人员提供了有力的研究依据促进软件研发技术水平的不断提升。
5 结束语
信息技术的推广,使信息网络变得越来越复杂,给软件研发人员提出了更高的要求。JPAC工具的开发和应用,为Java软件系统提供了复杂的网络环境,软件研发人员对Java系统软件的网络特征和变化规律进行了深入的研究和分析,促进Java软件系统在复杂网络背景下研究的不断探索和创新。
参考文献
[1]李倩.Java程序指向分析研究[D].南京大学,2012.
[2]曹飞腾."Java程序设计"教学系统的设计与实现[D].湖南师范大学,2012.
[3]刘希.面向Java程序错误定位的动态切片技术的研究与应用[D].湖南大学,2011.
[4]杨克峤.Java程序优化与数据竞争检测的研究[D].复旦大学,2010.
[5]蒋曹清,应时,倪友聪,管华.一种Java程序Chopping方法[J].计算机科学,2011,01:150-155+161.
作者简介
岳珍梅(1975-),女,大学本科学历,硕士学位。现为许昌职业技术学院讲师。网络工程师,主要研究方向为网络技术。
篇13
一、研究现状
2009年Frank Schweitzer et al. [2]发表在Science上的综述性文章,对经济网络研究进行了分类,一类是基于经济学和社会学的,另一类是基于物理学和计算机科学的,对复杂网络在经济领域的应用和未来的前景进行了详尽的介绍和展望,可谓巨细无遗,对研究人员具有很大的参考意义。Chi K.Tse et al. [3]研究2005年7月至2007年8月间全美19807只股票收盘价相关性,根据“赢者全得”原则,得出股票收盘价格全网络、价格回报全网络、成交量全网络均服从无标度网络特性和幂律分布的结论,创新在于提出并定义拟合误差和基于复杂网络理论中“度”的概念计算指数。黄玮强等[4]分别运用最小生成树法和平面最大过滤图法构建上证180指数和深证100指数成份股票的关联网络。黄飞雪等[5]采用类似方法,对2005年7月至2009年6月金融危机前后全球最具代表性的52个股指建模,从最小生成树网络结构变化看出中国股指影响力增强的结论。
应用复杂网络理论研究股票市场方兴未艾,大量文献通过不同角度诠释这一金融系统的机理,但多是研究整体的拓扑特性,在证券板块和网络动态研究方面文献还不多。本文运用复杂网络理论研究房地产上市公司,采用最小生成树法构建,并考察不同市场环境下拓扑结构的动态变化和潜在机理。文章结构分为三部分,首先对前人相关领域文献进行回顾,其次对中国房地产上市公司进行拓扑结构分析并横纵比较,最后研究结论和成因分析。
二、房地产板块网络动态比较分析
(一)房地场板块网络构建方法
沿用Mantegna(1999)[6]最小生成树的建模方法,定义股票i收益率 ,其中 为股票i在t天的日收盘价, 为前一天的日收盘价。两节点间交叉相关系数为 ,
交叉相关系数的范围在[-1,1]之间,于是得到股价波动的相关系数对称方阵。为了度量股票网络的内在性质,引入距离矩阵
,表明股票i与j间相关系数越大则两者间度量距离越小,反之亦然。
(二)实证数据及网络拓扑结构研究
借鉴前人研究方法,本文分别选取中国A股上市房地产板块成分股票2008年和2009年的日收盘数据,来源于色诺芬金融数据库,剔除了因财务或其它状况出现异常受到证交所特别处理的个股。选择时点的原因是,2008年大部分房地产上市公司已完成股份制改革,全流通下的市场价格更能真实反映经营状况,上半年央行又连续6次上调存款准备金率,调控效果开始显现,下半年随着美国次贷问题引发全球性金融危机的影响,房地产市场观望气氛浓重,上市公司业绩下滑、市值缩水,2008年全年地产股普遍低迷。为了刺激经济,宏观调控导向发生变化,货币政策再度从“从紧”向“适度宽松”转变,2009年中国楼市也迅速由低迷转变为亢奋,房地产行业股票也由萧条转变为繁荣。通过构建不同政策影响下股票网络,可以进行比较研究。考虑节假日休市或公司主动停盘等因素,首先对这些金融数据进行处理,主要是对齐数据和填补缺失。运用Matlab软件工具处理数据、构建并分析该股票网络。
(三)网络拓扑特性分析
对网络特性进行定性分析,度是考察节点连接程度的指标,是它与其它节点连边的数量,度主要考量个体情况,更为直观的总体连接程度,则需要引入度的分布,它是指不同度的节点个数的概率分布,均呈幂律度分布,少数高连接度的节点成为了Hub节点,市场低迷和繁荣时网络的平均度分别为1.97和1.98,而大部分节点的度为1或2。平均路径长度描述从网络图中任一节点到达另一节点之间距离(即所有路径间最短路径长度)的平均值,反映网络的规模大小,繁荣和低迷两个时期平均路径长度分别为4.18和3.91。节点的中介数也是与最短路径有关的概念,指通过该节点最短路径的数目,中介数越高表明该节点作为“桥梁”连接的节点越多,繁荣时中心节点粤宏远A的中介数为3815,低迷时中心节点北辰实业的中介数为4451。
三、结论
本文以中国证券市场房地产板块成分股票为研究标的,运用Prim算法分别生成最小生成树的股票网络,得出结论主要有:首先该行业网络符合无标度网络幂律分布的特性;另外2009年刺激经济的宽松政策对中国房地产行业网络产生影响,网络较2008年集中化程度更高、平均路径长度更短,以度数最高的中心节点为例,2008年“粤宏远A”的中介数为3815,而2009年“北辰实业”的中介数达到4451,市场繁荣时更多的节点通过中心节点与其它节点联系。