引论:我们为您整理了13篇项目数据分析报告范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。
篇1
一、基础数据的核实和经济分析
的调整与协调的必要性
1.黄土高原水土保持世界银行贷款项目范囝较大.行政医划上包括甘肃、陕西、山西、内蒙古等4省(区)的7个地(盟、市)、21个县(市、旗),涉及黄河流域的九条一级支流;在地貌类型上涉及黄土高原沟壑区丘陵韦}=区、风沙区和黄土丘陵沟壑区的第一、二副区等类型医;在植被类型上涉及落叶阔叶林区、森林草原区和干草原区。
2.本项目虽以水土保持为主.但基础数据和经济分析包括农林、牧、副等多种行业。涉及项目的社会经济、自然环境和与项目有关的各粪基础数据共327张表、4万多个数据;以地区(盟、市)为单位进行的项目经济分析,有成本分析(计算机)文件9个、效益分析(计算机)文件7个,合计l6个经济分析的计算机文件.包括价格、投入定额、产出定额和治理措旃定额等四类.共数千个数据。
在效益分析中,项目要求对每一个子项目区和所选的典型和所选的典型农作物和经营项目作出计算机模型(附表),每个模型包括投入产出实物量、经济预算和财务预算3张表,每张表又包括当前生产技术投入产出模型和新技术投入产出模型.共产生1221张效益分析表格。
附表效益分析模型数量统计
单位生产模区域横型台计
马莲河61970
延河{69蹦
佳芦河;3962
昕水河54】367
蔚柑河艚II54
河保偏33l144
伊盟4dI155
台计33d73{07
在成本分析中,项目要求对每一个子项目区的每一种治理措施做出详细的物资和经费预算
3.准备时间较长,数据需更新。从3991年正式向世界银行提供项目准备文件开始到1994年签约,经历了4个年头在这期阿,我国经历了从计划经济向市场经济的转变.各种生
产资料、农副产品的价格由国家控制的计划调节的单轨制.改变到计划和市场调节的双轨制,进而发展为全部由市场调节的价格体系。其中最为突出的是外汇价格(汇率)的变化。汇率由单轨制发展到双轨制,最终又发展成为|994年开始实行的市场调节价.这使汇率由1994年以前的不到6.突然提高到8.7.猛增了50以上。
综上所述.黄l土高原水土保持世界银行贷款项目的数据涉及面之广、数量之大、要求之高
都是前所未有的,同时还有时间的延伸带来的
显著影响,因此。对于各类数据必须进行核实.
对经济分析必须加以协调和调整,从而达到准
确反映客观事实的目的。
二、基础数据的核实和经济分析
的调整与协调
(一)核实和调整与协调的原则
1.根据国家有关农村经济体制改革的方
针、政策进行核宴、调整和协调。如在确定美元
对人民币的汇率时既要考虑当时的情况,叉要
研究在项目实施和还贷期间汇率的变化,分析
外汇风险的大小。在编制经济分析中的典型农
户模型时考虑国家制定的承包责任制、贫困地
区经济补贴等政策对典型农户产生的影响
2.根据世界银行考察团的意见和建议进行
核实、调整和协调。世界银行贷款项目的立项准
备,特别是其中的经济分析方法和结果归根到
底必须满足世界银行的要求、得到世界银行的
认可方可获得成功。因此.对世界银行提出的意
见和建议必须采取认真和积极的态度如其提
出的省际间同类物资价格、同类作物的投入产
出量等差别不应过大、项目的基础数据应当落
实和调整到1993年水平等意见均得到了采纳,
对此,世行考察团、预评估团和评估团多次表示
满意。
3.根据项目区的实际情况进行核实调整
和协调。核实、调整和协调不是单纯的统一,而
是根据各个子项目区的实际的自然和社会经济
状况区剧对待如从农业发展水平的角度看,山
西的昕水河f属临汾地区)最高。由此向西、向北
依次降低。相应地,农村各业经营状况和经济效
益也产生规律性的变化。在调整过程中,既考虑
了这一规律性的作用,又结合各个子项目区中
的各个不同农村产业(包括各类农作物、韩果的
生产、畜牧草场的经营等)的实际情况进行了既
统一、叉切合实际的调整
·4d·
4.考虑项目准备的历史状况本项目在准
备过程中形成了一定的结构。这包括数据的种
类、数据的要求、初步分析的结果等在项目的
多次核实、调整和协调中必须考虑这些历史因
素,否则将降低世行对项目和项目准备人员的
信任度。因此每一次核实、调整和协调都是在保
证项目中某些基础数量、基本比例不变的情况
下进行。由于这一限制,给调整工作带来了很大
的困难。如,各类价格和汇率发生变化后,人民
币的物价波动指数相应提高.同时国内匹配资
金数额不再增加。在这一情况下.“既要保证项
目基本达到原定的治理面积.叉要将世行贷款
全部支付回来”,就形成了经济分析和计算中的
一大难题。为了解决这一问题,每次都由中央项
目办公室和四省(区)七地(盟)项目办的数十
人耗费上万元的资金、历时2O~40天来解决完
成
5.从技术角度看.在各类分析中必须保证
数据、表格、计算机文件等在形式上的统一性和
同一性。以便于汇总和分析。
6.在考虑以上原则的基础上。最终必须准
确、切合实际,满足台理性原则.达到世界银行
的标准要求
(二)核实、调整与协调的步骤和方法
首先根据各地专业技术人员的经验,结合
当地具体情况提出各类数据的调整意见。如在
确定各子项目区中不同
地类上各种作物的投入
与产出量时。就征求了当地农业科技专家的意
见;在确定各种林地的林术产量时,采用了林业
专家提供的数据。其次.参考有关技术手册中的
相应规定、指标、数据。如在确定化肥和农家肥
的施用量时,参考了农业技术手册中的各类肥
料有效元素含量的理论数据;对于不同树种苗
木产量。参考了林业技术手册中的指标。第三,
在征求了专家意见、参考了技术手册后,各地同
类作物相关数据相差仍然较大,不能满足世行
要求的情况下.进一步采用专业技术人员集体
讨论的方法,根据“大合理.小调整”的原则.再
作统一性调整.直至达到世行认可为止最后,
对于一些派生数据采用试算的方法解决。三、基础数据核实和经济分析
调整与协调的结果
根据世行考察团的意见和建议以及立项进
展的需要,经过多次核实、调整与协调.使各类
数据更加准确与合理,各种水土保持治理措施
的投入更加切合实际,各种地类、各种作物的分
析过程与结果充分满足了世界银行的要求。因
此,1992年世界银行考察团就明确表示,黄土
高原水土保持项目可以不经过预评估,而直接
进行评估。1993年8月项目预评估后,世界银
行项目预评估团认为此项目的前期工作已达
到要求,建议中国方面做好准备.在1993年年
底前进行项目的评估。1993年10月世界银行
评估团按时来项目区,进行了不到20天的工作
后,顺利通过了项目评估.同时提出本项目可以
提前到l993年11月15日开始投入实施。
本项目从1991年6月世界银行第一次考
察到1993年11月项目通过评估投入实施仅用
了两年多的时间。对于总经费超过20亿元、涉
及4个省(区)、包括农、林、牧、水多种行业、达
到扶贫和环境治理双重目的的这一巨大项目
(水利部前部长杨振怀曾说这一项目是黄土高
原的三峡工程),用了如此短的前期准备时间.
这不仅在我国是罕见的,而且在世界银行也是
少有的。世界银行的官员和专家曾多次表示,本
项目是世行所有项目中准备工作做得最好的。
黄土高原水土保持项目之所以能够在短短
的时间内达到世行的要求,通过世行的评怙,这
与及时组织项目各省(区)按照一定规范进行数
据的核实和经济分析的协调与调整是密不可
分、紧密相关的,同时也证明了项目的核实、协
调和调整工作是成功的
四、小结
黄河中游黄土高原近15年来进行了两次
大规模的规划。一次是1983年开始的由国家计
委下达的涉及黄河中游7省(区)的水土保持综
合治理规划,另一次就是本次涉及4省(区)、占
黄河中游60重点水土流失地区(盟)的世界
银行贷款项目规划。本次规划不仅在宏观上进
行了协调,同时在微观上也采用世界银行标准
和计算机技术做了大量的而且是成功的协调和
统一工作。本项目的数据核实和经济分析的调
整与协调工作,不仅使项目在较短时间内完成
了实施前的准备 节约了人力和物力,向世界银
行展示了中国水土保持技术实力(世行评估团
在项目评估总结会上指出.本项目的经济分析
工作量大、面广,采用计算机技术进行这榉大量
和复杂的经济分析工作本身就可以列为一个项
目),而且使黄土高原的水土保持技术水平上了
一个新的台阶,培养了一大批既熟悉国际标准
和计算机技术又掌握了英语的专业技术人员/,!/
总结和回顾本项目的前期准备工作,可以
得出以下有益的经验。
1.对于跨省(医)的大型项目,必须有一个
较高层次、高效率、高水平的组织协调机构。
2.对于跨省(区)的大型项目,必须综台各
个有关专业的技术力量,重视各个层次和各种
类型的协调工作。
3.对基础数据的准备和项目的成本计算、
效益分析应给予高度重视,特别是利用外资项
目尤其如此.否则将延长项目准备时间,增加不
必要的人力和物力投入。
4.我国各级水土保持部门当前应加强技术
力量,推广应用新技术、新设备,增加技术储备,
与国际标准接轨,最终达到提高水土保持技术
水平,增强水土保持部门活力,完成水土保持治
理任务的目的
《治淮》征订启事
《治淮》是水利部淮河水利委员会主办的国内外公
开发行的练占性水利月刊主要栏目有要文√五重点
工程、活理与开发、防汛抗早水政水资源、农村水利、水
土保持、工程管理、水利科技及水文化、浪花集、知识窗
等。内窖丰富.图文并茂。《治难海月15日出版.每期
篇2
随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、互联网应用的丰富,更多的传感设备、移动终端接入到网络,由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。“大数据”时代已经来临,它对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。大数据是指海量数据集,其来源包括动漫数据、企业IT应用带来的数据、博客、点击流数据、社交媒体、机器和传感数据等。它是互联网、电子商务的又一次重大革命,对数据处理、数据挖掘、数据分析提出了新的挑战。如今互联网行业、电子商务行业中的数据应用及分析已经相当普遍,为了应对大数据时代的要求,同时要具备较强的统计学功底和娴熟的计算机软件运用能力,而今完全具备这些能力的数据分析专业人才是极其匮乏的。数据分析师便应运而生,不仅互联网行业、电子商务行业需要大量的数据分析师,近年来项目数据分析事务所不断涌现,而项目数据分析师因其专业技能及量化的数据分析为客户以及所在单位控制决策风险、保证利益最大化而备受各界青睐,以待遇优厚和地位尊崇而闻名国际,也被视为我国21世纪的黄金职业。《华商报》将项目数据分析师纳入了新七十二行,《HR管理世界》将项目数据分析师评为七大赚钱职业。本文就如何在统计学专业开展数据分析方向进行了阐述,首先论述了数据分析的重要意义,其次讨论了数据分析方向的课程构建,最后分析了如何加强理论与实践环节的结合。
一、数据分析的重要意义
大数据预测美国总统:美国时代周刊报道称,数据驱动的竞选决策才是奥巴马竞选获胜的关键。数据分析团队在筹集竞选经费、锁定目标选民、督促选民投票等各个环节的决策中都发挥了重要作用。这意味着华盛顿竞选专家的作用极具下降,能够分析大数据的量化分析家和程序员的地位却大幅提升。如今从事专业数据分析工作的企业如项目数据分析师事务所、数据挖掘公司等都应市场需求而大力发展,并且受到风险投资的青睐。如美国社交数据挖掘公司Datasift于2012年宣布,获得1500万美元风险投资。2013年,DataSift成为Twitter的“认证合作伙伴”,主要负责海量微博社交数据分析。这是该公司今年第二笔融资,五月份其曾融资720万美元。又如面向开发者的大数据应用软件平台服务提供商Continuity最近获得1000万美元的融资,目前融资总额已经达到1250万美元。
数据分析的应用无处不在,那什么是数据分析呢?数据分析就是用适当的统计方法对数据进行分析,以求最大化地开发数据的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析技术不仅能通过对真实数据的分析去发现问题,还能够通过经济学原理建立数学模型,对投资或其他决策是否可行进行分析,预测未来的收益及风险情况,为做出科学合理的决策提供依据。在提高工作效率的基础上,也增强企业管理的科学性。无论是在国家政府部门,还是企事业单位中,数据分析工作都是进行决策和做出工作决定之前至关重要的一个环节。因此,针对项目可行性、风险承载力、投资回报率以及相关经济效益指标等方面的分析工作显得格外重要。在这个工作过程中,专业的数据分析人员扮演着无比重要的角色,数据分析成果的质量高低直接决定着项目投资、企业经营决策计划最终的方向。所以,各个行业对数据分析人员的需求之多是不言而喻的。传统行业,如政府机构:一类是计委、经委、统计局等一些经济综合管理部门所设有的调研处、研究室和情报所。第二类是商业、粮食、物资、银行等经济主管业务部门会设有信息中心或调研室,从本系统、本部门的业务出发进行专业性调研,提供支持本部门的市场信息。而伴随着数据分析应用的扩大,其在新兴行业中也得到了发展,如计算机软硬件及IT行业、电子商务与网络游戏、金融保险、消费品、咨询业与广告媒体、大型设备与重工业以及房地产行业等对数据分析师的需求量很大,尤其是电子商务,由于利用互联网,能够比传统零售业具有更好的数据收集和管理能力,能积累海量的数据,因此更看重从海量数据中挖掘出用户偏好和市场机会。研究机构:比如市场研究公司、咨询公司、证券公司、研究院。自主创业:取得注册项目数据分析师(CPDA)资格证可以自主创建或就业于项目数据分析师事务所等。所以,数据分析的行业应用是极其广泛的,并且随着大数据时代的到来,数据分析尤其是数据挖掘将借助互联网的发展,逐步形成人们依靠的重点,并可能成为未来发展与竞争的重点之一。由此我们可以看到数据分析师的就业前景是非常广泛而乐观的,无论是数学专业、统计专业,还是计算机专业的学生,都可以通过系统的学习数据分析课程来适应对数据分析人才的要求。
二、课程体系构建
1.主干课程。主干课程包含高代、数分、概率论、数理统计、多元统计分析、时间序列分析、市场调查与分析、统计预测与决策、数据结构、C语言、数据分析、数据挖掘、大数据分析与展示。理论课程的学习可以使学生了解数据分析的基本内容,学会如何对已获取的数据进行加工处理,如何对实际问题进行定量分析,以及如何解释分析的结果。掌握几种常用数据分析方法的统计思想及基本步骤,并具备一定的分析论证能力。
2.实验课程。数据分析的操作离不开计算机。目前数据分析行业常用的一些统计软件有SAS、SPSS和R软件。SAS软件是一个模块化、集成化的大型应用统计系统。它的功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。SPSS软件是一个社会科学统计软件包,是采用图形菜单驱动界面的统计软件,SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。R软件是一套完整的数据处理、计算和制图软件系统,包括:数据存储和处理系统、完整连贯的统计分析工具、优秀的统计制图功能、可操纵数据的输入和输入等功能。这三个软件在数据分析中针对不同行业的需求有不同方向的应用。
3.专业课程。从数据分析的行业需求出发,好的数据分析人员不仅要有较强的数据分析能力,还要有该行业的背景及相关知识的储备,这样才能将数据分析与行业特性联系起来,发挥数据分析的最大功能,即所谓的“因地制宜”。同时要兼顾学生的兴趣与学习的联系,需提供多领域的课程选择,如:经济学、金融学、保险学、管理学、会计学等。而在软件学习方面也要拓宽渠道,除了实验课程安排学习的软件,学生可根据自身发展意向再多掌握一些软件如:SQL数据库,熟悉office常用功能,尤其熟练运用Word和PowerPoint、Excel图表及数据分析等。同时还应该结合对数据分析师的要求设置一些相关课程:投资数据分析、市场调研与预测、预测技术分析、现金流量表编制、风险投资项目筛选、不确定性分析、编制数据分析报告等。
三、实践环节
培养数据分析的专业型人才目的就是为了学以致用。数据分析本身就是为了从数据中发现问题、建立模型、预测收益风险企业决策进而做出合理正确的决策判断。因此,学习了基本的知识和技能就要运用到实际操作中。学校可以和本地的数据分析事务所,或者大量需求数据分析人员的互联网行业建立实训基地,进行合作式教学,使得学生在实习的过程中能够理论联系实际,切身体会数据分析的商业操作体系,这样就能够促进学生有目的、有取舍地针对自身情况学习钻研,继而就能够培养出适应经济发展,满足市场需求的应用型人才。
四、结语
在大数据时代到来之时,数据分析在互联网中的应用将会空前广泛,与此同时对数据分析师的需求也将会井喷,无论是在军事、工业、企业还是在政治上,大数据分析都将会十分紧缺。因此,目前对数据分析师的培养刻不容缓。本文从分析数据分析行业发展及其重要意义、数据分析专业课程设置以及教学实践环节方面对构建数据分析课程体系进行了探讨。不仅从教学课程的内容上予以安排,而且更加注重引导学生自主学习,特别强调理论结合实践的合作式教学。希望能够结合行业需求合理地构建课程,培养出专门从事数据分析的项目数据分析师,从而能够满足市场需求和自身发展。
参考文献:
[1]范金城.数据分析[M].科学出版社,2010.
篇3
一、引言
随着计算机软硬件技术的快速发展,计算技术已从传统的PC平台计算模式发展到嵌入式计算、移动计算、并行计算和服务计算等多种计算系统并存及融合的计算模式,处理的对象也呈现出网络化、多媒体化、大数据化和智能化需求的特征,而物联网、移动互联网的快速发展促进了这一趋势,从而迎来了大数据时代的到来。大数据是继云计算、物联网之后兴起的又一新兴发展方向,被学术界、工业界乃至政府机构密切关注和广泛研究。
大数据又称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极的目的的资讯。在维克托・迈尔・舍恩伯格及肯尼斯・库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法。一般说来,大数据具有4V的特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
二、大数据时代对人才的要求
从广义上讲,大数据人才就是具备大数据处理能力的科学家和工程师。目前,国际上开设了大量的数据科学方面的课程、数据科学学位计划以及数据科学短期培训班。从国际上设置的培养计划来看,大数据人才应该系统地掌握数据分析相关的技能,主要包括数学、统计学、数据分析、商业分析和自然语言处理等,具有较宽的知识面,具有独立获取知识的能力,具有较强的实践能力、创新意识和团队合作意识。具体来说,大数据人才首先应具备获取大数据的能力,例如能根据任务的具体要求,综合利用各种计算机手段和知识,收集整理海量数据并加以存储,为支撑相关的决策和行为做好数据准备。其次,应具备分析大数据的能力,对于经过预处理的各类数据,能够根据具体的需求,进行选择、转换、加载,采用有效方法和模型对数据进行分析,并形成分析报告,为实际问题提供决策依据。最后,应具备良好的团队合作精神,大数据时代下的数据分析任务通常无法依赖个人能力来完成,需要在团队制度的约束下,与他人一同携手、互相鼓励、分工合作来实现既定目标,因此具备较强的责任心与团队合作精神也是大数据从业人员必备的基本条件。
三、大数据人才培养的探索
大数据产业的发展,对大数据人才提出了新的需求,国内各高校在积极进行大数据学术研究的同时,也开始考虑将大数据相关课程纳入培养体系,以满足社会对大数据人才的需求。以下结合作者在数据库及分布式技术系列课程中的教学经验,以及大数据分析与处理方面的实践经验,探讨大数据系列课程教学内容和实践形式的设置。
在教学内容的设置上,大数据系列课程建议可分为理论教学和技术教学两个方面,因为理论是大数据认知的必经途径,也是被广泛认同和传播的基线;而技术是大数据价值体现的手段和前进的基石。在理论方面,讲授的理论内容可涵盖如下几点:
(1)大数据概念:大数据概念出现的历史,关于大数据定义的各种流派以及说明,大数据的四个特征,大数据与云计算、物联网的关系,大数据与大规模数据、海量数据的差别。这个部分主要突出“大数据”概念中应包含的“对数据对象的处理行为”。
(2)典型的大数据应用实例:精选有新意的大数据分析典型案例,可帮助学生更清晰的理解大数据的概念和含义,这样的案例如:美国梅西百货的实时定价机制(根据需求和库存的情况对多达7300万种货品进行实时调价)、百度搜索的实时热点排行榜(以数亿网民的搜索行为作为数据基础,建立权威的关键词排行榜与分类热点)、沃尔玛的搜索引擎Polaris(利用语义数据进行文本分析、机器学习和同义词挖掘使得在线购物的完成率提升了10%~15%)、谷歌流感趋势工具(通过跟踪搜索词相关数据来判断全美地区的流感情况)等。在教学过程中,教师应注意将授课的重点放在系统化的开发步骤和关键性问题的求解上,介绍案例的设计思想、主要方法和应用过程等。
(3)大数据关键技术与挑战:介绍大数据时代面临的新挑战,包括大数据集成(数据异构性和数据质量问题)、大数据分析(数据形式多样化、数据处理的实时性、索引结构的复杂性等)、大数据隐私问题(隐私保护和数据分析的矛盾)、大数据能耗问题(低功耗硬件的设计)、大数据处理与硬件的协同、大数据管理易用性问题以及性能测试基准。
(4)大数据存储和管理技术:介绍如何把采集到的大数据存储起来,建立相应的数据库,并进行管理和调用。主要内容包括:分布式文件系统(HDFS)、去冗余及高效低成本的大数据存储技术、新型数据库技术(键值数据库、列存数据库、图存数据库以及文档数据库等)、异构数据融合技术、分布式非关系型大数据管理与处理技术、大数据索引技术和大数据移动、备份、复制等技术。
(5)大数据分析及挖掘技术:介绍从大量数据中寻找其规律的技术,通常由数据准备、规律寻找和规律表示3个阶段组成。数据准备是从上述大数据中心存储的数据中选取所需数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含规律找出来;规律表示则是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等。
在技术方面,可考虑分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程,具体可包括以下几点:
(1)NoSQL技术:NoSQL产生的背景、NoSQL现状、NoSQL数据库与关系数据库的比较、聚合数据模型、分布式模型、数据一致性、典型的NoSQL数据库分类、NoSQL数据库开源软件。
(2)MapReduce:MapReduce模型概述、编程模型:Map和Reduce函数、MapReduce工作流程、并行计算的实现、实例、Yarn等
(3)Hadoop分布式文件系统:Hadoop出现的背景、Hadoop的功能与作用、为什么不用关系型数据库管理系统、Hadoop的优点、Hadoop的应用现状和发展趋势、Hadoop项目及其结构、Hadoop的体系结构、Hadoop与分布式开发、Hadoop应用案例、Hadoop平台上的海量数据排序。
(4)还可进一步包括数据流的管理与挖掘、云数据库、图数据库等。
由于大数据系列课程所涉及的技术具有很强的应用背景和实践意义,因此应摒弃传统教学模式中“重理论、轻实践”的思想,在掌握大数据相关的理论知识和技术知识之后,还需重点培养学生的综合实践能力,以满足社会就业的需要。为此,应设立一定的大数据技术实践课程内容,帮助学生从知识型向能力型转变。结合上一节分析的大数据时代对人才的具体要求,建议按以下流程设置实践环节的内容:
(1)分组。如前所述,大数据时代下的数据分析任务通常需要以团队的形式来完成,因此首先要求学生根据自身情况,结合各自的技术优势,合理进行分组。
(2)选题。在具体选题上,可使用校企合作的具体项目或以Apache Hadoop、MongoDB、Dremel、Gephi等一系列的开源大数据分析软件作为实践平台,以Kaggle为数据科学平台来进行选题。
(3)明确需求并撰写大数据分析任务书。明确选定的题目范围内,数据分析要研究的主要问题和预期的分析目标。只有明确了数据分析的目标,才能正确地制定数据收集方案,即收集哪些数据,采用怎样的方式收集等,进而为数据分析做好准备。
(4)数据收集及预处理。由于大数据分析最终的结果与其获取的数据质量紧密相关,因此收集的数据是否真正符合数据分析的目标是必须注意的重要问题。该步骤要求学生从分析目标出发,从浩瀚的数据中正确的收集高质量且服务于既定分析目标的数据,然后对数据进行必要的加工整理,包括填写空缺值、平滑噪声数据、识别和删除孤立点、解决不一致性、规范化(消除冗余属性)和聚集(数据汇总)等。
(5)探索性数据分析。由于大数据分析的数据量通常达到PB甚至YB级以上,因此希望直接选定一个分析模型是不现实的,而且面对高维海量数据,也很难直接看出数据的规律。在这个步骤中,应指导学生通过基本描述统计量的计算、基本统计图形的绘制、用各种形式的方程拟合等手段,计算某些特征量等方法探索规律性的可能形式,帮助学生快速掌握数据的分布特征,这是进一步深入分析和建模的基础。
(6)模型选定分析。在探索性分析的基础上提出一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。有时选择几种统计分析方法对数据进行探索性的反复分析也是极为重要的。每一种统计分析方法都有自己的特点和局限,因此,一般需要选择几种方法反复印证分析,仅依据一种分析方法的结果就断然下结论是不科学的。
(7)模型的验证及分析报告。指导学生对选择的数据分析模型及结果进行分析,可使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。观察模型提供决策的信息是否充分、可信,所发挥的作用是否与期望值一致,数据分析方法是否合理,是否将风险控制在可接受的范围。
以上这种项目式实践形式的优势是:在学生参与完成某一具体的大数据分析任务过程中,通过主动地学习来自主地进行知识的建构,让学生经历项目开发的整个过程,从中去发现和掌握相关知识,达到既能熟悉大数据分析过程,又完成了经验的积累,还能实现学习知识、培养能力的目的。在这里,教师不再是知识的传授者,而是项目活动的组织者和咨询者。
四、校企合作推动人才培养
一方面,大数据的核心业务必然是一种扎根于特定行业,综合运用已有的存储、分析、挖掘、展现技术,根据用户需求并融入行业特色技术模型的一站式大数据平台业务。另一方面,对于企业来说,各类业务产生的数据为数据分析创造了非常好的基础条件。大数据解决方案是有价值的,但是苦于找不到既懂数据分析技术,又懂得业务的专业人才。由此可见,既懂得相关技术,又谙熟企业业务的复合型人才才是企业部署大数据应用最迫切需要的人才。因此,企业可以与学校联合培养自己所需要的大数据人才,这种方式有两方面的优势:一是大数据技能训练的对象,即大量的数据,只有企业才具备;二是在企业的支持下,学校也能通过针对性的实践训练来培养学生的大数据处理技能。
大数据时代下的校企合作的形式多种多样,可通过联合办学、联合制定人才培养方案、合作开发课程和教学内容、设置实训项目、教学管理和共建“双师”结构教学团队等形式展开。
篇4
促进科技成果的顺利转移,需要协同创新。这是因为具有实用性、与市场联系紧密的科研项目能够更快实现科技成果产业化;符合市场需求的丰硕的科研成果转化,需要高校及科研机构与企业合作,以及金融、中介机构等社会方方面面的配合;高校及科研机构与企业合作,将为之后的科技研究提供更充裕的资金,更新实验设备,以及其他各方面的支持。但是当前不仅为高校及科研机构与企业合作服务的中介机构、金融机构未能到位,甚至高校及科研机构与企业之间的联系都是脆弱的。充分协调双方需求,调动政府、中介机构、金融机构的积极性,是协同创新的目的,也是意义所在。协同创新对于我国自主创新能力的提高发挥着极其重要的作用。任何一项政策、措施、项目,从提出、立项到实施、产生作用,都需要时间,协同创新中各个项目,从立项到项目产生作用也需要时间,因而研究协同创新必须引入经济学的时滞概念,应当充分考虑时滞这一因素的影响。时滞通常包括内部时滞和外部时滞,内部时滞指项目立项直到项目实施之间经历的时间,外部时滞是指已经实施直至在经济中作用显露所用的时间。2005年,国家统计局《中国企业自主创新能力分析报告》提出了四大创新能力衡量指标:潜在技术创新资源指标、技术创新活动评价指标、技术创新产出能力指标、技术创新环境指标。①这些指标的确定为我国创新能力的衡量提供了可比的量化标准,为考察影响创新能力因素的实证研究奠定了一定的数据基础,有利于实证研究产学研协同创新对创新能力的提升作用,分析其关联性。
三、研究设计
(一)数据来源与样本选取协同创新对企业创新能力的作用体现在多个不同方面,根据《中国企业自主创新能力分析报告》提出的四大创新能力衡量指标,结合统计局财政支出以及《全国科技进步监测报告》相关统计信息,选取万人专业技术人员数、万人R&D科学家和工程师人数、企业R&D经费支出、申请专利数、发明专利申请量、国家财政科技拨款等要素进行相关性分析,对变量进行进一步筛选。根据相关性检验结果,万人专业技术人员数与万人R&D科学家和工程师数Pearson相关性为0.988,相关性较高,且同属于潜在技术创新资源指标项目,根据两项内容分别与其他项目的相关性关系以及现实需要,决定保留万人专业技术人员数。类似方式对其他项目指标进行筛选后,得到专利申请、专利授权、R&D经费支出、万人专业技术人员数、国家科技投入等五项指标,本文以此五项作为创新能力衡量指标,研究协同创新对创新能力提升的作用。本文将以协同创新合作项目为研究分析内容。协同创新合作项目资料来源于国家统计局《产学研科技统计报告》所披露的有关“九五”、“十五”、“十一五(前三年)”期间研五类中产学研合作项目数。基于研究要素的可取得性和适用性,创新能力五项指标以2003年至2008年相关数据为研究样本,考虑时滞的影响,对解释变量协同创新合作项目数据取2000年至2008年相关数据为样本。全部数据处理借助Excel和SPSS软件予以处理。
(二)研究假设假设1:申请专利数与协同创新合作项目数存在线性正相关关系。假设2:R&D经费支出与协同创新合作项目数存在线性正相关关系。假设3:万人专业技术人员数与协同创新合作项目数存在线性正相关关系。假设4:国家科技投入与协同创新合作项目数存在线性正相关关系。假设5:发明专利授权量与协同创新合作项目数存在线性相关关系。前4个假设研究四大创新能力标准受到协同创新合作项目的影响,假设5验证发明专利授权与专利申请对于创新合作项目的反应时滞差别,专利从申请到授权之前存在一定时间差,协同创新合作项目对于专利授权影响应当比专利申请的影响作用产生得更缓慢。
(三)模型构建本文采用一元线性回归模型研究协同创新对创新能力提升的作用。
四、时间序列模型预测
基于研究数据的时间序列特性,以及线性回归分析能够顺利进行,首先对时间序列模型预测。由图2、3得到,自变量与5个因变量随时间呈递增趋势,而且合作项目数随时间变化的递增趋势较陡,增速快,而因变量也在曲线中呈现出一定的加速增长趋势。变量递增趋势为线性回归模型的建立提供了良好环境,其中呈现增速不同要求后续分析充分考虑时滞因素。
五、时滞性分析
本文运用SPSS软件对协同创新和创新能力四项代表指标进行回归分析,得到表2所示分析结果。从调整R方可知,以上模型拟合度极高。查表得置信区间95%之下,t0.025(4)=7.709,F0.05(1,4)=2.7764,对比结果,得到t>t0.025(4),且F>F0.05(1,4),表示各因变量与自变量相关关系显著。通过对不同时滞期结果观察比较,得到R&D经费支出(y2)、万人专业技术人员数(y3)、国家科技投入(y4)三项与时滞3年的协同创新合作项目拟合度最优、显著性最高;专利申请(y1)与时滞2年的协同创新合作项目拟合度最优。采用非标准化回归系数的结果分析,如表3所示。以拟合度最高的分析结果为例,该结果说明:协同创新项目每增加1个,两年后专利申请增加70个,三年后R&D经费支出增加4920万元、国家科技投入增加2730万元;协同项目每增加500个,三年后每万人中专业技术人员数增加1人。该结果的现实意义在于,专利申请(y1)比其他三项内容操作流程更简洁,而其他项目则历经多个不同层级、部门的周转与协调。为检验这一推测合理性,对专利授权(y5)和协同创新合作项目进行对比分析研究。由表4可知,y5的t检验值中只有时滞3年的协同创新合作项目通过检验,这一结果比专利申请时滞多一年,可以推测专利从申请到得到授权至少需要一年左右时间,这与现实相符。该结果从实证角度进一步验证了“时滞”的存在,反映出以上5个假设关于时滞推断的合理性。
篇5
1、水的数据采集和分析
6月初,第一期用水数据采集后,我们送扬州市节水办专家分析后,发现误差较大,管理区及时作了分析和调整,按照节水办专家的意见,重新进行用水的样本采集。6月下旬,又组织进行了为期10天的样本数据采集,依照统一每天抄表时间、统一每天抄表顺序,详细采集总水表和17只二级分水表的第一手数据,管理区平均每天用水137.81吨(最高用水151吨,最低用水115吨),平均每天总表与各分表的误差为109.5度(最高误差143度,最低误差90度),经数据对比分析,总表和分表的误差为10.42%,结合其他因素分析,误差值在正常范围,通过数据分析,使各经营区域能进行更好的用水控制。
1、电的数据采集和分析
按照京沪公司电平衡填表的要求,管理区明确专人进行数据统计,主任室要求参与数据填写部门和人员必须认真学习并且消化理解公司和管理处的每一个关于“节能降耗”的文件精神,综合部按照公司下发的表格,协调水电班进行认真填写,水电工为了确保《电平衡表》数据的填写准确,连续一周工作在各个电表之间,一小时填写一次,无一次间断,向公司节能降耗领导小组和科协专家提供了第一手的管理区电平衡数据。为了确保数据的翔实可靠,管理区主任在节假日和夜间也经常打电话询问数据采集填写情况,对于填写有疑问的表格和数据,及时做好沟通和协调工作,关键技术数据,主任召集相关部门进行会商。
此外,根据用水样本的采集经验,7月上旬,管理区又组织进行了为期10天的用电样本数据采集,依照统一每天抄表时间、统一每天抄表顺序,详细采集总电表和36只二级分电表的第一手数据,管理区平均每天用电2548.5度(最高用电2943度,最低用电2331度),平均每天总表与各分表的误差为109.5度(最高误差143度,最低误差90度),经数据对比分析,总表和分表的误差为4.29%,结合其他因素分析,误差值在正常范围,通过数据分析,使各经营区域能进行更好的用电控制。
3、油的数据采集和分析
油的数据采集分两个部分,一是车辆用油,二是配电房用油。
(1)车辆用油的采集重点是抓好车辆规范用油的管理,确保油耗采集的科学性和合理性。一是控制公务车的用车次数,同方向合并用车、不同部门合并用车、上下午协调合并用车,并实行用车预申报;二是加油控制,车辆一律在管理区加油;加油由驾驶班长、综合部门经理或节假日值班主任现场监油,要求一次性满箱加油;在外偶有加油,先请示后加油,要求限量加油,以够行使到管理区为原则,到管理区后油箱加满。
3-7月份,车辆用油主要受运行公里数影响,百公里油耗具体为金龙20.72、五十铃15.01、皮卡11.98、海马11.99,其中五十铃属于上路抢险用车,油耗受在高速路上的停留时间和夜间、高温出车时间影响。
(2)电房用油重点抓好发电时间和发电机功率的测算。3-7月份配电房共计用油500升,共发电时间26小时,平均每小时19.23升。理论估算该功率的发电机每小时耗油量20-25升,经对比分析,误差值在正常范围。
以“合理组织、科学分析”为基础,系统形成调查分析报告,努力为上级部门提供决策依据
按照7月10日公司传真电报关于节能降耗调查的通知要求,我管理区认真对照调查内容的三点指导意见,进行了调查分析,系统形成了管理区试点单位的节能降耗调查分析报告。
调查分析报告系统总结和梳理了管理区开展节能降耗活动以来的工作,通过对水、电、油的分析,反映出我管理区自从开展“节能降耗”试点工作以来,水、电、油的节能使用控制初见成效,总的数据指标在可控制范围以内,通过深入细致的第一手样本数据采集和分析,不仅切实摸清了各区域水电和车辆、配电房的使用情况,而且为管理区下一步生产经营的控制管理,积累了第一手资料。
作为节能降耗试点单位,我们对于定额体系的测算有如下建议:
1、关于水的定额制定。需要考虑冬夏用水量的变化,需要考虑冬夏蔬菜的不同,对于洗汰用水量的不同,在此基础上,方可把营收与用水量挂钩,进行吨/百元定额测算较为理想。
2、关于电的定额制定。受线路、用电器的影响较多,各用电区域、甚至各单位可能数据上差距较大,进行度/千元定额测算较为理想。
3、关于油的定额制定。需要综合考虑车辆完好率和利用率,主要是完好率和利用率的测算需请专家协助。配电房用油节能的空间不大,重点是加强用油和发电时间的管理。
4、为今后发展预留空间。要为管理区今后经营项目的增加,经营班次的调整等可预见的变化预留定额调整的空间。
作为公司节能降耗试点单位的几点体会:
1、领导重视,机制健全,节能工作初见成效。节能降耗活动开展以来,公司、管理处节能降耗领导小组领导数次到我们基层管理区听取汇报、指导推进、并和专家一道提出好的建议和
意见,上下互动,机制健全,使管理区试点工作取的了明显效果,积极引导企业走上担当社会责任的发展道路。
2、加大节能降耗的宣传力度,不断增强全员节能意识。我们采取多种措施,加强对节能降耗重要性的宣传,大力开展节能知识的宣传,积极引导员工转变观念,牢固树立和落实科学发展观,为节能降耗的顺利开展营造了浓厚的氛围。
3、要重视技术创新,加大节能改造项目的资金投入力度。正是有公司和管理处的支持,我们得以顺利进行设备改造和较快的数据采集、数据分析,真正实现了管理区自己了解自己,自己解剖自己,能够微观上分析自己,为三级单位管理区跟进公司战略发展打下了坚实的基础。
作为公司节能降耗试点单位的几点不足和认识:
一是对节能降耗工作的长期性认识要再提高,定额体系的建立和确定需要2-3年来调整和生产经营实践的验证,这期间需要扎实的工作,发扬不急不躁、务实科学的工作作风,进行深入细致的测算和反复的验证。
二是需要尽快建立与节能降耗配套的激励机制,通过激励机制的作用的发挥,推动节能降耗深入持久的开展,充分调动职工节能的主动性和创造性,鼓励节能降耗革新,从一滴水、一度电、一升油等小处抓起,确保节能降耗切实取得良好的效果。
三是对降耗工作要进行再深入细化,结合管理区餐饮、汽修、停车场的实际,找准降耗的切入点,配套好工作措施,在降耗工作上还大有文章可做。
我们下一步的工作重点:
一是继续做好设施改造,鼓励技术革新,通过技术改造和管理强化,使已经降下来的项目数据,绝不能反弹。
篇6
【文章编号】0450-9889(2014)01C-0065-02
社会调查研究方法是社会科学等各门学科的基础课程,是社会调查研究的方法论、基本方法和程序、技术相统一的科学方法论体系。它洞悉社会发展脉搏,了解社会需求,决策社会发展,有极强的理论性、应用性、实践性。但多年来,该课程的教学未能很好地将理论、实践、学生综合素质培养融合起来,未能将课堂与社会、行业有机结合。基于此,本文以柳州城市职业学院为例,对该课程的教学进行改革。
一、社会调查研究方法课程的总体设计理念
鉴于社会调查研究方法课程较强的应用性和实践操作性,并结合学生的身份与学习特点,课程总体设计基于以下教育理念。一是基于工作过程、理实一体化。课程教学打破传统的教学方式,不再追求学科本身的系统化,而是追求和体现工作过程的完整性、流程化。真正按照具体的职业行动,要求学生按流程实际去做,在做的过程中掌握社会调查工作的程序和技能,掌握完成任务所需要的理论知识。如在指导制订调查方案时讲授原则意义;涉及社会学和系统论的相关知识时,结合设计方案的实例,适当讲授,以够用为度。二是项目引领,任务驱动式。将企业需要、学院办学需求、学生感兴趣的真实项目引进课程教学,让学生以团队的方式进行项目调查,实现课堂教学与社会实际、行业需求零距离结合,实现理论与实践的高度融合。在行动过程中培养学生的社会实践能力、综合能力、团队协作精神。三是实行课证融通的教学。将统计从业资格考试、调查分析师(初级)考试的内容引入教学内容,并在课余时间进行培训,让学生通过学习课程,就可以直接参加以上两个职业证书的考试,以提升学生的职业竞争力。
二、社会调查研究方法课程教学的改革
(一)社会调查研究方法课程教学内容的改革
基于专业培养目标和课程教学目标,以及《统计从业资格证》、《初级调查分析师》的考证要求,在社会调查研究方法课程教学内容的改革方面,对原有教材的结构框架进行解构和重构,以一个社会调查项目的实施过程来设计课程教学内容,按社会调查项目实施的流程分为选题阶段―准备阶段―调查阶段―数据分析阶段―总结5个阶段,划分出每个阶段的具体工作任务,选择阶段实施过程中所必须用到的理论知识进行教学。每个阶段均注重理论知识的习得与应用、调查技能的掌握和实施、职业能力的培养。详见表1。
表1 社会调查研究方法课程教学内容改革
工作过程 典型工作任务 理论学习内容 实践项目
理论基础 1.社会调查的定义及其任务
2.社会调查的基本功能、基本概念、基本方式、主要类型等
3.社会调查研究的方法和原则
4.社会调查的一般程序
选题阶段 1.初步选题
2.选题的初步调查论证 1.选择调查课题(选题的意义、调查课题的类型,选题的标准,选题的途径和方法)
2.调查课题的初步探索的方法和途径 团队调查项目选题
准备阶段 1.提出研究假设
2.设计调查方案 1.提出研究假设
2.调查方案的主要内容和设计原则
3.调查指标的设计
4.信度和效度
5.调查方案的可行性 团队制订调查方案
1.为课题选择恰当的社会调查的方式
2.制订抽样调查方案 1.社会调查的方式
2.普查
3.典型调查
4.抽查 团队制订抽样调查方案
调查阶段 利用恰当的调查方法进行实地调查 1.问卷调查法(问卷的类型与结构、设计的原则)
2.访谈法(访谈的特点和类型、实施的步骤、技巧)
3.观察法(观察的特点和类型、误差的控制)
4.实验法(实验的特点和程序、实验的设计)
5.文献法(文献的收集和分析)
6.专题调查(电话调查、市场调查、民意调查、网络调查方法)
7.调查员的调查方法和技巧 团队调查项目实地调查
调查员培训
数据分析阶段 1.资料的统计整理与分析
2.对统计调查进行理论分析 1.资料整理的原则和方法
2.文字资料的整理
3.数字资料的整理
4.问卷资料的整理
5.统计分析的方法(单变量描述统计、集中量数分析、离散量数分析)
6.理论分析 团队调查项目数据分析
总结阶段 1.撰写调查报告
2.团队汇报 1.调查报告的特点与类型
2.调查报告的结构和内容
3.调查报告的构成要素和撰写程序 调查报告撰写(个人完成)
团队ppt汇报
(二)社会调查研究方法课程教学方法的改革
以上社会调查研究方法课程内容的设计,以及该课程较强的应用性和实践操作性特点,决定了在该课程中运用的是基于工作过程、团队合作的项目教学法、任务驱动法,以及案例教学法、探究学习法、情景教学法、讨论法。例如,在访谈大纲的设计与实施教学中,理论部分采取的是学生探究与教师教授相结合的方式。学生探究,就是课前让4个小组的学生查询“什么是访谈、访谈的类型、访谈的准备、访谈的方法和原则”等内容,并在课堂上汇报,再通过提问、回答、教师补充、视频学习等方式,完成理论的学习。通过学习,学生的学习能力、讲演能力有了较大的提高。实践部分则是学生通过讨论,制定了本小组调查项目的访谈提纲,然后在课堂上进行模拟训练并展示。这里我们模拟的是座谈式的群体访谈形式,一个小组推选访谈主持人访谈嘉宾及其他观众,其他小组和教师共同评价,给予指导。课堂外,各小组成员深入到校园、宿舍、其他院校、社区进行访谈,完成调查任务。又如,在调查员的培训中,结合企业调查员的培训教材、培训内容和方式,结合专业特点创设了“社区工作人员为调查住户对小区环境的意见要求,进行入户调查”、“海飞丝洗发水使用街头拦访调查”、“学生食堂满意度的座谈调查”等情境,对学生进行调查过程中的语言技巧、动作技巧、观察技巧、处理拒访的技巧的训练。
(三)社会调查研究方法课程考核方式的改革
社会调查研究方法是一门理论性、实践性都很强的课程,因此,该课程采取过程性考核和终结性考核相结合的考核方式。成绩由过程实践操作成绩和理论考试组成,其中,过程性实践实践成绩占70%,期末综合理论考核成绩占30%。过程性实践操作成绩是根据各个团队提交的工作成果确定的。在项目实施的各个阶段确定工作任务所必须呈现的成果,并制定相应的考核量规,使教学更具有实践性、操作性和目标性。详见表2、表3。
表2 各阶段确定工作任务所必须呈现的成果
工作过程 成果
选题阶段
准备阶段 调查方案、抽样调查方案
调查阶段 调查问卷
数据分析阶段 数据分析报告
总结阶段 调查报告
在“调查方案设计”的成果展现中,制定了以下考核量规。
表3 “调查方案设计”成果展现考核量规
考核项目 考核关键点(技能标准) 配分 得分
调查方案的制订
抽样方案的制订 调查的目的明确 10
课题研究的背景分析语言通顺、叙述合理 20
课题组成员任务分工明确 10
活动步骤清晰、合理 20
调查的方式方法合理恰当 10
抽样方案的设计合理可行、格式规范 10
实训表现 团队合作积极主动 10
在团队合作中履行职责、认真负责 10
合计 100
三、社会调查研究方法课程教学改革效果
社会调查研究方法课程改革已经在柳州城市职业学院2009级、2010级、2011级行政管理专业顺利实施,取得了一定的效果。这三个年级的学生在课堂内外进行了柳州新生代农民工精神文化生活状况调查、柳州市人才招聘岗位需求调查、大一新生专业调查、老年人家庭赡养现状调查、两面针产品社会认同感调查等20多项调查。这些调查充分体现了学生结合专业,以社会调查的方法和视角,洞察社会,关注学院建设,关心大学生自身成长的愿望,取得了一定的成果。在项目实施过程中,学生根据各自的调查项目下企业、到街头、到招聘市场、到其他院校进行实地调查,锻炼了实践应对能力、信息收集能力、数据统计分析能力、文字写作能力、计算机应用能力、沟通交流能力、团队协作能力等,学生的综合素质能力得到了全面的培养和提高。同时,学生获得了对社会的真实认识和感悟。这些都具有积极的现实意义。
综上所述,社会调查研究方法课程的教学改革从社会实践出发,将理论学习和社会现象研究紧密结合起来,让学生在行动中拓展和深化理论知识,融会贯通。同时,注重调查能力和方法的训练,培养了学生的综合素质能力。
【参考文献】
[1]侯娟娟.社会调查研究方法教学模式的改革与实践研究[J].教育教学论坛,2012(S2)
篇7
作为具有国家知识产权局背景的专利信息服务行业领导者之一,知识产权出版社多年来积累了大量的国内外专利文献数据和非专利科技文献数据。2014年~2016年,我们的数据收集范围从专利扩大到商标、标准、科技期刊、知识产权和创新类图书等,专利信息也从单纯的文摘和全文扩展到法律状态、审查文件、流程信息、运营信息、复审和无效决定、知识产权司法判例等,数据量从1亿扩大到近5亿,数据量达500TB。如此巨大的数据量必须得到有效应用才能产生巨大的价值,推进我国技术创新和科技发展。现在有很多专利信息服务商能够提供传统的专利检索和分析服务,但是都仅限于专利,而且数据质量参差不齐,不够全面、准确和权威,服务价格相对较高。如果能以知识产权出版社的大数据为基础,进行整合加工处理,并进行大数据关联,构建一个以专利为核心的科技大数据信息服务平台,向终端用户提供质优、价低、权威的“一站式”信息服务,以及在此基础上的专利大数据管理、运营、交易等扩展服务,则可以更好地促进我国的知识产权和科技创新工作。
一、专利与科技文献大数据现状及创新应用分析
(一)现状分析
以专利为核心的相关科技文献数据有较大规模。根据我们当前所积累的与专利相关的科技文献数据,总体分为专利文献数据、非专利科技文献数据(二者合称为核心资源数据)、检索数据、应用数据、平台数据和管理数据。具体包括:
1. 核心资源数据
主要分为专利数据(含审查过程数据)、商标数据、标准数据、法律文书数据、期刊数据、其他数据。主要内容如下:
(1)中国专利全文文本数据;
(2)国外专利全文文本数据(包括美国、欧洲、日本、韩国、世界知识产权组织WIPO、英国、德国、法国、瑞士、奥地利、加拿大、澳大利亚等);
(3)国外专利著录项目数据(共包括100余个国家及地区、组织);
(4)中外专利法律状态数据;
(5)中外专利引证文献数据;
(6)中外专利生物序列数据;
(7)中外专利化学结构数据;
(8)中外期刊元数据数据库;
(9)中外标准数据;
(10)中国知识产权类法律文书数据;
(11)知识产权法律法规数据;
(12)中国商标数据;
(13)美国商标数据;
(14)马德里国际商标数据;
(15)知识库及词表数据库;
(16)中外专利说明书及附图全文图像数据。
2. 检索数据
主要包括为实现检索而收集整合的原始数据和加工数据,特别是各个检索字段。
3. 应用数据
应用数据包括专利检索数据和非专利检索数据(主要是检索表达式和检索结果)、专利分析数据、项目管理数据、大数据商城数据、客户服务数据。
4. 平台数据
平台数据包括系统和网站的资源目录、表单、文本、图片、视频和网页。
5. 管理数据
系统管理数据包括用户数据、权限数据、日志数据、统计数据、监控数据、运维数据。
根据我们当前的检索业务运行情况,数据检索日访问量在10万左右,数据记录与分析记录量在10亿,在线服务数据量在150TB左右。
(二)基于大数据关联与整合思路的创新应用分析
根据与专利相关的科技文献大数据内容分析,专利文献与非专利文献表现出很强的相关性,例如专利与科技文献间引证关联关系、检索内容关联关系、文献信息相似性关系等,需要用大数据关联的思想对其进行分析、挖掘和整合,将相关数据整合后对外展示和提供服务,产生一系列新的价值。
以专利为核心的科技文献大数据关联与整合的主要过程包括:
1. 对专利和非专利文献进行收集、整理、存储。
2. 对数据进行清洗、整合、深加工、翻译、代码化等处理。处理完成的数据经过大数据分析,采用数据挖掘算法、预测性分析、语义引擎等技术进行智能关联,将文献引证关系、技术关联性、新颖性、创造性、商业价值等展现出来,同时对部分内容进行人工或自动标引,提高关联分析的有效性。
3. 在此基础上形成应用服务,例如检索服务、分析服务、预警服务、专利价值评估、交易撮合服务、信息推送服务等。
其过程如图1所示。
(三)基于专利信息服务产业链整合思路的创新应用分析
科技文献大数据服务对知识产权信息服务产业链有非常巨大的整合作用,知识产权信息服务产业链中包括:直接服务供应商、间接服务供应商、整合服务集成商、最终客户等。其构成如图2所示。
我们未来的定位是从直接服务提供商向整合服务集成商转变,通过以专利为核心的科技大数据信息服务平台构建,来实现对产业链前后的业务进行整合。向后可以联合其他间接服务商利用其能力快速拓展业务,向前建立服务运营平台来为用户提供更多更好的服务,知识产权出版社作为平台服务者,与供应链上各个环节的用户共同创造价值。平台的核心作用是让各服务供应商基于平台的海量“大数据”灵活、便捷的构建自己的“小数据”,在此基础上创造自己的各种服务产品提供给最终用户。
二、以专利为核心的科技文献大数据信息服务平台的构建与展望
由于多年来不断地数据积累和各类应用系统的开发,知识产权出版社已有充足的数据资源储备和检索技术储备来构建科技文献大数据信息服务平台,提升数据服务,整合知识产权信息服务产业链。下面从用户群划分、大数据关联与检索技术、数据项目管理、大数据服务交易等几个方面考虑平台的功能:
平台本身的用户群划分要侧重于服务公众,尤其是中小企业和个人等缺乏创新资金的目标群体,同时为平台管理者提供完善的数据和业务管理功能。
平台采用的技术,一方面要自动进行专利数据与非专利数据的关联分析,另一方面要保证海量数据的检索性能和准确性,能以最高效的方式展现检索结果,直接命中用户最关切的部分。
平台应具备大数据项目管理功能,用户能将数据自定义划分成集合,在此基础上进行个性化加工,形成定制化的数据产品和服务。
为了提高专利创新能力,平台还应该提供大数据服务交易平台,构造专利价值评估体系,建立大数据商城,提升专利价值,“盘活”数据,促进创新。
(一)主要建设内容
对于将要建立的科技文献大数据信息服务平台,其主要内容应该包括“五个一”:
1. 构建一个以专利为核心的知识产权产大数据平台,提供大数据管理和访问服务支撑,包括建立大数据存储架构、提供高效的检索服务与分析服务、提供统一的数据展现。
2. 构建一个以基础服务为支撑的运营平台,未来基于专利核心数据以及相关的科技文献数据,开展检索、分析、评估、交易等多元化的市场运营,并为知识产权产业链上的各个环节提供更为开放的服务支撑,包括提供统一的客户管理、产品(服务)管理、供应商管理、计费管理、交易支付、资源(项目数据)管理等功能。
3. 构建一个统一的应用开发支撑平台,为以数据为支撑的各个应用开发组提供统一的基础服务和应用组件,使各开发组直接可以复用平台基础功能,或降低技术难度和开发风险,提升开发效率,并让各开发组将精力集中于向用户提供特定服务的功能上。包括统一的用户权限管理组件、系统日志服务、消息服务、自然语言处理组件、翻译服务、数据可视化展现组件、知识库管理组件、消息队列组件等。
4. 通过构建统一的技术架构解决方案,提高各个应用质量,提升最终用户的体验,提高系统的性能、稳定性、安全性以及可扩展性,降低总体成本。包括负载均衡解决方案、分布式缓存、分布式服务、分布式存储解决方案、安全服务解决方案等。
5. 通过构建统一的管控平台,对各个应用系统进行统一管理从而提升运维质量,并提供运维辅助工具来降低运维成本。包括系统监控平台、自动化运维工具、数据核查和修改工具等。
(二)平台关键技术
1. 大数据存储技术
科技文献大数据存储需求包括3部分:
(1)传统结构化数据库,存放系统基础数据、专利及非专利结构化数据、操作数据等。
(2)大数据存储,存放海量文件,主要是专利和科技文献全文、附图、外部文件、部分关联关系等。
(3)检索数据库,检索引擎自身配置的数据库,存放检索索引、关联关系等。
其中大数据存储要解决的问题包括:数据源多、分布式存储、海量文件、快速存取以及存取结构应便于统计和分析等。
因此,大数据存储架构设计是一个分布式文件系统,用以实现专利和科技文献全文、附图、外部文件、部分关联关系的分布式存储。它有高容错性的特点,并且部署在价格较为低廉的硬件上;而且它提供高传输率来访问数据,适合那些有着超大数据集的应用程序。
大数据存储的分布式架构,将大数据处理引擎尽可能地靠近存储,实现了将单个任务打碎,并将碎片任务发送到多个节点上,之后再以单个数据集的形式加载到数据仓库里,采用的具体技术包括分布式文件系统、分布式并行数据库、映射规约处理模式等。
2. 大数据管理及检索技术
科技文献大数据管理主要面临以下几个问题:
(1)专利与非专利数据检索涉及海量数据,且随着业务发展,数据量日益增加。
(2)系统用户广泛,需要在支持高并发量的同时,保证检索性能。
(3)系统稳定性是衡量一个应用系统的重要指标,需要保证不会因某个节点设备的异常,而影响整个系统对外所提供的服务。
(4)需保证系统的高可扩展性,可通过增加节点方式,扩展系统容量与对外服务能力。
(5)支持结构化、半结构化及非结构化数据的统一检索。
大数据管理及检索架构设计采用了大数据管理系统并提供大数据检索服务,其处于提供全文检索服务的基础组件位置,即基于分布式或虚拟化技术的硬件支持,为所有通过二次开发接口进行检索的请求提供响应服务。大数据管理系统与实现大数据存储的数据库处于同等地位,只不过数据库负责数据存储,大数据管理系统则负责数据当中非结构化数据的全文检索。
大数据检索工具应具备以下技术特性:
扁平化设计,弹性扩展;异常感知、自动恢复;柔性多引擎技术;高效分区索引机制;多副本机制;混合索引方式;内存表与列存储;异步检索;多层次、多粒度的分布式缓存;可扩展的检索模式,同根词检索,算法和词典结合的英文词根检索,支持基于同义词、主题词的扩展检索。
3. 大数据智能化检索及分析技术
数据智能化检索和分析技术的目标对象是结构化、半结构化或非结构化数据,包括自然语言文本为对象的数据挖掘技术,它是从大规模的结构化数据和文本数据集中发现隐瞒、潜在的和重要规律的过程。首先从数据和文本中提取适当的特征,表示成计算机能理解的形式,然后采用各种挖掘方法发现隐藏的知识模式,最后以用户可以理解和接受的形式输出。
针对专利检索、特别是智能高级检索,大数据检索涉及到了词库管理、概念识别、文本抽词、关键词扩展关联、相关度计算等内容,这些功能将基于数据智能化检索和分析技术来实现。具体技术包括:自动分词、文本聚类、自动分类、自动重排、自动摘要、主题词提取、信息抽取、常识校对、拼音检索、相关短语检索、关联关系分析、内容过滤等。
4. 大数据展现技术
对用户友好的展现大数据分析结果是提升大数据价值的一项重要工作,如何基于分析数据集进行形象、直观的数据可视化展现是平台的关键技术点之一。数据可视化展现的核心是通过各种复杂的图形,直观地将数据中包含的内在关系以人们更易接受的方式展现给用户,在平台中数据可视化展现的关键技术主要在于以下方面:
(1)丰富的图形功能。图表展示组件需要提供各种图形的展现形式,除了基本的线图、饼图、区域图,还应提供漏斗图、金字塔图、线性波谱图、子弹图等多种图形来满足各种分析功能的图形展现。
(2)支持多种数据格式。包括XML、JSON、多元数据组等多种接口的数据格式。实现专利分析与分析服务的一体化标准,能够支持未来其他用户根据分析要求自行开发相关的应用功能。
(3)有优秀的兼容性。能够不依赖于任何Active-X或扩展控件并兼容多种脚本语言,能够支持未来广泛用户的使用。
(4)有良好的开放性。能够提供二次开发接口,支持用户自行开发相关的分析产品,支持复杂的图形展现(例如专利人合作关系等的展现)。
5. 大数据项目管理体系
数据项目的建立是为了帮助用户更好地管理自己生成的操作结果,方便后续工作的使用。基于此,平台应提供独立的管理功能,并提供对其他功能接口的调用。用户可以通过此模块建立多个项目,每个项目是若干个数据存储单元的集合。数据集合以树形结构存储,每个数据集合包括但不限于形成当前数据集合的检索式、专利数据和数据分析结果等内容。一个项目是由多个数据集合包构成,每个数据集合包又可以由下一层数据集合包或者一组专利的集合构成,每个专利包括著录项目、标准信息、标引信息、加工信息以及大数据包等内容构成。大数据项目管理功能应包括:项目信息展示、项目管理基本操作、项目内容管理、内容统计分析、文献多方式浏览等。
6. 大数据服务交易平台技术
科技文献大数据信息服务平台中应构建服务交易平台,数据商城是其特色功能之一:作为卖家,用户可在数据商城中实现专利分析报告、专题数据库和专利文件资料包的销售,还将实现应用工具和专题数据库的定制服务。在商城中可实现商城信息的检索、导航、在线订购、支付、交易确认、点评等业务。系统的注册终端用户均可作为买家参与商品交易,提供服务产品的注册用户兼具卖家的身份。
如何实现数据商城的可持续发展,确保数据商城能够汇聚众多专利服务需求者和供应者,在业务设计上要借鉴互联网思维,对数据商城进行有一定的前瞻性、超前性的设计,为用户提供创新性的服务,并形成创新的服务模式。其业务重点在于对交易过程进行全面地梳理、对流程进行细致地规划、设立完备的纠纷解决机制、建立账务管理体系对交易资金进行全面管理,并通过为用户提供智能化供需信息匹配服务等交易撮合功能来提升用户体验。
三、科技文献大数据信息服务平台在创新工作中的作用
以专利为核心的科技文献大数据信息服务平台建立后,通过大数据的关联与整合,在产业链中占据了枢纽地位,整合了上下游,并可在此基础上,开发出多种数据服务促进创新工作。
(一)整合专利相关科技文献信息服务产业链,促进用户创新
平台将上游专利和相关数据源、服务、软件进行整合,面向下游用户,提供整合后的智能服务。组织链条上各个供应商,利用各自的优势,通过不同服务者的合作来满足用户的最终要求。实现了上游数据与服务的增值,整体上提升了对下游最终用户的服务水平,由此促进了最终用户的创新工作。
(二)提供低成本的智能化服务,促进中小企业创新
企业在创新的过程中需要检索大量科技文献,对于大型企业来说,可以采购科技文献数据库,建立自己的检索系统或者购买相关机构的专业服务。但是,对于小企业和普通科研人员来说,传统的免费检索效率太低,依靠专业机构则大幅增加了创新成本。
科技文献大数据信息服务平台将提供一套智能化检索服务,给不熟悉科技文献检索的用户提供完善指导,比如自动分类、标引、导航,自动化的相关文献分析,自动化的信息推送和预警分析等。系统的智能化程度达到部分取代专业机构的程度,能够给个人和中小企业提供近似于专业机构的查新服务。平台本身的检索服务可以采用免费或低费用的方式,大幅降低了个人和小企业的创新成本。
通过本平台,用户可以了解技术的最新进展,预测相关发展趋势;跟踪竞争对手的活动;发现和避免专利侵权行为;充分利用失效专利经济和技术价值;减少重复的研发项目。
(三)完善的信息推送机制,促进科研和成果转化
由于系统会根据大数据分析模型分析已有数据,并对新进入的数据进行关联分析,可以实现如下应用:
1. 平台自动分析客户以往关注的领域,然后搜寻相关新进文献,及时提醒用户其该领域的技术革新,并推送相关文献。
2. 平台还可以根据其他用户的检索式、阅读行为、文献引证关系,找出与当前用户关注领域相关的其他领域文献,将其推送给用户。拓展用户检索覆盖面,帮助用户寻找新思路,在其创新过程中起到自动化地进行科技情报收集的作用。
3. 对于正准备进行专利交易和成果转化的用户,平台提供智能的消息服务,通过对交易数据的分析和预测,提供发盘提醒、报价参考、同类产品比较、市场预警等服务。
(四)构建专利价值评估体系,促进规范化的专利交易
平台本身将提供一套专利价值评估体系,专利价值由评估模型、专业人工评估、专利交易价值等综合而成。专利价值评估可以配合数据商城为专利交易双方提供客观的价值判断,供交易双方参考,从而加强专利交易的可靠性,促进交易业务的发展。
(五)通过用户的大数据交易和数据挖掘利用,进一步促进创新
用户可以将自己生成的专利分析报告、专题数据库和专利文件资料包放到大数据商城中进行交易,所产生的利润反过来可以进一步促进用户对数据的深度挖掘和利用。对专利等科技文献数据的深度利用,会让用户能够收集更全面的信息,认识差距、找到创新点,又必将进一步促进创新的发展。
参考文献
[1]徐树振,罗学礼,王森,杨莉,段嘉杰,张德刚,企业非结构化数据检索研究[J].信息技术,2014(4):196-200.
[2]马惠芳.非结构化数据采集和检索技术的研究和应用[D].东华大学,2013.
篇8
21世纪最重要的发展战略之一是全面建成信息化社会。作为四川省信息化建设的领头羊,如何运用手上现有的经济、信息两大资源,应用现代信息为政府部门实现政务领域的信息化,最终建成“信息化的政府”,提升政府执政为民水平的现实需求。是我们现在迫切需要思考的问题,本文就以单位已经实施的信息化工程做一个简单的探讨。
1、项目建设
要做好一个项目,必须在其前期阶段考虑人才管理、硬件设施购置、系统开发维护、信息收集处理四方面的工作。
1.1 人才建设
系统开发:由本单位政务应用处承担,该处曾参与起草全省信息化发展战略规划和建设,有独立完成项目设计、开发与应用技术支持服务的经验。系统维护:由本单位系统运行处承担,该处日常工作是负责拟定网络平台规划、建设、运维;承担门户网站和系统平台运维;负责省发改委机房、电话线路管理、运维,有足够的能力承担该项目完成后的系统维护工作。系统应用:该项工作的主要内容就是应用设计出来的信息工作平台,对来源信息进行深加工,如去伪存真、去粗取精等。只有将这些原始信息进行适当处理后,才能使其增值,产生出可方便用户使用,可用以指导决策的有效信息。由于这些工作的繁琐复杂,不可能交由某一个部门完成,所以必须由几个部门来分工合作。如对现实热点问题的专题研究应交由信息研究部门完成;大量信息的提炼就须依靠资源部门完成。
1.2 硬件设施
硬件设施建设包括网络硬件如网络服务器、工作站、适配器、路由器、中继器、集线器、交换机等、每人配置办公用台式机。在硬件建设上要坚持高起点、高标准、高科技、防止低水平的重复投资原则。在硬件设施建设中, 要从长远发展的角度、结合系统的实际应用、现有设备、资金状况等多方面规划设计。
1.3 应用系统建设
应用系统的建设分为两部分,一是数据库的选择,二是工作平台的组成,工作平台将在下一部分阐述。
目前,数据库领域采用的数据库模型有关系模型、网状模型、层次模型和概念模型,其中应用最广泛的是关系模型。在系统数据里面分了三种类型的数据,其中最重要的数据,是项目数据库中关于项目报批、立项、审批的内容,其次是宏观数据库中关于经济指标的基础数据,再是面向公众的外网上关于各种信息的编辑整理内容。
数据库分为两个部分:(1)存储数据库:提供各种数据的存储。这里使用的是NAS(Network Attached Storage,网络附加存储,它不仅可以在不同操作系统平台下的文件共享应用而且设备的安装、调试、使用和管理非常简单,可以节省一定费用。(2)分析数据库:可以对数据进行在线统计、数据在线分析、随即查询等发掘信息数据价值的工作
1.4 数据收集处理
(1)信息收集:包括经济研究、经济动态、经济咨询等各类信息的采集、分析、整理。(2)分析统计:提供信息的统计、查询功能,可以进行相关数据分析。(3)专业服务:提供各市州上报信息的基础服务,包括界面配置、功能权限、邮件短信功能。
2、信息化管理平台
(1)平台支持的业务范围:系统功能实现了四个方面的业务管理:1)信息化投资数据管理:关于投资规划、项目立项、投资计划下达情况。2)信息化项目管理:立项资料、文档资料等;项目相关的招标信息以及相应的执行情况。3)信息数据采集管理:组织专门人员通过外网或政府内网采集、编辑信息。4)信息化财务管理:各部门分配资金以及合理化报销程序。
(2)平台建设的原则:信息化工作管理平台建设应遵循国家、行业的相关标准,、在管理、技术及实现等方面充分借鉴国内外先进技术和单位现有系统成熟经验,设计上充分利用现有工作流程和管理体系,最大限度地简化工作流程,提高工作效率。充分利用现有软、硬件资源,不做重复或分散投资,与现有或将来的信息系统有机集成,方便系统对接和数据共享,实现业务的动态管理。
3、管理平台的主要功能
(1)综合网站:网站综合包括机构介绍、各部门工作动态、经济动态、经济研究、经济咨询、电子刊物、内部邮件入口。
(2)财务管理:通过内网,有效管理各部门财务状况,便于安排资金,控制经费的使用流向,报账流程也在该系统上一并完成。
(3)项目管理:项目管理是对整个项目生命周期的监控及管理。包括:项目立项信息、项目任务进展、项目周报简报、项目培训情况、项目一览。
(4)资源共享:资源共享里提供宏观经济数据库以及企业数据查询统计系统:宏观经济数据库涵盖工业、投资、就业、物价、规划、交通等涉及二十个关乎国民经济的数据库。内容还包括各项规划、工作法规,为内部人员工作需求提供便捷查询服务;企业数据查询统计系统是信息协会根据入会企业需要,在一定范围内公开企业信息,提供资源共享服务。
4、信息化工作管理平台应用效果总结
篇9
Keywords big data; librarian; role definition; innovative service; scientific data; data attainment
从2012年开始,包括美国政府在内的多国政府日益重视大数据并将其上升到了国家战略,如美国政府了《大数据研究和发展计划》、《支持数据驱动型创新的技术与政策》、《大数据:把握机遇,守护价值》等报告或白皮书,新加坡的制定国“智慧国家2015年(iN2015)”计划,日本政府制定了《面向2020年的ICT综合战略》[1]等,并正如美国政府于2015年5月1日的《大数据:抓住机遇、保存价值》[2]白皮书所简述的“大数据可以加速医疗、教育、农业、能源使用、商业等领域中的进步与新发现。”“大数据分析工具提供了令人惊奇的机会与能力,可以从已经存在的和新采集的海量数据中,发现以前难以发现的洞察和现象。”一样,让“体制内外的人一起参与进来,解决政府无法完成的以及棘手的问题。”[3]而这种“问题”的解决则依赖于对数据的有序化组织和深层次分析,而数据在有序化组织和深层次分析则需要数据管理所支撑。于是,业界的目光聚焦到了数据管理领域――一个以政府宏观政策为指引,企业、科研机构、数据管理机构、图书馆、社会数据管理中心等多方利益相关方或责任相关方共同参与、分工管理的领域。图书馆作为传统社会的文献信息组织机构,一直在信息、知识的组织和管理等方面具有专业的技术、人员及经验优势,是不可或缺的大数据环境下的数据管理与应用机构。图书馆员作为图书馆实现数据管理的直接实践者,则是否在大数据环境下有着新的角色定位,并在新角色定位的基础上重构图书馆的服务呢?本文结合这些近年热议的问题,从大数据环境下的图书馆转型趋势入手,重点对图书馆员的新角色定位与创新服务进行探讨。
1 大数据环境下的图书馆员新角色定位
大数据时代的到来,为图书馆带来了资源优势减弱、用户需求多变、图书馆基本业务外包呈发展趋势等风险与挑战,图书馆从资源到服务、从管理者到工作者的观念、行为顺应时展并实现转型、转变则成为了一种必然,图书馆员在这场多方位、多维度的转型发展浪潮中也面临着以下三个维度的角色转变与定位:
(1)图书馆员是一个文献工作者也是一个数据工作者。在传统的信息社会、知识社会环境下,图书馆尽管已提供有一定的知识咨询、数据统计、态势分析等基于数据应用的服务,但这些服务并不完全依赖于数据和数据分析平台,对其的分析也停留在对结构化数据即数据库数据的分析之上,图书馆员更像是一个文献(包括纸质文献、数字文献和网络文献)工作者。大数据环境下无疑则需向数据工作者,如数据的收集、分析、管理与评价等角色转移。
(2)图书馆员是一个具有较高数据素养的职业工作者。尽管大数据时代已经到来,但对大数据价值的认识和应用还并未普及到每一个人,因而对数据在科学操作、辩证认识、深度分析能力还有待提高,作为大数据环境下以数据为主要对象的图书馆工作者,则必须具备一定的数据操作、辨识、应用的驾驭能力,因而大数据环境下的图书馆员是一个具有较高数据素养的职业工作者。
(3)图书馆员既是服务提供者也是研究发现者。现有的图书馆服务更多是通过或依赖资源或技术平台来实现,如知识推送、信息检索等,但在大数据环境下这一常态将被打破,因为零散、海量的数据并不具备服务价值,而是需要通过对数据专业的分析、研究去实现服务价值的实现。即一方面要通过分析用户的兴趣、行为数据去发现隐藏在用户需求表达背后的真正需求;另一方面则是通过技术、平台支撑去分析肯研究所拥有的数据,最终发现隐藏在数据背后的事物发展规律并提供为用户。因此,图书馆员不再只是一个简单的服务提供者,也还是一个研究发现者。
2 大数据环境下的图书馆创新服务
在大数据环境下,图书馆的创服务既可以涵盖到传统的图书馆建设上游(资源建设领域),还可以在建设的种下游(服务建设领域及用户教育领域)有所突破和发展,并根据用户的需求在创客空间设置、跨界合作等方面有所突破。
2.1 数据资源的筛选与组织服务
在大数据环境下,图书馆用户特别是高校图书馆的师生用户不但其科研对象主要以数据为主,其还可能面临着科研资助机构、科研项目管理机构的其它数据操作要求。如2010年初,美国国家自然科学基金会(NSF)了项目管理指南,规定自2011年1月18日起所有提交至NSF的申请项目必须以附件形式提交一份不超过两页纸的数据管理计划,详细描述申请者如何实现项目数据的有效管理与共享传播,缺少数据管理计划的申请项目将不予接受[4]。之后,美国卫生和人类服务部下属的国立卫生研究院、美国航空航天局等其他科研项目资助巨头同样在其资助指南中对项目的数据管理做出明确规定[5]。这些旨在实现更多数据开放和多次、深层次开发应用的数据开放过程无疑加重了科研人员的工作负担,能够帮助和解决他们困难在数据组织、数据上传等服务成为了他们的所需。图书馆也敏锐的觉察到了这一服务拓展良机,争相开展数据的组织、上传等服务,并借此机会向科研工作者提供文献、数据的筛选、推送等服务。如加州数字图书馆数据保存中心通过研制和应用数据管理计划生成工具?DDMPTool,不但实现了为用户提供快捷生成科研数据管理计划外,还提供诸如研究者与研究机构和资助机构的亲密联系、用户多样化个性化的数据存储、计划调整等服务,不但分层、多维度推进了科研数据管理工作,也通过提供基于科研人员需求构建完备数据管理工具箱实现数据的整合共享,提高了科研数据利用效率[5]。
2.2 海量、复杂数据的挖掘与分析服务
大数据最大的应用就是对其的挖掘、分析来体现和实现其价值,如引入知识挖掘、引文分析、情报分析、智能辅助、可视化、知识发现等方法来实现用户的定制个性化需求服务。如亚马逊弹性MapReduce利用亚马逊弹性计算云(EC2)以及数据存储和传输提供Web服务,允许客户实例化Hadoop集群平台来处理大规模数据[6]。在已有在对这些海量、复杂数据的挖掘和分析服务实践中,情报分析与知识发现是图书馆界应用最普及的两种服务,如:同济大学图书馆为用户提供新能源汽车、城镇污水等多项专利分析服务;国家图书馆根据国家电网的提供《国家电网竞争情报内参》定制要求,通过对报刊、文献、数据库及网络信息的提取、整理和分析而为其提供与电力、通信等行业相关的动态咨询和深度分析报告、国家电网业内竞争对手动态信息,使国家电网的发展决策更具参考与科学化[7];北京大学图书馆等国内十余家图书馆均已引进采用了Summon、Primo、EDS、Worldcat Local和Encore为代表的资源发现系统以为用户提供文献检索、数据发现和分析等服务。
2.3 数据素养的培训与教育服务
篇10
电网工程造价是控制电网投资的关键指标,是确保电网健康和谐发展的重要因素。随着社会发展,电网建设外部环境日益复杂,设备材料供应市场波动频繁,输变电工程建设逐步向大容量、高技术含量方向发展,引起电力工程造价不断发生变化。因此,开展电网工程技术经济研究,分析影响工程造价的因素,对做好电网工程建设项目的技经管理、合理利用有限的建设资金将起到有效的促进作用。
目前,电网工程的分析多集中于人工分析,尚未形成标准、智能的分析方法。鉴于此,本文提出构建电网工程技术经济分析系统,建立省级电网工程技术经济数据库,并开发单项工程分析评估系统,在设计评审阶段,辅助技经专家进行技经专业评价,提高评审效率和质量,以期为优化电网工程建设方案,合理控制工程造价提供平台工具和决策参考。
1 电网工程技术经济研究综述
1.1 电网工程技经全过程管理
电网工程技经管理是指在电网工程建设中,落实工程计价标准,科学评价工程建设技术方案经济合理性,合理确定工程造价,有效控制建设成本,准确分析费用构成和变化趋势的全过程管理。
在工程建设各个阶段,采用科学的计算方法,按照现行的计价依据、经批准的设计方案或设计图纸等文件资料,合理确定投资估算、概算、预算、承包合同价、工程结算价和竣工决算价,并对各阶段的工程造价进行有效控制。电网工程各阶段技经管理内容如图1所示。
图1 电网工程各阶段技经管理内容
1.2 电网工程技经管理研究的重点
技经管理工作贯穿于电网工程项目建设全过程,但是各阶段对造价的影响程度不同。投资决策阶段是控制工程造价的关键,对于项目的建设工期、造价、质量起着决定作用。该阶段编制的投资估算,经批准后作为造价控制的目标限额。项目做出投资决策后,控制工程造价的关键就在于设计阶段。初步设计基本决定了项目的建设规模、结构形式、建设标准和使用功能。该阶段编制的概算,经批准后作为造价控制的最高限额。因此,技经管理研究应以项目投资决策和设计阶段为重。
技经评审的实质是对电网工程项目的科学性、合理性和效益性进行把关,是投资决策和设计阶段工程造价控制和管理的重要工作。通过评审分析,能够及时发现项目投资方案中存在的不合理因素,优化方案设计,有效控制工程造价,提高建设资金使用效率。
2 电网工程技术经济分析系统建设内容
2.1 建立电网工程技术经济数据库
建立数据覆盖面广、数据内容较为完善的电网工程技术经济数据库,提供较为完善的数据查询、数据分析等功能,并与其他信息系统数据库之间建立灵活而方便的接口,实现省内电网工程技术经济相关数据的统一管理和分析。
电网工程技术经济数据库主要包括电网企业内主网基建项目工程的估算、概算、招投标和结算成果等技经数据。其存储的主要数据信息如图2所示。
图2 工程数据管理数据内容
从图2可以看出,工程数据管理的内容十分广泛,包括工程信息、估概预结算、设备材料价格等数据。其中估概预结算的横向对比,集中展现了项目各阶段造价控制成果;设备材料价格数据库包括国网设备材料价格库、省公司设备材料价格库和地方材料价格库,同时为设备材料价格预测提供数据基础。
2.2 建立单项工程分析评估系统
建立单项工程分析评估系统,通过提取关键技经指标,建立造价智能评审分析标准体系,实现评审工程与典型工程、历史工程的自动匹配,查找工程造价差异原因,辅助技经专家进行专业评价,提高评审效率和质量。单项工程分析评估的功能架构如图3所示。
图3 单项工程分析评估的功能架构
从图3可以看出,单项工程分析评估的功能架构包括关键指标数据提取、典型工程自动匹配、对比分析、不确定分析和综合评价。其中,关键指标数据提取是根据工程性质提取指标数据,如变电工程关键指标主要包括电压等级、变电站形式等。典型工程自动匹配能够自动查询历史同类工程项目数据,实现工程自动匹配。对比分析能够实现不同工程间的标准化对比分析,并以图表方式生成分析报告。不确定分析是指加入设备材料价格等市场条件、政策标准以及定额、取费等标准套用情况,征地、拆迁等外部环境条件等不确定因素对单项工程的评估分析。
2.3 建立设备材料价格预测系统
随着电网工程新工艺、新技术、新设备的推广应用,设备材料购置费用占工程投资的比重不断增加,设备材料价格对电网工程投资的影响程度日益提高。因此,建立设备材料价格预测系统有助于电网企业分析价格波动趋势,提高工程估、概算投资准确性。
设备材料价格预测系统基于电网工程设备材料价格数据库,通过分析设备材料价格变化趋势,根据滚动平均法和指数平滑法建立预测模型,对设备材料价格短期以及中期走势进行预测,同时支持单一设备材料检索查询和趋势图展现。
3 电网工程技术经济分析系统效益
3.1 经济效益
电网建设投资是电网企业成本的主要构成要素,电网工程造价是电网建设投资的决定因素和主要指标,合理控制工程造价,是电网可持续发展的重要保障之一。通过建设电网工程技术经济分析系统,实现或建立单项工程技经评估模型与辅助分析工具,开展技经研究工作,为投资决策阶段和初步设计阶段的技经评审分析工作提供科学的支撑,提升评审效率,从而为电网企业合理控制造价提供借鉴和参考。
3.2 社会效益
电网工程建设作为经济建设、社会发展基础具有显著的社会效益。本文构建的电网工程技术经济分析系统,通过单项工程技经评估模型与辅助分析工具,对电网工程在投资决策阶段和初步设计阶段的投资进行合理的规划,优化资源分配,从而提升电网工程造价管理水平,提高电网建设项目投资决策和项目设计的科学性、合理性,有效控制电网工程投资,实现电网的优化投资管理,促进电网建设可持续发展。
4 结语
本文在对电网工程技术经济研究现状分析的基础上,一方面,建立了数据覆盖面广、内容较为完善的电网工程技术经济数据库,提供较为完善的数据查询、数据分析等功能,并与其他信息系统建立灵活而方便的接口,实现技术经济相关数据的统一管理和分析;另一方面,通过提取关键技经指标,建立了单项工程分析评估系统,实现评审工程与典型工程、历史工程的自动匹配,辅助技经专家进行专业评价,提高评审效率和质量。本文的研究成果将有助于电网企业优化技经评审管理、合理控制电网工程造价和提升电网投资效率效益。
参考文献
[1] 苏余泉.浅谈输变电工程造价管理的提升[J].科技创新与应用,2014(33):171-172.
篇11
美国运输统计局(BureauofTransportationStatistics,BTS)的职责,是努力获取数据并客观地分析解释数据,这些数据有利于提高人们对运输的深入理解,将用来帮助政府决策和管理。为了达到这个目标,BTS致力于3项中心活动:创造、管理和共享运输统计知识[5]。(1)创造运输统计知识。运输统计局设计和管理运输调查,收集、解释来自于私人组织和政府部门组织的运输数据。(2)管理运输统计知识。运输统计局提取和编辑的数据来自于许多资料源,以提供专业、最新的运输信息。(3)共享运输统计知识。每个年度出版运输统计报告和有关分析报告,使得BTS的合作者以及私人和政府组织能够共享这些运输统计知识。欧盟统计局(Eurostat)是欧洲联盟的一个统计机构,它的任务是提供给欧盟高质量的统计信息。它收集和分析来自欧盟国家统计部门提供的统计数据并且在欧盟内进行数据的对比和分析,更为明确地实施和分析欧盟的政策。欧盟统计局主要统计的内容为:常规和地区统计;经济与财政金融;人口和社会发展;工业、商业和服务业;农业和渔业;对外贸易;交通运输;环境和能源;科学和技术。欧盟统计局的框架为:法律;欧洲统计系统(ESS);统计委员会;在线共享数据系统(RSS)。欧盟统计局将交通运输统计和环境报告统计编撰在一个年度统计报告中。而且利用RSS系统及时更新每个成员国的运输统计信息。同时也不断出版新的有关运输统计数据分析,运输统计方法探索的出版物。
1.2我国运输统计职能部门的现状
交通运输部综合规划司下设统计处。运输统计机构的级别较低,人员配备极少,难以应付全国繁重复杂的运输统计任务。主要是从各司局那里直接获取数据信息,加工整理的力量薄弱。各司局则从各省厅的对口部门内获得数据信息。基层的运输统计人员力量就更为薄弱。省级运输管理局综合规划处其中的一项职责是负责全省道路运输行业统计报表及抽样调查报表的下达、汇报及上报,统计工作很多是单人负责,最多配备一个帮手。各地市(县)的运输管理处(所)中的运输统计人员基本就是单人,而且多数是兼职,人员更换频繁。基层单位统计是统计数据的源头,基层统计工作的好坏直接影响到统计数据的质量。总之,承担公路运输统计具体工作的运输管理部门,从人员配置上很难满足运输统计工作的要求。
1.3建立各级公路运输统计机构
要建立运输统计工作的长效机制,必须对现有的统计管理体制进行改革。在大部制改革的背景下,交通运输部应整合综合规划司统计处的职责范围,将水运局的统计职能纳入统计处。建议在统计处内部成立道路运输统计中心、水路运输统计中心,分别负责全国道路、城市道路和城市公共运输以及内河、港口、远洋运输数据信息的收集、处理、管理、。省、市两级交通运输管理部门对口成立运输统计处、统计科,分别负责本省、地市的道路、水路、港口运输统计工作,进行运输统计数据的逐级收集、处理、管理、上报工作。根据目前基层运输管理现状,县级运输管理部门负责协助统计工作,而运输统计主要由交通运输部和省厅、地市负责完成,可以最大程度地保证统计工作的质量。建议将交通运输部统计处的工作职责定为:①负责调大运输统计项目。如全国公路水路运输量专项调查[6]。②运输统计信息的收集。收集交通运输部各职能司局的运输业务数据;开展与交通运输部之外统计机构的合作,获得相关统计数据。③运输调查的组织。将涉及行业外的运输调查项目外包给社会调查机构,不亲自调查,而主要负责检查、监督调查工作,回收、处理、分析数据,调查结果。省级运输统计处和地市级运输统计科的工作职责是配合部里的运输统计工作,完成本省、市的重大运输统计项目;收集省运输管理局、地市运输管理处职能处室的业务数据;监督检查本省外包给社会调查机构的统计项目。这种统计管理模式除了尽可能保证运输统计工作的成效外,也可减轻基层统计人员因工作经验、兼职繁忙、工作调动等因素造成的基层统计工作薄弱的问题。
2完善公路运输统计指标体系
目前我国的运输统计指标分布于各统计报表制度中,随着社会和运输业的发展,指标体系需要完善和整合。发达国家运输统计指标完整而成熟,其中一些指标完全可以借鉴。发达国家每年出版年度运输统计报告,统计指标和图表完整,数据挖掘分析充分,统计信息得到了充分的共享。国内运输统计机关也应借鉴国外经验,出版中国的运输统计报告,真正发挥统计数据的价值。
2.1美国交通运输统计指标体系
BTS每年出版的年度《国家交通运输统计》,依照该交通运输统计报告,获得美国交通运输统计指标体系。由于篇幅所限,这里只列出几级指标层。第一章交通运输系统:①交通基础设施;②汽车、飞机、船舶数量清单;③交通运输设施使用状况;④出行和货物运输;E.交通运输运行管理状况。第二章交通运输安全:①不同运输方式的运输安全状况;②航空运输安全;③高速公路运输安全;④货物转运安全;⑤铁路运输安全;⑥水路运输安全;⑦管道运输安全。第三章交通运输与经济:①交通运输与宏观经济;②交通运输与消费者支出;③交通运输业的营业收入、就业和生产率;④政府有关交通运输方面的财政收入。第四章交通运输、能源与环境;①美国和交通运输部门的能源消耗;②不同运输方式的能源消耗;③交通运输的能源消耗强度和使用效率;④空气污染;⑤水污染、噪音污染和固体废物污染[7]。
2.2欧盟能源与交通运输统计指标体系
欧盟运输统计局每年出版年度《欧盟能源与运输的统计数字》,这里也只列出几级指标层,总体可以看出欧盟和美国的运输统计内容基本相同,不同点只是分类和结构存在一定差异。第一部分:常规统计数据。①常规统计数据;②GDP;③就业\失业率;④不同生产部门的产值比例和就业比例;⑤人口数;⑥欧盟成员国对外贸易:进口\出口;⑦欧盟与世界其他国家统计数据的比较。第二部分:能源。①总体信息;②能源概括性信息和供应安全;③能源产品税收;④电力;⑤能源产品价格;⑥成员国能源统计;⑦候补国家和其他欧洲国家能源统计;⑧世界能源消费统计。第三部分:交通运输。①总体信息;②货物运输周转量(欧盟27国以及不同运输方式);③旅客运输周转量(欧盟27国以及不同运输方式);④货物和旅客运输(非周转量统计方式:航空、水路);⑤交通基础设施;⑥不同运输方式的运输工具数量;⑦运输安全[8]。
2.3我国公路运输统计指标体系的完善
截止2004年,经原交通部审批正式生效的公路交通统计调查项目一共10项,都是以报表制度的形式,由综合规划司等4个司局负责填报。现行的交通行业统计报表制度存在以下问题:第一,不同报表的一些统计指标有重叠,容易出现数据“打架”现象;第二,部分指标内容陈旧,需要更新;第三,统计报表只有表,没有图,缺乏直观性;第四,不同统计报表数据的信息是分割的,没有一个平台将报表数据放在一起,对数据进行综合分析、挖掘,数据的利用率低。发达国家运输统计主要集中在运输生产指标、运输与经济发展的关系、运输安全、运输与能源环境保护等若干方面。根据国情和数据可得性,借鉴性国外经验,完善丰富公路运输统计指标,建立具有中国特色的公路运输统计指标体系。我国运输指标体系涵盖以上5大类统计指标。通过这些基本指标还可以挖掘出更多的扩展指标。建议对现行的10项公路统计报表进行整合,将报表制度中的指标归类到5大类指标中,同时更新指标和添加部分新指标,形成更加完善系统的公路运输统计指标体系。围绕指标体系由综合规划司统计处负责统计数据的分析、挖掘。定期月(季)度公路交通运输经济分析报告,年度交通运输统计报告,难度高的报告可委托行业专家撰写。
3落实运输统计信息联系制度
运输统计所需要的数据涉及政府部门、企事业单位,单靠运输统计部门实地采集数据是不现实的。因此,国内外都建立了运输信息联系制度。发达国家普及的计算机技术和完善的法律规章,保证了制度的实施。我国的运输统计报表制度并没有完全落实,尤其是与企业的信息联系制度。所以,落实运输信息联系制度是实施运输统计的保障。
3.1美国的运输统计信息联系
美国运输统计局通常数据收集的类型包括:需要调整的数据资料的收集,与行政部门合作进行数据的收集和统计调查[9]。美国运输统计局已经与美国国家普查局、能源部、环保署、劳工部、商务部、联邦公路局、国土安全部等都建立了信息交换和联系制度。另外美国典型的运输信息报告制度如:国家运输数据库(NTD),公路死亡事故分析报告系统(FARS)等。这些系统都是通过互联网和数据库技术收集运输数据和信息。
3.2加拿大运输数据库
加拿大运输部所属的运输数据处负责数据收集、维护和传播与运输系统相关的数据。为了有效地履行收集这些数据的职责,开发了数据即时通讯应用程序。运输数据处选定实施的数据库项目包括:航空运输数据电子收集系统(E-CATS),运输项目字典(TOD),国家路边调查(NRS)[10]。其中连接重要航空公司和机场的ECATS系统的数据已经作为国家管理航空运输和安全的重要参考,NRS的数据是加拿大货物运输量和货物流向的主要数据来源。
3.3我国运输统计信息联系报表制度
首先,应建立重点运输企业的信息联系制度。公路运输统计如果掌握了重点企业的运输情况,就等于获得运输市场的概括情况[11]。2009年交通运输部和国家统计局联合下发的《交通运输综合统计报表制度》公布了交通运输部部级重点联系运输企业名录。但是,部级重点联系公路运输企业有152家,样本数量远远不够推断全国的公路运输情况。因此,借鉴国家综合统计部门信息化建设的经验,增加面向基层运输统计机关的重点联系运输企业,通过建立连接各级基层运输管理机关的企业网上直报系统,集成报表的下发、数据审核、报表上报等功能。其次,应建立与政府部门的信息联系制度。运输行业涉及面广,单靠运输管理部门一家无法获得更为广泛全面的信息。所以,需要与相关政府部门合作,进行信息交换。可以通过政府内部网络信息平台进行电子数据交换,也可签立合作协议,定期交换纸质文件。这种合作模式,有利于发挥各自优势,统一数据口径,提高数据信度,节约时间和成本。基层重点联系运输企业、政府信息合作部门通过专用信息平台将数据传送到市级运输统计科,统计科对数据汇总、审核将地市数据呈送到省级运输统计处,统计处再经过整理、汇总、审核将省级数据呈送到交通运输部综合规划司统计处。最后,报表的设计应尽量考虑企业能够直接使用现成业务数据,这样可以降低企业填写报表的难度和提高报表的填写质量。企业需要专人负责数据的采集和上报工作,将数据报送质量和企业年审挂钩,保证数据的质量和效率。
4试行运输统计项目外包
涉及到社会、家庭、个人的运输统计项目,由于统计过程复杂,工作量巨大,国外开展这类项目主要外包给专业统计机构。我国运输统计还没有这方面的经验,为了满足社会对运输统计的要求,应积极探索与社会统计机构合作,试点开展社会运输调查。
4.1美国运输统计项目的外包
美国运输统计局根据运输统计项目的特点,对一些涉及社会、家庭、个人的运输统计项目进行了外包。由于这些调查带有明显的社会性质,而且调查工作量大,需要人员多,后期数据处理复杂。因此,美国官方的统计机构将这些调查项目外包给知名的社会调查机构或公司,例如:美国的GENESYS公司、M.Davis公司、MDAC公司、Westat公司、Morpace公司等。这些调查机构利用他们的专业知识、先进的调查技术进行社会调查。政府统计部门负责监督、检查调查数据的质量。总体上,这些社会调查支持与运输相关的广泛的主题信息的收集。
4.2我国运输统计项目应面向社会
从美国一些涉及全社会的运输统计项目看出,这些项目能够广泛收集社会公众的出行状态信息,获得居民的出行数据,以及公众对交通运输的意见和满意度。对合理规划运输发展、规范运输市场管理、提高运输服务质量都有重要的现实意义。获得民意信息恰是我国运输行业急需重视的方面。因此,我们也应开展有关交通运输的社会调查,获取全社会的意见信息和数据。交通运输部负责试点开展交通运输社会调查项目,例如:公务出行调查、家庭出行调查、交通运输安全调查、运输与能源环境调查等。政府对这些调查项目主要提出指导原则和方针,具体的实施、调查程序的细节,数据采集方法等,可以外包给社会调查机构完成。政府运输管理部门负责对社会调查机构的工作进行监督检查,以保证调查的质量。政府部门同时也应该为机构顺利完成调查,创造良好的工作环境。
5综合运用多种调查统计技术
发达国家广泛使用先进的统计技术,提高了统计效率,降低了统计成本,保证了统计质量。我国的运输统计工作主要是人工操作,辅助以计算机处理。随着我国运输管理部门经济条件的改善,应逐渐采用先进技术,根据调查项目的特点综合使用多种技术手段。
5.1美国的运输统计调查技术
国外数据采集技术非常发达且方法多样。根据调查需要和成本约束,可以使用不同的调查方法,甚至一个调查项目同时使用多种调查方法,以达到高效、低成本、减少非抽样误差的目的。信件调查技术:通过邮寄信件的方式进行调查,信件内容包含调查的意义和目的、调查表、填写说明、回执信封等。信件调查一般用在行业内针对商业机构具有强制性的调查项目中,而且调查已经在行业内较为成熟,被调查者很容易接受调查并按照要求填写和回寄调查表[12]。例如:美国商品流动调查(CFS)、运输者财务和运营信息调查等。电话访谈调查技术:电话调查目前在美国使用的是计算机辅助电话访谈(CATI)技术。在社会调查中,常利用该方法进行个人、家庭的民意调查,在美国已经得到广泛应用。样本利用电话号码清单或者计算机随机拨号技术进行抽样调查获得[13]。例如:美国家庭出行调查(NHTS)、运输统计的综合调查(OmnibusSurvey)调查主要利用CATI技术[14]。电脑自填式数据库调查技术:美国国家运输数据库(NTD)由660个运输服务提供者通过基于互联网的报告系统给NTD提供数据报告。美国公路死亡事故分析报告系统(FARS),将警方交通事故报告的信息按照规定的标准编码,录入FARS系统的专用软件中。计算机统计软件:在运输调查中还使用了先进的计算技术,在样本分层、样本抽样、样本权重的调整、数据误差的计算和控制、数据的汇总等,都使用专门的统计软件进行处理,大幅度提高了处理效率和准确性。运输地理空间信息系统技术:专用软件GeoMiler,采用地理信息系统(GIS)和空间多式联运网络数据库来计算运输英里数。它集成了解决运输路线问题的地图可视化功能,以处理多种运输方式综合运输的选择问题。该工具的运算法则建立在美国高速公路、铁路、水路和航空网络多种运输方式的“最优路径”选择上。该软件技术已应用CFS中,自动规划商品流动需要的最优路径,形成可视化的商品运输流量和流向图。
5.2根据国情借鉴国外调查统计技术
篇12
一、会计准则执行检验的主要分析方法与本研究的基本思路
在对会计准则执行情况进行检验时,重点问题是如何判断一个企业是否遵循以及在多大程度上遵循了会计准则。Cooke(1989)在这方面最早建立了一套比较实用的评分方法,通过对比会计准则要求披露的项目数量与有关公司财务报表中实际披露的项目数量,得到一个衡量和评价公司遵循会计准则程度的“遵循度指数”。此后衡量准则遵循度的有关研究也大多采用了类似的方法(如Street&Gray,2002;Glaum&Street,2003)。Street&Bryant(2000)设计了一份遵循调查表,针对49家样本公司的财务报表和审计报告,对照国际会计准则的具体要求,统计了公司报告对国际财务报告准则的遵循信息。Street等人(1999)采用类似方法在研究中发现,在1996年声称遵循了国际财务报告准则(时称国际会计准则)的200多家公司中,遵循程度并不相同,或者说大多数公司是有选择地执行某些准则。Spetz&Baker(1999)提出以“Saidin”指数来衡量准则的遵循度,根据信息披露的稀有程度分别确定不同的权重。
目前国内关于会计准则遵循度的实证研究以调查报告为主。与国外类似研究相比,我国对会计准则执行问题研究的一个显著特点是,目前的权威调查报告首先是以政府会计主管部门(主要是财政部)为主体,以对上市公司年报的分析为主要形式。到目前为止,非官方进行的实证研究中,比较有代表性的主要有蔡琦梁(2007)对中小板上市公司执行新会计准则的调查分析报告,以及高利芳(2009)从基于趋同的会计准则变迁角度,对新准则执行一致性进行的实证检验。
就会计准则的执行水平或遵循程度而言,本文认为可以按照以下思路进行检验:1.应当明确的是,会计准则执行不应仅局限于形式上的采用与否,也不能仅依据是否执行了某项具体条文,更要注重准则的内在意图和实质要求是否得到了充分和一致的体现;2.按照上述标准,在判断和评价会计准则执行水平之前,需要先对会计准则的基本理念和特征作出整体性的概括;3.应当以会计准则的基本理念和内在要求是否得到实质性应用为依据,判断会计准则在有关企业是否得到了遵循,进而评价会计准则执行的总体水平。因此,本文借鉴了Cooke(1989)的会计准则遵循度量化方法,首先在会计准则要求披露的项目中,归纳出能够体现会计准则基本理念和根本特征的关键项目;然后,通过对比发行A+H股的上市公司财务报表中实际披露的项目数量与准则要求披露的关键项目数量,判断每一公司的准则遵循度,并赋予一个分值,该分值的高低反映了企业对新准则的执行或遵循程度。
二、样本选择与赋分方法设计
为了便于与A股公司进行比较分析,在选择需要检验的准则和披露项目时,本文在参照财政部的我国上市公司执行新会计准则情况的分析报告的基础上,选定了8项具体准则的38个具体项目。之所以选择这些准则,首先是借鉴了财政部会计司2007年的上市公司执行新会计准则分析报告中选取的15项具体准则,包括存货、投资性房地产、固定资产、无形资产、非货币性资产交换、资产减值、职工薪酬、股份支付、债务重组、或有事项、借款费用、所得税、企业合并、金融工具确认和计量以及每股收益准则,但是,对于相比原会计准则或会计制度没有原则性变化或者修订不多的,或虽然修订明显但是主要涉及某些特殊行业,或者相关业务在现实中发生数量和次数都很少而不具有普遍意义的,在设计准则遵循度赋分量表时都予以剔除。经过调整,最终选择了投资性房地产、无形资产、资产减值、职工薪酬、借款费用、所得税、企业合并以及金融工具确认和计量8项具体准则。
本研究数据来源主要是上市公司2007至2009年的年度财务报告(财务报告系来自巨潮资讯网),对我国新准则实施三年以来A+H股上市公司会计准则执行情况进行检验分析。样本通过随机抽样方式从沪市主板取得,并且剔除了金融类公司、ST公司和所有者权益为负的公司,以及三年数据不完整的公司。经过上述调整后得到的剩余样本共32家公司3年的96个观测值。
在对准则遵循度进行赋分计算时,如果样本公司对某一项目完全按要求充分披露了相关内容,即得1分;如果对有关项目进行了披露但未完全按要求披露,可得0.5分;如果完全未披露则得0分。根据上述原则赋分后,将各项目的得分相加,得到的总分即为该公司的准则遵循度分值,之后再以该分值除以全部项目均充分披露情况下可得的总分(38分),就得到每个公司的准则遵循比率。需要特别说明的是,由于一些企业并未持有投资性房地产项目,或者并非三年都有此项目,若对未持有此项目的年份给出遵循分0分,并不能真实反映企业对新准则的遵循程度。因此,对于上述情况的投资性房地产遵循了以下两项原则:一是对于三年都未持有此项目的企业,用去除投资性房地产项目后其他项目得分合计乘以投资性房地产项目分数(5分)占全部项目总分(38分)的比例,来估算一个投资性房地产项目的总得分,不再在投资性房地产内部各项目之间分摊;二是对于三年中并非每年,而是某一年或两年持有此项目的企业,持有年份按实际得分,未持有年份的得分使用持有年份得分的加权平均数,以便更好地反映企业对这一特定项目的披露程度。
三、A+H股公司的会计准则遵循度分析
(一)基本数据分析
表1给出了三年内所有样本公司对有关准则遵循比率的描述性统计。根据表中的平均值和中值数据看,选定的8项具体准则中,单项准则遵循度相对较高的是借款费用准则以及金融工具确认和计量准则,遵循度相对较低的是资产减值准则、职工薪酬准则和企业合并准则。
1.投资性房地产准则。由于投资性房地产准则是一项相对较新的准则,在32家样本公司中,只有一部分存在投资性房地产业务,而且这些公司在对投资性房地产的后续计量中绝大部分采用了成本模式。分析可能的原因,主要有两个方面,其一是大多数企业对历史成本计量模式的熟悉和惯性;其二是作为全新概念的投资性房地产业务对企业应用要求一定的适应时间。由于这两方面的原因,从成本与会计处理的难度上考虑,选择成本计量模式无疑容易为更多公司所接受。从信息披露的情况看,样本公司较为普遍地披露了投资性房地产的确定依据、种类以及计量模式,采用公允价值模式的均披露了公允价值的确定及变动。但在投资性房地产转换和处置方面披露不充分,遵循度比较低。可能是由于投资性房地产是一项新的准则,转换与处置发生不频繁,因此这两项遵循度低并不能说明企业没有披露的意图。
2.无形资产准则。相比以往的无形资产准则和会计制度,现行准则的主要变化有两点:一是增加了使用寿命不确定的无形资产类别,并对使用寿命不同的无形资产成本采用了不同的后续计量方式;二是增加了研发支出的资本化。从信息披露的遵循度情况来看,遵循度较低的主要体现在新修订的项目:一是有些企业没有披露使用寿命不确定的无形资产使用寿命不确定的判断依据;二是公司对于研究开发支出中计入当期损益和确认为无形资产成本的金额披露不足。但是三年的遵循度中值均达到了80%,平均值也达到了77%,总体遵循情况比较理想。
3.资产减值准则。资产减值准则引进了资产组概念。从整体上来看,企业对资产减值准则的遵循比率是所有准则中最低的。企业对资产组的披露不充分,即使披露了资产组,也没有披露资产组的具体组成、对资产组减值测试所使用的折现率以及可收回金额的确定。有些企业没有按照准则规定披露重大资产减值损失,包括减值的原因与金额。大多数企业只是对可收回金额的确定依据进行了简单说明,但对于确定公允价值减去处置费用后的净额以及未来现金流量现值的方法披露不足。
4.职工薪酬准则。根据遵循比率看,职工薪酬准则的遵循度总体上比较低。尽管绝大多数样本公司都披露了应支付给职工的工资、奖金、津贴和补贴,以及应当为职工缴纳的“五险一金”等,但是有部分公司没有披露辞退福利事项,而且大部分公司都没有披露为职工提供的非货币利。由于对非货币利一项的遵循度较低导致职工薪酬项目遵循度整体偏低。
5.借款费用准则。在所有检验的准则中,借款费用准则的遵循度是最高的,从三年的数据来看,均值均接近90%,平均值均为100%。原因主要有两点:一是虽然新准则增加了利息可以资本化的资产范围,但是对无形资产与固定资产以外的资产,例如对存货的资本化借款费用,在32家样本公司中仅有4家公司存在,在总体中占比不超过2%;二是新旧准则在会计处理上并没有实质性的差异。虽然总体遵循度比较高,但还存在一个普遍性问题,那就是部分企业没有充分说明资本化率的确定依据。
6.所得税准则。从遵循值情况来看,所得税准则在整体上遵循度居中。对于所得税费用主要组成部分中的每一类暂时性差异和可抵扣亏损的影响,所有样本公司基本都按照准则规定形式披露了列报期间确认的递延所得税资产或递延所得税负债的金额。从披露情况看,最大的问题在于,对未确认递延所得税资产的可抵扣暂时性差异和可抵扣亏损金额的披露不足,只有不到50%的企业披露了该项内容。对于所得税与会计利润之间的关系,少数企业披露不充分。
7.企业合并准则。从三年遵循度来看,企业合并准则是除资产减值准则外遵循度最低的一项准则。对同一控制下企业合并的判断以及商誉金额的披露不充分,部分企业没有披露。被合并方自合并日起至报告期期末的收入、净利润和现金流量等情况,以及合并后已处置或准备处置的被合并方资产、负债的账面价值、处置价格等内容,披露很不充分,很少有企业披露这几项。
8.金融工具确认和计量准则。作为一项新准则,金融工具确认和计量准则与以往相关准则的主要区别在于金融工具的划分并对不同类别的金融工具规定了不同的计量属性,按照新的规定,公允价值成为金融工具的主要计量基础之一。通过对样本公司的数据进行分析,可以发现金融工具确认和计量准则的遵循度水平整体较高,其三年的中值均为90%,而且均值也达到82%,同时标准差也很小。从具体披露情况看,所有企业都按照新准则披露了金融工具的分类。几乎所有企业都披露了交易性金融资产与可供出售金融资产公允价值的确定依据。部分企业没有披露公允价值当期变动计入损益和权益的金额。几乎所有公司披露了持有至到期投资以及贷款和应收账款实际利率的确定方法,但只有一家公司进一步披露了该实际利率。
(二)基本结论
从检验结果看,A+H股公司对企业会计准则的执行效果总体比较理想,但同时也存在一些问题。
理想的方面主要表现在两点:1.从得分的总体情况来看,大部分企业遵循度的平均值在70%以上,8个项目中有3个项目超过80%,甚至达到90%,这说明企业对新准则的遵循情况总体比较理想;2.从得分的趋势来看,企业的总体得分在逐年上升,说明企业对新准则的遵循度是在逐年上升的。
存在的问题也可以从两个方面来看:1.从总体层面来看,所有企业对某几项准则的遵循度不理想,如对资产减值准则的遵循度,几乎所有的企业都未能完全按照准则要求披露信息;2.从个别层面来看,不同企业对一项准则的遵循程度存在差异,但这种差异并不十分明显。通过分析发现,披露不充分的项目大都集中在一些新的要求或者一些判断与处理比较复杂的项目上,这或许是由于企业尚未适应新的准则所致。由此也看到了对新准则遵循度的提升空间。
四、对A股与A+H股公司会计准则执行效果的比较分析
通过对比分析,发行A+H股的企业对新准则的遵循度与仅发行A股的企业的遵循度基本一致,但也存在部分差异。
(一)执行效果对比
通过对比发现,对于无形资产准则,A股与A+H股企业执行效果均比较理想,问题主要都集中在对使用寿命不确定无形资产的判断依据与研发支出的披露上。相对来说,借款费用准则在两类企业的遵循度都是最高。原因可能是,虽然新准则扩大了允许利息费用资本化的资产范围,但事实上固定资产等长期资产以外的资产符合资本化条件的情况极少,因此新旧准则在资本化问题上的差异在企业实务层面并不显著。
对于职工薪酬与企业合并两项准则,A股与A+H股企业遵循度都比较低。对于职工薪酬准则,问题都主要集中在对非货币利的披露不足。一个重要的原因可能是,非货币利并没有规定固定的计提标准,而且准则也没有要求每一个企业都必须为职工计提非货币利,这样在很大程度上,对这一项目的披露留给企业很大的随意性,属于“原则上无错,实质上难以监管”(高利芳,2009)。不过,虽然这两项准则遵循度较低,但无论是A股还是A+H股企业,过去几年中遵循度都是逐年上升的,说明企业对新准则的要求正在不断适应并遵循。相对来看,资产减值准则遵循度最低,主要原因有二:一是资产组的确定需要作出判断;二是可收回金额的计算涉及到公允价值的确定、对未来现金流量的预测以及折现率的确定。这些问题都具有较高的复杂性,并需要较多的职业判断,因此,在这些项目上,企业普遍存在惯性披露不足的现象。
对所得税准则、投资性房地产准则以及金融工具确认和计量准则,A+H股企业比A股企业遵循度普遍要高。从所得税准则来看,主要体现在对可抵扣暂时性差异、可抵扣亏损中未确认递延所得税资产的金额的披露,以及所得税与会计利润之间关系的披露上。分析其中的原因,可能是A股企业原适用会计准则和制度未强制要求采用纳税影响会计法,与多数国内企业一样,相当多的A股企业长期选择使用较为简单的应付税款法,因此在转向新准则要求的资产负债表债务法时,面临较为重大而显著的变动差异的挑战;而发行A+H股的企业有很多在执行新准则之前已经采用了资产负债表债务法或其他纳税影响会计法,对于新准则的适应性相对较好。从投资性房地产准则来看,主要体现在对投资性房地产转换的披露上。另外,经过比较发现,A股样本企业对投资性房地产的后续计量全部采用了成本模式,而A+H股企业部分采用了公允价值模式,这从一个侧面反映了境内企业在计量模式选择上对于历史成本的习惯性偏好,也反映了目前国内应用公允价值的环境仍有不少欠缺,因此境内企业对计量模式的重大变化需要更多的适应时间,而发行A+H股的企业因其境外经营的机会,可以较早和较多地接触并掌握公允价值计量属性,而这种差异又决定了A股企业和其他境内企业在适应计量模式有所突破的准则(如投资性房地产准则)时可能面临比A+H股企业更大的难度。更值得一提的是,投资性房地产对于境内企业而言是全新的概念,因此在理解和遵循有关准则时也需要更多的时间。从金融工具确认和计量准则来看,A+H股企业比A股企业的遵循度要高,主要体现在公允价值变动计入损益和权益的金额项目的披露上。这一点主要与以下三点有关:第一,目前国内金融市场的发展程度仍然明显落后于国外发达市场,金融产品的丰富性和复杂性不足,因此造成大量境内企业和会计人员对金融工具业务不够熟悉;第二,金融工具确认和计量本身具有较高的复杂性,在没有充分实务基础的情况下,透彻的理解和把握更加具有难度;第三,金融工具计量中公允价值的重要性非常明显,但我国目前金融市场的发育程度限制了公允价值的可获得性,使金融工具的计量面临更多的困难。
(二)执行效果差异的成因分析
通过对A股企业与A+H股企业的数据研究发现,一方面,无论境内上市还是境外上市的企业,对新会计准则的遵循度都逐年提高,我国新会计准则实施后会计信息的价值相关性显著提高;另一方面,各年的遵循度基本呈逐年上升趋势,说明企业正逐渐适应新准则,并不断完善会计信息的披露。
不过,通过研究A股与A+H股企业的数据也发现,A+H企业对新准则的遵循度整体要高于A股企业,而且二者在具体准则的执行上也存在一些差异。最明显的一点体现在A+H股企业比A股企业对公允价值的披露更加充分。这可能与二者所处的资本市场环境以及监管等因素有关。从投资性房地产、金融工具等A+H股企业遵循度明显高于A股企业的准则来看,最为突出的问题往往体现在公允价值计量模式的应用上。公允价值变动会计信息极易受到资本市场环境的影响。目前,香港已具备较为成熟开放的市场环境,相比内地市场而言,有关交易或事项的公允价值更容易获得,同时,成熟发达的资本市场中,价格信号能比较及时地反映交易的经济本质,因此市场价格也必将容易受到认可。相比较而言,目前内地仍处于市场经济成长时期,市场机制远未达到成熟的程度,价格信号也多有扭曲,这可能是香港有关会计准则相比内地会计准则更多应用公允价值计量属性的主要原因。
进一步分析,A股企业的会计准则遵循度总体来看略低于A+H股企业,主要原因是发行H股与A股企业所处的资本市场环境、原有会计体系和国际趋同起点不同。相比H股企业所在的香港资本市场,A股企业所在的境内资本市场发展时间短,市场体系尚不够成熟,体制方面仍不健全。同时,香港资本市场的国际化程度较高,相关会计审计规则国际趋同的起步较早,与西方会计体系交流和衔接开始得比较早,实现趋同也更为顺畅,会计人员在规则适应方面也有较高的起点,所以,A+H股企业执行新准则的基础总体好于境内市场。
(三)新准则执行中的共性问题与改进
从研究数据来看,尽管新准则执行的前景比较乐观,但仍存在一些不足。首先,无论是A股还是A+H股企业,从对各个具体项目遵循度的分析看,对于遵循度低的具体项目尚存在改进的空间,即企业可以通过自身努力,并保证在合理的成本—效益基础上披露更充分的会计信息。其次,A股和A+H股企业均存在一个明显的现象,即对传统的或基本性项目遵循度较高,而新增项目尤其是涉及职业判断的项目遵循度偏低。我国新企业会计准则的主要目标之一是体现国际趋同,由于国际准则旨在协调各国会计实务对重大项目的会计处理和信息披露,为了尽可能避免规则导向,对于非重要项目的规定往往不够细致。另外,各国的会计准则和实务差异显著,为了尽量提高准则的普遍可接受性和可操作性,往往需要对同一交易或事项的处理提供多项备选方案,这就必然要求更多的职业判断。由于历史的原因,我国会计实务和规则对职业判断的要求相对较低,但是随着企业交易或事项越来越复杂和多样化,会计准则不可能也没有必要对每一类可能发生的交易或事项作出详细规定,同时,随着我国会计准则国际化程度的不断加深,对会计职业判断的要求也势必逐渐提高。
【参考文献】
[1] 蔡琦梁.中小企业板上市公司执行新会计准则情况分析[J]. 证券市场导报,2007(7).
[2] 高利芳.基于趋同的会计准则变迁与会计准则执行研究 [D].厦门大学博士学位论文,2009.
篇13
一、质量成本管理的重要意义
目前质量成本管理已经成为企业全面质量管理的有机组成部分,很多生产者已经认识到了质量成本数据的大部分用途。通过质量成本数据分析,可以评价产品质量和质量管理水平及其对经营业绩的影响,了解产品质量的变动程度和变化趋势,找出影响产品质量的关键因素及薄弱环节,并在此基础上积极进行整改,力求使产品品牌、企业信誉、员工素质、产品质量有实质性的飞跃。另外,利用质量成本的数据信息可以向企业外部相关利益方提供质量保证能力的证据,并可将其作为确定产品价格的重要参考依据。
二、目前企业质量成本统计存在的突出问题及症结
质量成本管理是一个新兴领域,目前多数企业对这项管理活动还比较陌生。由于管理基础薄弱,统计工作制度不健全,数据来源渠道不合理等,导致收集的数据信息缺乏完整性,进而造成统计分析结论与实际偏差较大,指导性不强,甚至误导信息使用者。因此,提高质量成本统计完整性是改善质量成本管理、实现质量成本管理由量变到质变首要解决的问题。近几年,许多企业已经意识到了这一问题,但如何从根本上加以改进却缺乏有效的指导。归结起来,主要有以下几方面症结。
一是对质量成本的内涵存在多种认知偏差。有的认为质量成本是为获得质量所发生的成本,有的认为是质量部门的开支,还有的认为是与产品质量有关的成本。其实这些理解都存在一定的误区,影响了数据归集范围的合理确定。二是对质量成本管理迫切性、重要性认识不足,对统计工作的重视程度不够,错误地认为开展此项工作主要是用来应付质量体系认证和体系考核。三是缺乏闭环管理和必要的监督机制,数据来源可验证性较差,出现偏差时不能及时加以纠正。四是财务会计核算与质量成本统计没有对接,呈现“两张皮”,财务数据信息得不到充分利用,同时财务信息与生产、服务等信息不对称,没有做到有效结合。五是盲目地将质量成本核算纳入会计核算体系,试图对会计核算体系“动大手术”,在会计账簿和内部报表中陷入“数字游戏”,造成统计混乱。六是照搬传统的成本控制方法,往往还按部门或按会计期间下达指标并进行考核,缺乏针对性和科学性,致使有些部门领导心存顾虑,出现主观瞒报情况。七是质量成本统计范畴没有结合行业特点、管理基础、产品质量状况来确定。纳入质量成本统计的产品项目数量不全,覆盖面过窄,降低了统计的完整性;同时有些项目经常变动,缺乏连续性和可比性,弱化了统计分析效果。八是质量管理人员参与质量成本管理力度不够。受专业和工作特点的限制,单纯依靠财务人员进行质量成本管理存在局限性,不能解决系统性问题。
三、提高企业质量成本统计数据完整性的对策
借鉴国外质量成本管理的成功经验,结合以上分析,本文提出以下几方面的改进对策。
1、科学认识质量成本内涵
质量成本的正确表述应为“用货币的语言,以货币的形式表现的质量现实与质量理想状况的差别”。这一方面从经济角度反映了质量问题,另一方面也反映了质量对经济效益的影响。它具有四个基本属性:质量成本是把质量投入与质量损失联系起来考虑的一种观念;研究质量正向投入和负向产出关系的一种质量管理工具;质量成本不是财务会计中的一种成本概念,它属于管理会计的范畴,着重考虑机会成本;质量成本是质量信息的一种载体,是质量分析、控制、改进、评价和证实的工具。2、提高对质量成本管理重要性的认识
各级领导要高度重视质量成本管理工作,将其纳入全面质量管理之中并作为重要的组成部分常抓不懈。
3、加强对质量成本统计完整性的监督与考核力度
建立由质量、计划、检验、生产、采购等部门组成的跨部门专题小组,重点针对部门上报数据的真实性、完整性进行监督检查(按月或按季),并出具审核意见。将审核结果纳入部门年度工作考核范畴,同时制定科学、量化的考核办法。
4、选择切实可行的质量成本数据收集渠道
对于与财务信息紧密结合的统计项目,如预防成本、鉴定成本、外部质量保证成本以及外部故障成本中的维修差旅费等,应由财务部门直接从财务数据中提取;对于难以从会计账簿中提取的项目,如内部故障成本、外部故障成本中的维修材料费等,应由各基层单位填报,同时报送编报说明及相关分析,经专题小组审核会签后上报财务部门汇总。
5、搭建质量成本统计项目与内部财务预算之间的衔接平台
在完善内部财务预算的基础上,明确质量成本项目与财务预算项目之间的对应关系。按照对应关系,直接从财务预算中提取数据,计入相应的质量成本。这样可有效利用财务数据,既简便可行又避免了数据遗漏。
6、细化质量成本统计科目
按新的国家标准将质量成本划分为预防成本、鉴定成本、外部质量保证成本、内部故障成本、外部故障成本五个一级科目,并在确定的一级科目下结合本单位实际情况进一步调整并细化二级及明细科目,确保科目的设置涵盖全部质量成本统计项目,以避免统计漏项。
7、简化纳入质量成本管理的产品项目,按照产品类别进行统计
传统的统计方法往往是按单台套产品进行统计。由于单台套产品数量众多,类别繁杂,一方面不可能覆盖全部产品,造成统计缺乏完整性;另一方面单台套产品发生损失的偶然性和不确定性较大,影响分析效力。因此,按类别进行统计可以杜绝此类问题,提高统计完整性和分析有效性。
8、实行全寿命质量成本法
即纳入质量成本管理的产品类别确定后,将研制、生产、交付、保修、服务全过程所发生的与产品质量有关的费用均统计到质量成本中,并对其全寿命周期进行质量成本跟踪管理。此法与传统的统计方法相比有显著的进步。传统统计方法注重期间(按年度统计较常见),而全寿命质量成本法注重产品类别,要求质量成本数据的归集、分析按产品类别或项目进行(如×××类产品质量成本分析报告,报告期间×××年至×××年),直至保修期结束。该办法有利于连续、完整地考察产品质量损失情况,掌握产品质量损失动态变动规律,更好地做到持续改进。
9、尝试将质量成本统计工作职责由财务部门划归生产管理部门
财务部门由于受专业和工作特点的限制,对内外部损失数据信息的完整性无法进行有效把关。而生产管理部门熟悉产品情况,如果尝试将质量成本统计工作职责划归生产管理部门,由其负责收集、统计并把关,财务部门、质量部门密切配合,效果会更好。