在线客服

大数据分析毕业论文

引论:我们为您整理了1篇大数据分析毕业论文范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。

大数据分析毕业论文

大数据分析毕业论文:大数据分析煤矿安全生产论文

1综合决策分析缺乏时空维度的支持

煤矿安全生产和管理是一个与时间和空间相关的过程,其综合决策分析离不开时间和空间维度的参与,而现有的煤矿信息系统往往缺乏时空维度的决策分析工具,如拓扑分析、缓冲区分析、密度分析、叠置分析、时间和空间趋势探测分析、时间/空间关联分析、时间/空间自回归分析等。煤矿安全生产内涵丰富,既包含了日常性事务性的风险超前预控管理,又包含即时性的风险识别、监测、预测乃至预警,这就给安全生产管理的各类信息系统建设提出了很高的要求,需要满足监控实时化、系统集成化、数据海量化、分析决策在线化和智能化,这些都是目前信息系统建设的短板。上述问题的存在使得我国煤矿安全生产形势没有本质的好转,诸多信息化建设成果(硬件、软件)在煤矿安全生产过程中也没有起到预期的成效。

2煤矿安全生产大数据分析系统

2.1大数据分析的概念大数据分析

是指数据量急剧积累迅速超出主流软件工具和人类思维处理的极限,大数据与传统数据比较起来,有四大特征:数据体量巨大(Volume)、数据类型繁多(Variety)、数据价值密度低(Value)、更新速度快时效高(Velocity)。大数据分析需要全新的数据处理理念和分析工具,洞察发现海量高速增长信息中潜藏的价值[4]。从理念上,大数据分析与传统数据分析有三大转变:要全体不要抽样,要效率不要,要相关不要因果。针对大数据,既有的技术架构和分析工具已经无法满足要求,需要全新的数据分析方法和技术,这其中包括:(1)大数据分析可视化方法;(2)大数据挖掘算法;(3)预测性分析能力;(4)语义处理能力;(5)数据质量和数据管理技术。

2.2大数据分析系统的建设

根据大数据处理和分析的理念,煤矿安全大数据分析系统的建设目标包括:数据综合集成、安全知识集成、三维虚拟可视化展示、煤矿安全动态分析诊断。具体建设内容包括:(1)基于物联网/云计算技术的煤矿安全综合数据库。建设煤矿安全大数据分析诊断系统,首先要利用物联网和云计算技术实现综合的数据集成,将基础空间和属性数据、在线监测的实时性数据、专业业务系统的事务性数据综合集成起来,构建煤矿安全综合数据库。(2)基于专家系统的煤矿安全专家知识库。针对知识集成的目标,整理规范规程体系中的经验或者理论知识(煤矿安全规程、煤矿作业规程、三违行为知识、隐患界定知识、评估模型、设备操作规程知识、工种操作规程知识),构建煤矿安全动态分析诊断的专家知识库。(3)建设三维虚拟矿井可视化平台。针对信息和知识三维虚拟矿井可视化展示分析,主要的建设内容是基于高精度地质模型理论研究开发三维虚拟矿井平台,实现地层建模、钻孔建模、断层建模、工作面建模和巷道建模等工作。然后,基于三维虚拟矿井平台,实现数据和知识可视化、煤矿安全生产活动可视化、分析和决策过程可视化。(4)研发煤矿安全动态分析系统。针对基于专家知识库的煤矿安全生产分析决策,需要利用煤矿安全综合数据库中的基础数据、实时监测数据以及事务性数据,根据煤矿安全专家知识库进行煤矿安全生产状况评估、推理和演绎,动态分析诊断煤矿安全生产的现状与趋势、预测未来,并针对煤矿应急现象做出科学合理的响应对策。

3结语

物联网、云计算、大数据分析带来了新的数据处理和分析的视野[5],也必将影响煤矿企业的信息化建设,成为提升煤矿安全生产水平的核心信息技术手段。与互联网、电子商务、电信通信等行业相比,煤炭行业在这方面的发展稍稍晚一些。因此,煤矿科技研究工作者需要抓住时机,在大数据分析处理的研究和应用上付出更大努力,推动煤矿信息化建设发展。

作者:魏忠奎 袁传增 单位:山东能源枣矿集团田陈煤矿

大数据分析毕业论文:云计算环境下大数据分析论文

1大数据处理流程

基本的大数据的处理流程可以分成数据采集、数据处理与集成、数据分析和数据解释4个阶段。首先获取数据源的数据,因为在数据源端的数据包含各种各样的结构,需要使用某种方法将其进行预处理,使数据成为某种可以用一种算法分析的统一数据格式,接着需要找到这种数据分析的算法,将预处理过的数据进行算法特定的分析,并将分析的结果用可视化等手段呈现至用户端。

1.1数据采集

大数据的采集是整个流程的基础,随着互联网技术和应用的发展以及各种终端设备的普及,使得数据的生产者范围越来越大,数据的产量也越来越多,数据之间的关联也越来越复杂,这也是大数据中“大”的体现,所以需要提高数据采集速度和精度要求。

1.2数据处理与集成

数据的处理与集成主要是对前一步采集到的大量数据进行适当的预处理,包括格式化、去噪以及进一步集成存储。因为数据采集步骤采集到的数据各种各样,其数据结构也并不统一,不利于之后的数据分析,而且,一些数据属于无效数据,需要去除,否则会影响数据分析的精度和性,所以,需要将数据统一格式并且去除无效数据。通常会设计一些过滤器来完成这一任务。

1.3数据分析

在完成了数据的采集和处理后,需要对数据进行分析,因为在进行数据分析后才能体现所有大数据的重要价值。数据分析的对象是上一步数据的处理与集成后的统一格式数据,需要根据所需数据的应用需求和价值体现方向对这些原始样本数据进一步地处理和分析。现有的数据分析通常指采用数据仓库和数据挖掘工具对集中存储的数据进行分析,数据分析服务与传统数据分析的差别在于其面向的对象不是数据,而是数据服务。

1.4数据解释

数据解释是对大数据分析结果的解释与展现,在数据处理流程中,数据结果的解释步骤是大数据分析的用户直接面对成果的步骤,传统的数据显示方式是用文本形式体现的,但是,随着数据量的加大,其分析结果也更复杂,传统的数据显示方法已经不足以满足数据分析结果输出的需求,因此,数据分析企业会引入“数据可视化技术”作为数据解释方式。通过可视化结果分析,可以形象地向用户展示数据分析结果。

2云计算与大数据分析的关系

云计算是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源,是一种按使用量付费的模式。这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。目前,国内外已经有不少成熟的云计算的应用服务。数据分析是整个大数据处理流程里最核心的部分。数据分析是以数据的价值分析为目的的活动,而基于大数据的数据分析通常表现为对已获取的海量数据的分析,其数据来源可能是企业数据也可能是企业数据与互联网数据的融合。从目前的趋势来看,云计算是大数据的IT基础,是大数据分析的支撑平台,不断增长的数据量需要性能更高的数据分析平台承载。所以,云计算技术的不断发展可以为大数据分析提供更为灵活、迅速的部署方案,使得大数据分析的结果更加。另一方面,云计算的出现为大数据分析提供了扩展性更强,使用成本更低的存储资源和计算资源,使得中小企业也可以通过云计算来实现属于自己的大数据分析产品。大数据技术本身也是云计算技术的一种延伸。大数据技术涵盖了从数据的海量存储、处理到应用多方面的技术,包括海量分布式文件系统、并行计算框架、数据库、实时流数据处理以及智能分析技术,如模式识别、自然语言理解、应用知识库等等。但是,大数据分析要走向云计算还要赖于数据通信带宽的提高和云资源的建设,需要确保原始数据能迁移到云环境以及资源池可以随需弹性扩展。

3基于云计算环境的Hadoop

为了给大数据处理分析提供一个性能更高、性更好的平台,研究者基于MapReduce开发了一个基于云计算环境的开源平台Hadoop。Hadoop是一个以MapReduce算法为分布式计算框架,包括分布式文件系统(HDFS)、分布式数据库(Hbase、Cassandra)等功能模块在内的完整生态系统,已经成为当前流行的大数据处理平台,并被广泛认可和开发应用。基于Hadoop,用户可编写处理海量数据的分布式并行程序,并将其运行于由成百上千个节点组成的大规模计算机集群上。

4实例分析

本节以电信运营商为例,说明在云计算环境中基于Hadoop的大数据分析给大数据用户带来的价值。当前传统语音和短信业务量下滑,智能终端快速增长,移动互联网业务发展迅速,大数据分析可以为运营商带来新的机会,帮助运营商更好地转型。本文数据分析样本来自于某运营商的个人语音和数据业务清单,通过Hadoop2.6.0在Ubuntu12.04系统中模拟了一个大数据分析平台来处理获得的样本。希望通过对样本数据的分析与挖掘,掌握样本本身的一些信息。以上分析只是一些很基本的简单分析,实际上样本数据中所蕴含的价值要远远大于本文体现的。以上举例意在说明基于云计算的大数据分析可以在数据分析上体现出良好的性能,为企业带来更丰富更有效率的信息提取、分类,并从中获益。

5结束语

基于云计算的大数据分析已经成为解决大数据问题的主要手段,云计算环境中的大数据分析平台部署需要综合考虑硬件、网络、软件等各方面的集成,使大数据的海量信息积累体现价值,显示云计算的性能优势,而没有云计算技术的支撑也不能进行高效和的大数据处理分析。本文通过一个例子来分析了基于云计算的大数据分析给企业带来的价值,由此可见,大数据需要云计算技术的深入挖掘,同时也促进了云计算技术的不断发展。

作者:陈清金 张岩 陈存香 单位:联通云数据有限公司 中国联合网络通信集团有限公司

大数据分析毕业论文:远程大数据分析审计监督模式思考

随着信息化快速发展,审计信息化建设也不断完善,转变审计方式方法应是大势所趋,本文就远程大数据分析审计监督模式作些探讨。

一是要进行分级采集。国家审计署、地方各级审计机关要按照各自的审计管辖权,采集本级各部门单位的财政财务收支数据、业务数据、其他数据;在采集数据过程中,既要做到数据采集全覆盖,不论是收支数据,还是业务数据、其他数据,都应采集,应采尽采;不论是重点部门,还是一般单位,或是下属机构,都应采集,不留死角;又要做到数据采集定期性,要根据审计需求,定期采集本级各部门单位的财政财务收支数据、业务数据、其他数据;从而确保采集数据的性。

二是要进行规范转换。各级审计机关要针对统一采集的数据,根据国家审计署关于数据转换的技术要求,利用上级审计机关配发的数据转换软件或模块,围绕每个单位的各类数据,组织专人及时进行数据转换。在数据转换过程中,要做到:有现成转换软件或模块的,就应根据软件或模块实施转换;没有现成转换软件或模块的,就应采取联合攻关的形式,开发相应的数据转换软件或模块,然后进行数据转换。

三是要进行上报集中。地方各级审计机关要按照审计署规定的标准、方式和要求,将采取转换的数据逐级汇总上报。县级审计机关将本级数据上报市级审计机关,市级审计机关将本级数据及各县级审计机关上报数据汇总后,上报省级审计机关,省级审计机关将本级数据及各市级审计机关上报数据汇总后,上报国家审计署,实行统一集中管理。

一是要利用统计分析,搜索疑点。要建立统计分析模型,如回归分析、因子分析和判别分析等模型,对数据进行分类和预测。通过分类,挖掘出其数据的描述值,通过对被审计单位的大量财务或业务历史数据进行预测分析,得到其预测值;然后将描述值、预测值和审计值进行比较,帮助审计人员从中发现审计疑点,从而将其列为审计重点。

二是要利用关联分析,搜索疑点。通过利用关联规则,从被审计单位数据库的所有细节或事务中抽取频繁出现的事项,挖掘隐藏在数据间的相互关系,从而发现存在异常联系的数据项,如发现在财政、税务等各领域间,在部门单位上下级间、财务数据和业务数据间、各被审计单位与宏观经济运行系统间的数据异常关系,在此基础上通过进一步分析,发现审计疑点。

三是要利用比对分析,搜索疑点。要根据被审计单位可能出现的问题为导向,将可以比对的问题列出清单;针对问题清单,逐项确定比对方式,如有的利用被审计单位自身提供的两组或两组以上数据进行比对,有的利用被审计单位自身提供的数据与其他部门单位提供的数据进行比对;通过比对,发现审计疑点。

四是要利用逻辑分析,搜索疑点。要根据被审计单位可能出现的问题为导向,将可以进行逻辑分析的问题列出清单;针对问题清单,逐项确定逻辑分析的方式,如有的可用因果分析,有的可用投入产出分析,有的可用充要条件分析等,围绕每种逻辑分析方式,确定分析的流程模型,利用信息化技术进行操作,从而发现异常,得到审计疑点。

五是要利用程序性分析,搜索疑点。要根据被审计单位可能出现的问题为导向,将可以进行程序性分析的问题列出清单;针对问题清单,逐项确定程序性分析的方式,如有的可用法律法规规定的程序进行分析,有的可用政策、规范性文件、合同协议所确定的程序性条款进行分析,围绕每项程序性分析方式,确定分析的流程模型,利用信息化技术进行操作,从而发现异常,得到审计疑点。

六是要利用要素分析,搜索疑点。要根据法律法规的规定,在被审计单位可能出现的问题中,梳理出违反法律法规规定的问题,也即要素违反的问题,列出问题清单;围绕清单中的每一个问题,确定与法律法规核对的方式,通过该核对的方式,利用信息化技术进行操作,从而发现审计疑点。

一是要做好分级核查。上级审计机关在对集中上报数据进行分析后,要将发现的疑点列出清单,按疑点所对应的属地进行分类,并注明对应的事项,下发对应的各级审计机关,要求该审计机关及时进行核查,充分发挥远程分析、分级核查的优势。

二是要做好现场核实。各级审计机关在收到上级审计机关下发的疑点核查清单后,要迅速就此工作进行部署,安排审计人员按照清单内容与涉及对象见面,采取相应方法调查核对,并就此进行取证。

三是要做好汇总反映。各级审计机关在将疑点核查落实后,要将核查情况进行汇总;一方面,将汇总情况及时上报上级审计机关;另一方面,将查实后的疑点根据情况分类加以处理和利用。如有的纳入对应的专项审计进行反映处理,有的从疑点核实转入专项审计,进一步延伸审查;有的情况明了,可以直接作出审计处理,发出审计结果性文书。

大数据分析毕业论文:运用大数据分析推行审计全覆盖的主要做法和对策

利用大数据开展审计分析,推进财政联网审计已成为新时期审计工作的常态,为了做好这方面工作,来凤县审计局本着“先简单,再逐步深入”原则,力争通过2到3年的摸索,以项目审计实践培养数据分析人才,不断适应审计新常态,做出了积极的探索和实践。

(一)培训打基础。派人参加了省厅举办的大数据知识介绍和运用培训,全局审计人员还参加了省厅举办的大数据知识介绍和运用远程视频培训,使审计人员初步对大数据的内涵和运用有了一定的了解。结合审计实际,在局内举办了如何适应大数据时代的到来,如何运用大数据开展财政预算执行审计等知识的培训,进一步深化审计人员对大数据概念和运用的理解。

(二)建立数据库。从2015年10月起,用近4个月的时间,抽专人建起了数据库,集合了自2012年以来全县78个一级预算单位的部门预算收支备份数据和财政总预算会计数据、预算编制数据、国库集中支付数据、非税收入数据、基金预算收支数据,今年又集中了车辆管理、工商登记、地税征管、房产登记、2015年低保发放等方面的数据。还组织资金,购置了设备,建起专门开展项目审计的数据分析室。

(三)初步运用探路。在安居保障房工程审计中,运用房屋租赁信息、房产登记信息、车辆管理信息、工商登记信息以及纳税申报信息等数据进行关联比对分析,查出了保障房在动态管理中存在的一些问题,如不属于安置对象的分配了保障房,分配了保障房后又购买车辆的,分配了保障房后又购买商品房的等问题,根据查出的这些问题,及时责成县住建局立行整改。这也是该局运用大数据进行分析取得的初步成效。

(四)逐步扩大运用。在地税审计中,利用省厅下发的地税征缴备份数据进行了以下四个方面的分析尝试。一是将纳税登记与纳税申报进行关联比对,分析有多少比例没有纳税申报,揭示纳税管理上逃税、漏税行为。二是审查房地产企业少征漏征营业税和土地增值税,房地产企业进行房地产开发经营业务应缴纳的营业税和土地增值税计税依据一般应该一致,均应等于年度财务报表的营业收入,以房地产企业已缴纳入库的营业税和土地增值税为基础,比对此两税的计税依据与年度财务报表的营业收入是否一致。如果三者不一致,在没有正常原因的情况下,则有可能是相关税款未足额征收。三是通常来说,房产税或城镇土地使用税应同时缴纳。通过对"地税局2015年征收数据"表中所有征收记录按纳税人进行分类汇总,存在部分纳税人存在着只交房产税、或只交城镇土地使用税的疑点。四是对税收结构进行审查,分析各行业税收反推一二三产业对财政收入的贡献率,通过分析不同行业和一二三产业税收占比,找出产业发展上的差距,为县委、政府决策产业结构调整,加大招商引资力度,发展规模企业和培育税源提供参考依据和建议。

(五)做好财政联网适时动态监测审计。该局的财政联网系统起步于2010年,最初的两三年主要是用来采集财政数据。从2013年下半年开始试行财政联网动态监测。一是按照省审计厅和州审计局的规定动作要求,做好全年不少于四次联网审计工作,最多的次数是2014年该局每月开展一次联网审计,全年出具12期动态监测审计报告。二是在联网审计中,根据自己的能力,不贪多,每次确定一个或两个重点内容,如2011年至2015年,分别对会议费、滥发津补贴、资本支出、建设支出纳税情况、大额拨款到个人账户、三公经费增减情况,节日大额支出等方面以国库支付数据和会计摘要为基础,以查询筛选方式方法对全县所有预算部门单位进行动态监测,发现疑点后,对有问题的部门单位出具“财政联网审计动态监测问题联系单”进行核实,收到这些部门单位对核实情况的回复意见后,对属实的单位,下发整改意见书,同时上门督办或电话督办其整改到位。仅2015年及时期监测查出X镇财经所、X镇人民政府、县XX等12个单位违反规定发放奖金和补贴113260元,第二期监测查出县XX局、县XX局2个单位违规发放奖金16155元,第三期监测查出县XXX建设指挥部支付给施工单位的工程款少交税款100多万元。今年一季度的动态监测将公用经费支出作为监控重点,通过对国库支付数据进行监测,形成了对3个单位的疑点,分别包括“记账凭证摘要不规范”、“大额支付直达本单位个人账户”。根据监测结果出具了3份“财政联网审计动态监测问题联系单”,已分别送至各疑点单位,目前正在核实阶段。通过近几年的财政联网动态监测审计,积累了经验,摸索出了一些方式方法,提高了审计人员的技能。起到了审计全覆盖的作用,但在联网监控审计的深度方面还远远不够,还有潜力可挖。该局审计人员均达成共识,认为财政联网审计在当前审计资源和审计力量严重不足的情况下,是加大审计监督全覆盖的一种有效方式和方法。

(一)数据分析人才力量严重不足,难以胜任这两项工作。从该局的实际情况来看,2012年至2015年,先后选派8人参加了审计署和省厅举办的计算机中级培训,因专业性太强,加上参学的人员基础不强,只有1人取得审计署颁发的合格证。虽做了上述努力,但这方面人才仍然严重不足。

(二)任务太重,没有充裕的时间来保障数据分析和财政联网审计工作。基层审计人员除了参加精准扶贫和纪委组织的专项检查等各类活动外,平均每个项目的有效实施时间大概在20天左右,在此情况下,审计人员根本没有时间静下心来思考如何做好数据分析。本来做好了数据分析可以减少审计人员的工作量,但关键问题是一个基层局只有1人能勉强做分析这件事,而年青同志虽然会分析,会编写分析语句,但年青同志工作经验不足,又会造成他思路不

开阔,反过来又限制了他的能力发挥,而且从事数据分析的审计人员也不是专职的,其本人也和其他审计人员一样被安排有主审或协审任务。数据分析这种专业性较强的工作,对计算机运用、数据库知识和英语水平不高的人来说,没有几年下深功夫的学习和积累,是难已见成效的。根据近几年的实践,该局认为基层审计局很有必要成立 “计算机审计中心”或者叫做“数据分析中心”,组建一个3人左右的内设机构。根据上级文件要求,目前各县市正在组建“大数据中心”,一旦这个“大数据中心”建成了,对审计工作是有利用价值和促进作用的。为了保障满足审计监督全覆盖的要求,基层审计局有必要配备一名既懂数据分析又熟悉财经审计的专职人员来专门从事财政联网动态监测工作,其余2到3人主要是跟班对具体审计项目和审计组成员一起开展数据分析,同时其中一人兼任局网络管理员,负责局内网络和计算机小故障的维护。而且要求数据分析中心人员必须通过审计署的计算机中级培训。目前仅是依靠省厅计算机中心来对全省各地的数据开展分析,也不现实;依靠州审计局来对各县市数据开展分析,州局也暂不具备条件和力量。且每个县市的具体情况也不相同,毕竟各县市审计人员对本地的实际情况要更熟悉些。

基于上述认识,该局今年将新招录1名计算机专业的大学生,已得到县编委批准同意,另调入1名已经工作多年30多岁的学计算机专业的工作人员,手续正在办理之中。今年拟安排3人在下半年到北京参加计算机中级培训(其中1人属补考),2017年再计划选送1到2人参加北京审计署计算机中级培训。估计等这几人都培训合格,再经过一两年的跟班实践和强化训练,相对满足现阶段审计工作对大数据分析和财政联网审计的要求。同时也为培养复合型人才打下坚实基础。

大数据分析毕业论文:面向糖尿病的临床大数据分析研究和应用

1.1 研究背景及意义

近年来,一方面数据仓库技术以及海量存储设备的快速发展使得收集海量数据的能力得到质的提升,预示着大数据的时代已经到来;另一方面,随着各大医院信息化建设进程的不断推进,医院中的各生产系统如 HIS(医院信息化系统)、LIS(实验室检验科信息系统)、EMR(电子病历系统)等已经积累了规模庞大的临床数据。公共的医疗资源服务日渐紧张,如何利用好收集存储的海量数据,成为数据手机存储价值的重要标志。在此背景下,面向医疗大数据的数据分析与挖掘技术也应运而生,并得到了快速的发展,智能医疗决策系统也因此应运而生。这种数据包含了许多隐藏的知识等待被挖掘,对于辅助诊疗、提升临床医疗质量具有很大的价值。 糖尿病作为一种慢性病,治疗周期长,容易引发多种并发症如肾病、眼病,病情反复等特点。糖尿病患者在治疗过程中,会产生大量的临床数据包括就诊信息、实验室检验、临床诊断信息和医嘱用药信息。这些临床数据隐藏着许多有关糖尿病诊断及治疗的规律,对于掌握糖尿病发病与治疗效果的预测有着重要的意义。 通过对糖尿病临床数据的多维分析,从选择待分析的主题出发,进行对应主题的维度和粒度的设计、事实表和维表的设计,采用星型模型构造主题逻辑视图,生成针对主题的多维立方体。在此基础上,利用多维分析的上卷、下钻、切片、切块等操作实现糖尿病数据的多方位展示,从而揭露数据隐含的患者群体特征、病情的变化趋势、药物疗效等关键信息。

..........

1.2 国内外研究现状

基于当前高速发展的数据处理技术,以及硬件设备的迅速更新换代,使得我们越来越有条件收集数据量巨大的数据,做好数据存储工作。面临存储的海量数据,怎么使用这些数据成为了医疗大数据领域专家学者探索的热点课题。 现有的工作主要集中在使用医疗数据对患者进行聚类和分类研究[1-3]、疾病复发与基本指标之间的关联分析[4-6]以及一些中西药常用的药对组合,用药规律等的发现。这对这些数据可以发现,目前的主要研究工作从以下几个方面展开: 1) 针对高风险人群的难以预测的问题,构建患者的分类模型,以及分析一些影响发病的相关因素 2) 针对疾病之间可能存在的关系的关联分析 3) 发现发病规律,并应于辅助诊断,生成决策树 经过查阅相关资料和调研分析,得出目前主要的医疗大数据分析研究的方向和一些难点列举如表 1-1:

..........

第二章 相关技术介绍

本章主要介绍本文用到的相关技术。首先介绍了数据挖掘的概念和 OLAP 技术,然后针对数据挖掘中的时序挖掘进行了介绍,如时间序列规整和关联分析。介绍了 SAP BO 可视化技术。

2.1 OLAP 与数据挖掘

大数据常常是由结构复杂、数据量巨大、类型众多的数据构成的数据集合。为了发掘这些数据背后隐藏的知识,常有多种方法,本节介绍 OLAP 技术和数据挖掘技术。

2.1.1 OLAP 技术

1993 年,E.F.eodd 在“Providing OLAP to User-Analysis”中首次提出了联机分析处理(Online Analytical Processing,OLAP)的概念,他认为 OLTP(联机事务处理)己不能满足终端用户对数据库查询分析的需求,使用 SQL 对大型数据库进行的简单查询也不能满足终端用户决策分析的要求。因此,EF.Codd 提出了多维数据库和多维分析的概念,即 OLAP。 OLAP(联机分析处理),联机进行数据访问和统计分析,共享多维信息,是一种建立在事务操作之上的逻辑步骤,分析决策的能力强大,能够为决策管理人员提供更加复杂的数据分析能力,通过分析相关数据发现数据变化的特征、规律、趋势以及一些潜藏的重要信息。 分析决策人员在分析决策过程中,往往都需要通过多角度、多层次的方式来立体的观察某些属性之间的关系。如医生想要知道今年年龄在 50-59 岁区间内,上海市各个区的男女患者的分布情况时,这个时候就要综合考虑临床诊断情况、地区、性别和年龄等多个维度的信息,这些供分析决策使用的数据都是多维数据。 多维数据被具体的看成是一个立方体,包括维度信息(Dimension)和度量值(Measure)。维度就是观察数据的角度。度量值是指衡量数据的指标值。如糖尿病患者基本信息主题,就包括性别、年龄、地区、妊娠情况等维度,也可以从各年龄段占比,性别占比等度量方式具体观察。因此,在多维分析时,对事实表、维度、维度的层次、维度的成员、度量值等的概念的理解与掌握非常重要。

........

2.2 时序挖掘

频繁模式的发现始于1993年Agrawal等学者提出的关联规则的发现研究[17],也一直是数据挖掘分析领域中的一个重要的研究课题。自从 Agrawal 等学者提出了关联规则挖掘问题以来,诸多的学者对关联规则挖掘课题进行了大量的研究,得出了很多高效的算法,然而 大多数方法都未考虑时间因素的影响。但在现实世界中,时间是数据本身固有的因素,在数据中常常会发现时序语义问题。时序数据的出现使得有必要在数据挖掘中 考虑时间因素,在现实中,附加上某种时序约束的规则将可以更好地描述客观现实情况,因而也会更有价值,称这样的规则为时序关联规则。时序关联规则挖掘研究[18]一文中提出了多时间粒度的时间规准,如年、月、日等多粒度时间维度表示的方法。非同步多时间序列中频繁模式的发现算法[19]一文中,提出了针对多个序列之间时间不同步的问题,利用线性化分段表示和矢量形态聚类实现时间序列的特征分割与符号化转换的思想。另外在时序挖掘时,常常是对时间序列的某一个子序列进行挖掘,在时间序列相似性问题中滑动窗口的确定[20]一文中,提出了滑动窗口在时间序列相似性降维技术的应用。 时序表达,在做时序挖掘时,常常需要先对事件做时序表达,构建事件序列。在构建事件序列时,就需要使用事件之间的相似性,进行时间规整,最常用的时间规整有两种,欧氏距离[21]和动态时间规整两种方式。

大数据分析毕业论文:大数据分析邮政客户营销创新发展

摘要:文章介绍了国内外大数据应用案例及邮政大数据应用现状,分析了大数据分析在客户综合营销中的应用,并从体制机制、实施路线和保障措施等方面提出了邮政大数据战略的发展路线。

关键词:大数据;客户营销;创新;机制;生态圈

随着云计算、物联网的高速发展,世界正迈向崭新的大数据时代。中国邮政作为多主体、多领域经营的大型网络企业,如何利用大数据分析高效率地实现客户营销,实现各板块创新协同发展,是企业长远发展的重大课题。

1大数据驱动企业创新发展的调查研究

1.1国内外大数据应用案例分析

1.1.1阿里巴巴的企业核心数据战略2005年,阿里巴巴开发出淘数据供内部运营人员使用;2011年开发出数据魔方供外部淘宝商家使用;2012年公布三步走发展战略,即平台战略、金融战略、数据战略。以金融业务模式为例,阿里金融建立了一套网络数据模型和信用体系,贷款不需要抵押品和担保,仅依赖于海量的客户信用数据和行为数据,企业即可迅速获得贷款。阿里金融的大数据应用和业务创新,变革了传统的商业模式,给传统银行带来挑战。在数据战略中,阿里巴巴欲打造一个由数据生产者、消费者、加工者和服务应用供应商组成的生态系统。阿里云计算的开放数据处理服务产品平台是阿里巴巴的大数据处理平台,小微金服、数据魔方、高德等业务都已上线,对内对外提供数据仓库、数据挖掘和其他数据应用服务。1.1.2平安集团以数据整合驱动板块联动平安集团建设了万里通数据平台,成立了融合业务与技术于一体的数据团队,打通了各个板块的系统,实现了以客户为中心的数据整合和精准营销,客户迁徙战略成功实现,以保险板块的优势拉动了银行、投资业务发展。在实施过程中,通过开放万里通注册用户在各个线上线下零售平台消费时产生的积分通折、通用,激活了医、食、住、行、玩的大量实时消费数据。在此基础上,成功实施了集团客户、银行小微客户等客户群的精准服务战略,将7000万左右的高质量保险个人客户成功吸引到平安金融和平安投资,实现了一个客户、一个账户、多个产品、一站式服务,为平安集团创造了新的增长极。1.1.3�亚马逊以大数据驱动业务发展亚马逊是首个将大数据从电子商务平台推广到电子商务物流平台的企业,各类业务已经完成了数据化,实现了从浏览、支付、仓储、配送和客户服务全链条的大数据应用。以数据驱动为基础,促进电子商务云、物流服务云、信息服务云、产品定制等各板块的业务联动,并由此不断融合创新服务模式。亚马逊云计算服务已发展为对外开放服务的盈利来源,由此产生的用户兴趣数据、需求数据、行为模式数据反过来对公司的其他业务给予了更大支持,其数据业务化的进程已经顺利起步。

1.2邮政大数据分析应用现状及存在问题

1.2.1邮政大数据分析的应用现状邮政大数据分析总体起步较晚,2010年邮政储蓄银行成立总行数据分析团队,2015年12月大数据平台一期工程上线,已接入行内28个重要业务系统的数据,同时积极引进行外非结构化数据,数据规模和计算能力都大幅度提高。邮政集团公司的大数据平台目前也在筹划建设中。邮政大数据在总体上处于各板块独立建设和应用初级阶段,对客户营销的关注和应用较少。1.2.2邮政大数据分析存在的问题目前邮政在各板块数据整合、共享使用等方面还存在许多问题。一是信息孤岛问题突出。各板块之间信息系统相对独立、相互隔离,数据管理分别由各板块科技部门负责,在技术、管理层面解决该问题的方法尚不清晰。二是缺乏数据统一规划,大数据整合存在困难。在系统建设时对客户分析所需的价值字段的规划意识和规划能力不强,数据要实现系统规划、质量标准、编码规则、系统接口、交换平台五个统一,任重而道远。三是数据资源有待完善,数据治理的任务艰巨。数据资源不丰富,不能描述客户行为和环境,不足以支撑真正意义上的大数据分析;同时客户数据质量不高,数据的时效性、完整性、一致性不足。四是数据分析方法亟需加强和完善。数据特征转换、分析假设合理性、模型适用性以及数据分析模型库等,有待时间检验。对客户行为分析的实时性、性等需求不能满足,对业务的支撑能力有限。五是大数据分析人才缺乏,人力资源不足。尤其是缺乏既掌握大数据技术又具有良好业务理解能力的复合型领军人才,缺乏融合管理、业务和技术于一体的专业数据分析团队,业务与技术之间的沟通成本较高,效率较低。六是大数据应用体制、运行机制不完善。跨板块、跨层级的客户营销数据应用困难,时效性差,省级机构数据分析能力对业务发展支撑不足。七是大数据安全风险防控与使用高效的矛盾有待妥善解决。科技风险和数据安全已经纳入风险管理体系,但在保护数据安全、满足行业监管要求的前提下,不断提高数据资源使用效率的能力不足。

2大数据分析在客户综合营销中的应用研究

当前邮政各级经营主体更多地看重单个营销活动及近期效果,各板块、各条线、各专业都主要以自我视角开展独立营销,数据在各板块基本没有整合应用,不能综合运用企业内部各种数据资源及分析结果,不能实现综合发力、精准发力,未体现以客户为中心的整体营销能力,造成营销成本高、效率低,客户体验差。现代企业集团的竞争,归根到底是整个系统和整体合力的竞争,亟待邮政各板块和条线充分整合利用大数据资源,转变营销和服务方式。

2.1客户画像分类

客户画像是根据用户社会属性、生活习惯和消费行为等信息数据抽象出的一个标签化的用户模型。构建用户画像的核心工作是通过整合用户数据,通过聚类分析等信息技术处理过程,高度精炼形成特征标识,细分出特征明显、规律一致的客群,即给用户贴标签,从而为客户行为预测打下基础。多样性客户信息的获取,除邮政自身拥有的客户人口特征数据、交易数据、多业务板块的交互数据外,需要在保障数据质量的前提下,适当引入社交媒体、电子商务平台、运营商和政府数据等外部数据,以获取更多的客户消费、社交和生活信息。根据客户分群目的和数量的不同,可按战略、策略、战术和个体进行多维度客户分群。战略分群以客户价值、客户生命周期,辅以地域维度进行划分。策略分群基于行业经验和业务分析经验划分,例如客群、信用卡客群等。战术分群基于聚类及客户标签库,针对特定的营销活动或具体业务场景专门划分,如沉默存款群、成熟高端投资群等。个体分群主要针对个人进行特征归集和标签化。

2.2客户行为预测

客户行为预测的核心是运用大数据模拟实境,将客户模型放在由其数据揭示的生产环境、生活环境、社交环境和竞争环境的动态中,得到客户行为和客户服务需求的概然性预测,为适时向客户进行精准营销、推荐和引导服务产品提供依据(见图1)。要做到较的预测,必须具备三个条件:高质量的大量活跃数据,多层面、多方位的用户画像,可验证的分析模型库。因此,必须补充相应的客户活动空间和时间、社会热点、社交网络、流行趋势、市场环境等大量鲜活的数据表述。

2.3客户服务产品定制

邮政企业一方面需要通过大数据认识和发现客户和需求,从而撮合现有产品和现有需求,达成交易;另一方面还需要通过大数据分析挖掘潜在客户和潜在需求,从而设计对客户感知价值更高的产品,甚至在客户认识到自己真实需求之前创造需求,创造产品,在客户需求外化之前做好服务准备。大数据能发现客户的兴趣偏好、渠道偏好等行为特征和价值,在规则引擎的实时触发作用下,相应的触点就能即时捕捉到机会,触发完成相应的动作,开展个性化的精准服务与营销,做到应时应景、正中客户下怀,对于提高营销效率和客户感知价值的意义巨大。同时,必须建立以客户为中心的服务模式,搭建起客户多层次需求与邮政丰富产品之间的桥梁,使得客户在各个服务界面均能获得流程标准化、内容定制化、服务精准化的高水平服务。

2.4客户服务风险评价

客户信用风险评价是金融企业健康持续经营的关键。在贷款前台营销风险控制中,利用大数据的历史数据模型和显著性分析,重点对企业违约特征信息进行有效筛选,指导前台营销。同时,在对借款企业授信的过程中,可以更有效地把控企业风险总额。在贷后风险监测与预警时,要利用大数据分析对借款企业账户信息、资金流向、关联方信息、网络信息、政府部门公开信息进行深度挖掘,尽量还原企业经营风险状态,前瞻性地动态监测借款企业的信用风险。在客户信用风险的系统控制中,必须依赖大数据分析处理借款企业的海量信息数据,整合多条线、多系统之间的碎片化信息,将原本分割的银行前中后台信息进行有效整合,将客户风险放在大数据表达的变化环境中予以考察分析。

2.5客户体验设计

根据大数据对客户的分析,通过定制客户敏感度高的服务策略和措施,设计良好的客户体验模式(见图2),提高客户的感知价值,从而以较低代价创造较大的客户满意度。在针对具体客群和具体客户的服务策略指导下,通过与客户的每一次接触,在售前传递服务价值的吸引力和目标信息,在售中和售后等各个阶段制定个性化服务措施,有目的地创造对企业品牌的正面体验,促进常规客户群向品质客户群转化。同时识别客户的异常行为,建立重点监控客户群,防止高价值客户流失,提升客户粘度。

2.6社会电子商务客群营销综合化服务案例研究

通过利用大数据对社会电子商务市场主体进行客户画像和战略分群,在原有市场主体中发现了新的潜在客户群体——互联网品牌商,如韩都衣舍、红领、三只松鼠等。他们的典型客户特征可以概括为:品牌通过互联网确立并实现发展;以产品设计与品牌管理、供应链控制作为企业的核心能力,大量服务外包;销售规模较大并全部或主要采用互联网渠道销售;形成有足够规模的粉丝群;对上下游企业有较强吸引力(详见图3)。这一客群的需求与邮政的优势产品相互匹配。在满足金融需求方面,邮政可以提供融资租赁、银行贷款及担保、供应链资金流转服务。在满足物流需求方面,邮政可以提供原材料转运、成品配发、零售寄递等服务。在满足技术需求方面,可以提供物流配送中心建设、仓储配发系统集成以及相应的技术装备等。通过大数据针对该客群内单一客户的关键时点与关键需求进行分析,可以制定客户在各自发展阶段更加敏感的服务策略,由金融、速递物流、物流科技的任意板块切入该客户,形成单点突破;在此基础上实现对内板块信息共享,对外服务产品推介,实现由单点突破到板块扩展,为客户提供综合化、一体化、低成本的服务,对客户形成接口统一的综合服务,在邮政内部形成金融、寄递、科技各板块创新协同发展的模式。由于品牌制造商在产业链中占据龙头位置,通过邮政的品质服务,可将其转化为行业示范客户,带动邮政在相应的原材料供应商、制造工厂群等整条产业链上的继续拓展,实现邮政在产业链两端的价值延伸。此外,通过对互联网品牌商的产业链环境数据进行分析,可以更加真实地掌握企业的经营状况,做出既贴近实际情况、又具有前瞻性的的风险评价。

3邮政大数据战略发展路线

3.1邮政大数据分析的战略目标

邮政大数据的战略目标,是以建设中国邮政大数据平台为契机,综合管理三大板块数据资源,适当引进外部数据资源,构建统一的数据模型和管理模式,形成大数据感知、管理、分析与应用服务的新一代信息技术架构和良性增益的闭环生态系统,逐步形成围绕中国邮政主营业务的大数据生态圈,对内对外提供数据服务,实现服务支持、风险管控、流程优化、交叉营销、产品创新、决策支持的创新发展,为邮政“一体两翼”的发展提供新的动力。

3.2邮政大数据分析的实施路线

根据邮政现状,借鉴其他企业大数据应用的经验,从目前各板块数据分散状态,到最终实现邮政集团大数据生态圈的目标,建议分以下三步走,如图4所示。及时步,在各板块内部进行大数据平台建设,实现板块内的数据分析使用;第二步,进行集团层面的大数据平台建设,逐步推进各板块间的数据整合,实现集团层面的数据分析;第三步,在集团数据整合分析的基础上,对数据运营方式进一步挖掘,推动一切数据业务化,最终实现数据的聚合分享,建立邮政集团大数据生态圈。

3.3邮政大数据战略的机制体制设计

在邮政大数据生态圈的建设过程中,需要建立完善的机制,保障系统建设的顺利实施和数据的有效使用。将大数据上升为集团战略,顶层设计、逐步推进。在邮政信息化建设规划方面,将大数据建设纳入顶层设计,信息化建设要遵循统一的数据规划和数据标准,以实现数据共享。构建跨接三大板块的集团级数据分析中心,负责集团大数据分析和大数据平台的管理工作,降低板块间沟通成本,提高大数据分析和应用效率,为业务发展提供数据支持。加强数据分析人才培养,培养既理解业务逻辑又懂数据分析技术的复合型领军人才,整合一批市场营销、业务运营、数据分析、系统开发的内部专才,聚合一批经验丰富的外部专家资源,构建一支强有力的数据分析人才梯队。完善集团各板块协同发展机制,建立起各板块数据共享、信息共享、利益共享的机制,为客户提供邮政综合产品服务,共同提升邮政品牌的核心竞争力。完善大数据管理流程,包括大数据平台的管理和数据分析、数据使用工作的管理,明确跨板块的数据接入流程、数据交换服务的申请审批流程,统筹总部基础性、平台性工作和各地个性化、差异化需求的关系,集团公司层面制定相应的制度规范和技术规范,各省层面做好数据质量保障工作,为业务部门提供便捷高效的数据分析结果。

3.4邮政大数据战略的保障措施

3.4.1技术保障建设集团层面统一的大数据平台,为集团内数据共享提供保障,以大数据平台贯穿联通各信息孤岛,激活历史数据价值。信息化系统建设需要统一规划,要围绕客户服务和客户分析所需的高价值字段进行有意识地设计。数据资源管理在量的方面要扩大数据来源,丰富数据类型,形成围绕客户的数据覆盖;在质的方面要建立邮政数据治理体系,保障数据的时效性、完整性、规范性和一致性。建设科学的数据特征归纳方法和分析模型库,数据特征转换、分析假设合理性、模型适用性等要通过实践和闭环反馈不断完善和补充。3.4.2数据安全数据安全是集团大数据平台运营中的一个重要保障,需建立起平台服务管理规范、数据安全管理规范和系统安全运维规范,要在物理层、数据接入层、数据资源层、平台服务层、用户接入层防止数据丢失和泄露,确保数据安全。3.4.3数据伦理大数据的数据伦理在数据权属与使用、个人或公众隐私方面愈发受到重视,必须提前规划,妥善掌控,牢牢把握数据分级管理这一关键。一是在数据挖掘时必须坚持目的先行,秉承善意性原则,既要有益又要有用。二是数据时必须坚持自主性原则,实现文责自负;三是坚持公正性原则,实现客观公平;四是坚持审慎性原则,实现传责自负。

4结论

中国邮政是一家集金融、物流、保险、证券、电子商务等业务于一体的多元化大型企业,构建中国邮政大数据生态圈,通过客户画像和客户数据行为预测,在邮政客户服务的产品定制、体验维护和风险评价领域综合应用,推动客户营销的创新发展,打造邮政创新发展的新动力,助力企业转型升级,落实“一体两翼”战略落地,不断提升企业核心竞争力。

作者:王志刚 罗亚平 谢峰 罗庆来 张晨 赵验昌

大数据分析毕业论文:应用型计算机专业大数据分析

摘要:分析了大数据产业的社会需求、学生就业需求、实践学习需求,提出了高等院校大数据课程开设的必要性。针对目前实践教学的需要,从应用型本科院校的实际情况出发,探讨了大数据分析实验室建设的目标,以及大数据实验室建设的3大具体内容,提出了基于教学科研一体化的实验室建设“三步走”方案,为教学和科研提供有力支持。

关键词:实验室建设;计算机专业;大数据分析

“十二五”期间,我国信息产业迅速扩大、信息技术快速发展、互联网经济日益繁荣,并积累了丰富的数据资源,比如面向公众的政府网站达8.4万个、智慧城市试点近300个、网民数量超过7亿、移动电话用户突破13亿等[1];技术创新取得了明显突破,应用势头良好,电信、金融、交通等行业利用已积累的数据资源,积极探索行业大数据的应用和行业服务优化;为“十三五”时期我国大数据产业快速发展奠定了坚实基础。目前,大数据在电子商务、金融、物流、电信、医疗、教育、智慧城市等领域的应用蓬勃兴起[2-4],产业发展如火如荼,以Hadoop、Spark等开源技术为代表的技术发展日新月异[5]。由于大数据技术属于近几年的新兴技术,目前部分高校缺乏高层次的大数据技术专业人才培养的课程体系和师资队伍;同时,大数据不仅是停留在课堂教学层面上的技术知识,更是需要在实践中学习的一项技能,因此为师生提供一个大数据实践教学平台势在必行。

1大数据分析实验室建设的必要性分析

1.1大数据社会产业需求分析

“十三五”时期是我国建成小康社会的决胜阶段,是新旧动能转换的关键时期,也是全球新一代信息产业处于加速变革期,以及国内市场需求处于持续增长期。我国大数据产业面临重要的发展机遇,抓住这一机遇,推动大数据产业发展,对提升政府治理能力、优化民生公共服务、促进经济转型和创新发展有重大意义[1]。随着新一代信息技术的迅猛发展,互联网与社会各领域、各行业交融、交汇日益深化,一个以大规模产生、分享和应用数据为特征的大数据时代已经到来。2014年是进入大数据应用市场的快速增长期,同比增长80%以上,2015年后进入平稳增长阶段,预计2018年全球大数据市场规模将达到超过2500亿元,2015—2018年的增长率为21.8%,我国大数据市场规模将超过500亿元,增长率为47.0%,是全球增长率的2.2倍[6]。

1.2学生大数据就业需求分析

目前,大数据在各个行业都得到了充分的重视,也急需大数据方面的人才。大数据人才是一个非常宽泛的概念,根据具体从事岗位不同,技能要求也会不同。从大数据岗位和技能需求的角度来划分,大数据人才分为3类[7]:及时类是数据分析师,要求熟悉大数据的概念和原理,具有一定的数理和统计学知识,能够熟练操作和使用数据软件和工具,是从事大数据的初级人员;第二类是数据工程师,能够开发和搭建数据平台和应用,并且熟悉数据挖掘的流程和原理,为大数据技术应用在各个领域提供解决方案,要求具有软件开发和数据分析的能力;第三类是数据科学家,要求熟悉各种大数据技术的原理和相对的优劣势,合理利用各种技术来设计大数据平台的架构,根据数据挖掘的使用需求和商业理解来设计和开发算法,是对数学、统计学、机器学习等多方面知识的综合掌控的复合型人才,也是大数据分析的高级人才。大数据人才在“领英”(linkedin)和“玻璃门”(glassdoor)等人力资源和招聘网站上,长期处于供不应求的状态。麦肯锡咨询研究指出,到2018年仅在美国,大数据人才短缺就达到50%~60%。今日美国和彭博社等媒体一致认为,大数据人才短缺的问题短期内只会加剧而不会缓解[7]。如何从纷繁复杂的海量数据中提取有用的信息,变数据为财富,挖掘数据中的金矿,提升企业竞争力以及提高企业风险管理水平,是当前企业和院校教育工作的重要课题。

1.3学生理论学习与实践相结合

院校开设大数据相关课程,涉及到的课程内容有数据分析、数据挖掘、编程语言、机器学习等,这些课程均需要学生具备很强的实践动手能力,如果只是停留在理论知识上,学生也只能纸上谈兵。因此,学校在开设大数据课程时,只有为学生提供配套的实践课程,才能真正达到学以致用的目的[8-9]。建设大数据分析实验室,从学生学习角度来讲,迫切性和必要性主要在于以下几点:及时,加强学生对知识的吸收与应用,萌发学生的创新精神,激发学生的学习动力,在实践中,通过有趣并结合实际的案例,提高学生的兴趣和分析问题的能力;第二,有利于提高学生解决问题的实践能力,通过实验室模拟环境,使学生能够将理论知识用于解决实际问题;第三,增强学生的社会适应性与竞争力,通过实际案例及应用场境,使学生毕业后能够很快融入行业环境,掌握和具备相应的技能。

2大数据分析实验室建设目标与建设内容

大数据分析实验室的建设,应最终为该专业人才培养方案中相应的课程服务,而人才培养方案的制订,应该从社会需求和学生实际需要着手[10],考虑学生学习基础,不能盲目追求高大上。我校为应用型本科院校,注重培养学生的实践动手能力,因此培养方案中课程的制定,也更注重实践部分。对于大数据技术方面,我们侧重于大数据的分析和挖掘,以及大数据技术和应用。课程方面,先从大数据分析和挖掘、大数据技术及应用等相关内容入手,使学生具备数据分析、数据挖掘的基本能力和大数据技术的基本原理,以及应用系统开发的能力。因而大数据实验室的建设,也将从数据分析挖掘算法、Hadoop生态系统及开发2方面进行建设。大数据分析实验室集硬件服务器、云计算技术、大数据技术于一身,便于计算机相关专业开设大数据教学课程。实验室的建设内容将包含以下3方面内容:(1)实验室硬件平台建设:为保障实验环境的整体搭建,需在现有实验室基础设备基础上,配备必要的服务器环境、网络环境,为搭建大数据分析实验教学平台,提供硬件支撑环境。(2)实验教学平台建设:充分利用现有硬件资源,通过Vmware等虚拟化技术构建云中心的资源池,将云存储资源、服务器资源和网络资源整合,在云平台上搭建统一的大数据分析与挖掘和大数据技术及应用的实验课程所需的实验平台。(3)课程资源建设:根据培养方案,开设大数据分析与挖掘、大数据技术及应用2门专业必修课程。为确保理论与实践的紧密结合,培养学生知识应用能力,积累工程项目经验,需要增设以上理论课程的配套实验课。

3大数据分析实验室实施方案

3.1大数据分析实验室建设思路

大数据实验室的建设是一个系统工程,主要服务于学生学习、教师教学;为了充分发挥大数据实验室的功效和作用,可以增加一项增值服务,即在满足学习和教学的基础上,进一步为教师和学生提供科研服务,使得教师可在该平台上进行科学研究和实验,进而反哺教学(见图1)。

3.2大数据分析实验室建设

实验室建设分3步走:(1)为满足教学的迫切需求,首先建设大数据分析教学平台,以及必要的软硬件支撑,如课程资源,可以是真实数据,也可以是模拟数据。在该平台之上建设数据挖掘分析平台和大数据开发教学平台,满足课堂教与学的需求。(2)沙盘模拟系统建设。为了积累更多的行业数据,更好地体现大数据的特性,需要建设沙盘模拟系统,更好地服务于大数据分析和大数据挖掘相关功能的实现和操作。(3)服务科研的高级应用。通过校企合作[11],引入企业实际工程项目,随着系统的完善和数据的积累,教师和学生可以在该平台上进行其他行业的科学研究和算法优化等工作,一方面服务企业,另一方面也可不断服务创新。

4结语

建设大数据分析实验室,不但可以满足教学的需求,而且可以提高学生的工程意识、工程素质和工程实践能力,解决理论知识与企业实际需求相脱节的矛盾,培养能快速适应企业技术环境和需求的工程技术人才[12]。同时,需进一步开展校企合作,加强人才培养,以企业需求为导向,以实际工程为背景,以工程技术为人才培养主线,将高校的资源优势和企业的技术优势相结合,建设一个符合专业人才培养要求的、能够支持实践教学和科研的、具备一定前瞻性的、能够统一管理和维护的实训基地,是提高人才培养水平、提升师资队伍能力、增强学生就业率的有效举措。

作者:李晓丹 刘云翔 王浩 原鑫鑫 徐琛 单位:上海应用技术大学 计算机科学与信息工程学院

大数据分析毕业论文:大数据分析时代对市场营销的影响

【摘要】首先梳理了大数据时展的历程,表明目前已经进入到数据3.0时代,接着解析数据3.0时代是消费者成为主宰的时代,更是企业精准营销的时代,以京东为例,窥探了大数据在企业中的运用并给出新时展策略,以期给现有中小企业转型提供参考依据。

【关键词】大数据;大数据营销;京东

一、数据分析时代演变历程

(一)数据1.0时代

数据分析出现在新的计算技术实现以后,分析1.0时代又称为商业智能时代。它通过客观分析和深入理解商业现象,取缔在决策中仅凭直觉和过时的市场调研报告,帮助管理者理性化和较大化依据事实作出决策。首次在计算机的帮助下将生产、客户交互、市场等数据录入数据库并且整合分析。但是由于发展的局限性对数据的使用更多的是准备数据,很少时间用在分析数据上。

(二)数据2.0时代

2.0时代开始于2005年,与分析1.0要求的公司能力不同,新时达要求数量分析师具备超强的分析数据能力,数据也不是只来源于公司内部,更多的来自公司外部、互联网、传感器和各种公开的数据。比如领英公司,充分运用数据分析抢占先机,开发出令人印象深刻的数据服务。

(三)数据3.0时代

又称为富化数据的产品时代。分析3.0时代来临的标准是各行业大公司纷纷介入。公司可以很好的分析数据,指导合适的商业决策。但是必须承认,随着数据的越来越大,更新速度越来越快,在带来发展机遇的同时,也带来诸多挑战。如何商业化地利用这次变革是亟待面对的课题。

二、大数据营销的本质

随着顾客主导逻辑时代的到来以及互联网电商等多渠道购物方式的出现,顾客角色和需求发生了转变,世界正在被感知化、互联化和智能化。大数据时代的到来,个人的行为不仅能够被量化搜集、预测,而且顾客的个人观点很可能改变商业世界和社会的运行。由此,一个个性化顾客主导商业需求的时代已然到来,大数据冲击下,市场营销引领的企业变革初见端倪。

(一)大数据时代消费者成为市场营销的主宰者

传统的市场营销过程是通过市场调研,采集目前市场的信息帮助企业研发、生产、营销和推广。但是在大数据以及社会化媒体盛行的今天,这种营销模式便黯然失色。今天的消费者已然成为了市场营销的主宰者,他们会主动搜寻商品信息,货比三家,严格筛选。他们由之前的注重使用价值到更加注重消费整个过程中的体验价值和情境价值。甚至企业品牌形象的塑造也不再是企业单一宣传,虚拟社区以及购物网站等的口碑开始影响消费者的购买行为。更有甚者,消费者通过在社交媒体等渠道表达个人的需求已经成为影响企业产品设计、研发、生产和销售的重要因素。

(二)大数据时代企业精准营销成为可能

在大数据时代下,技术的发展大大超过了企业的想象。搜集非结构化的信息已经成为一种可能,大数据不单单仅能了解细分市场的可能,更通过真正个性化洞察到每个顾客。通过数据的挖掘和深入分析,企业可以掌握有价值的信息帮助企业发现顾客思维模式、消费行为模式。尤其在今天顾客为了彰显个性,有着独特的消费倾向。相对于忠诚于某个品牌,顾客更忠诚与给自己的定位。如果企业的品牌不能较大化地实现客户价值,那么即使是再惠顾也难以保障顾客的持续性。并且,企业不能奢望对顾客进行归类,因为每个顾客的需求都有差别。正是如此,大数据分析才能更好地把握顾客的消费行为和偏好,为企业精准营销出谋划策。

(三)大数据时代企业营销理念———“充分以顾客为中心创造价值”

传统的营销和战略的观点认为,大规模生产意味着标准化生产方式,无个性化可言。定制化生产意味着个性化生产,但是只是小规模定制。说到底,大规模生产与定制化无法结合。但是在今天,大数据分析的营销和销售解决的是大规模生产和顾客个性化需求之间的矛盾。使大企业拥有传统小便利店的一对一顾客关系管理,以即时工具和个性化推荐使得大企业实现与顾客的实时沟通等。

三、基于数据营销案例研究

———京东京东是较大的自营式电商企业。其中的京东商城,涵盖服装、化妆品、日用品、生鲜、电脑数码等多个品类。在整个手机零售商行业里,京东无论是在销售额还是销售量都占到市场份额一半的规模。之所以占据这样的优势地位,得益于大数据的应用,即京东的JDPhone的计划。JDPhone计划是依据京东的大数据和综合服务的能力,以用户为中心整合产业链的品质资源并联合厂商打造用户期待的产品和服务体验。京东在销售的过程中,通过对大数据的分析,内部研究出一种称为产品画像的模型。这个模型通过综合在京东网站购物消费者的信息,例如:年龄、性别、喜好等类别的信息,然后进行深入分析。根据分析结果结合不同的消费者便有诸如线上的程序化购买、精准的点击等营销手段,有效的帮助京东实现精准的营销推送。不仅如此,通过对于后续用户购物完成的售后数据分析,的分析商品的不足之处或者消费者的直接需求。数据3.0时代的一个特征便是企业不在单纯的在企业内部分析数据,而是共享实现价值共创。所以,京东把这些数据用于与上游供应商进行定期的交流,间接促进生产厂商与消费者沟通,了解市场的需求,指导下一次产品的市场定位。总的来说,这个计划是通过京东销售和售后环节的大数据分析,一方面指导自身精准营销,另一方面,影响供应商产品定位和企业规划,最终为消费者提供满足他们需求的个性化产品。

四、大数据营销的策略分析

(一)数据分析要树立以人为本的思维

“以人为本”体现在两个方面,一方面是数据分析以客户为本,切实分析客户的需求,用数据分析指导下一次的产品设计、生产和市场营销。另一方面,以人为本体现在对用户数据的保密性和合理化应用。切实维护好大数据和互联网背景下隐私保护的问题,使得信息技术良性发展。

(二)正确处理海量数据与核心数据的矛盾

大数据具有数据量大、类型繁多、价值密度低和速度快时效高的特点。所以在众多海量的数据中,只有反映消费者行为和市场需求的信息才是企业所需要的。不必要的数据分析只会影响企业做出时代Time2017年第04期中旬刊(总第657期)正确的决策。鉴于此,首先企业需要明确核心数据的标准;其次企业要及时进行核心数据的归档;要有专业的数据分析专业队数据进行分析,得出科学合理的结果以指导实践。

(三)整合价值链以共享数据的方式实现价值创造

单纯的企业内部数据已经无法满足今天市场上顾客多样性的需求,大数据的共享已经迫在眉睫。首先,可以通过扩展常规上下游渠道的数据。例如京东与上游供应商的合作。其次,与社会化媒体数据建立联系。社会化媒体数据是外围数据的一个重要来源。但是如果只是搜集并没有把数据与企业本身营销策略或者数据者建立联系,那么数据就没有发挥其应有的价值。,虚拟人脉交换获取数据。比如建立企业自媒体收获粉丝获取数据等。

作者:孟楠楠 沈占波 陈楠 单位:河北大学

大数据分析毕业论文:大数据分析在内部审计的应用

摘要:随着社会经济的快速发展,国家对国有企业的监管力度逐年加强,依法治企要求也更严格,转变审计方式迫在眉睫。以现代化智能技术为主的大数据分析方式开始应用于各行各业,传统的数据搜集、存储、计算方式已经逐渐被取代。内部审计作为企业工作管理与分析的重要组成部分之一,坚持大数据的运用也成了大势所趋。与以往的审计模式不同,大数据推进了审计进程的速度,实现了审计内容、审计思维、审计目标以及技术分析的多方位优化,将验证性分析变为了挖掘性分析,实现了单机审计向大数据智能化手段的演变,并把审计方式变为了风险预警审核,有助于在风险发生之前就做好预测与判断。当然,由于技术的局限性以及固有理念的制约,大数据分析在实际审计应用中还不够广泛,缺乏既熟悉专业又熟悉系统开发的复合型人才,数据收集和专业分析的宽度和深度还存在一定局限,在新的内部审计模式与大数据的结合下,审计效率亟待加强。基于这样的情况,本文就对大数据分析进行深入探讨,实施跟踪审计,深入挖掘数据分析提供的信息,并坚持多领域数据的融合应用,切实彰显大数据分析在内部审计应用中的作用和优势。

关键词:大数据分析;内部审计应用

近年来,大数据应用更加广泛,它改变了固有的数据分析方式,将企业经营以及与之相关联的企业和客户信息进行收集和分析,通过新的思维处理数据与技术的难题。据调查显示,目前我国很多企业都将大数据作为新一轮经济增长点,从2012年开始就实现了持续增长,成了企业市场经营的巨大资料库,提高了企业的整体技术水平和竞争能力。具体而言,大数据分析是一种能够从各类信息中快速提取有用数据的一种新技术,对内部审计工作来说具有的意义不言而喻。下面就从大数据分析给内部审计带来的机遇和挑战入手,从实际出发做好应用性审计,带动审计工作发生质的飞跃。

一、大数据分析给内部审计工作带来的机遇和挑战

(一)审计目标信息化技术使用的初期,内部审计工作依赖计算机技术,可以通过对数据的观察和分析找到审计中存在的问题,为具体工作的开展提供参考。大数据分析技术的应用则将审计工作带到了新的高度,它不仅能够发现问题,还可以对风险进行评估,对效益进行分析,及时发现审计工作中存在的问题,降低内部控制风险,为企业发展做出预测性思考。(二)审计内容数字是传统内部审计工作参考的重点,包括营业收入、费用支出、税收情况等等。大数据分析则突破了原来数字化的限制,基本内涵和审计的内容不断向外延展,打破了传统数据结构化的样式不足,在不同的时间范围内可以生成复杂多变的数据,其中包括文本、音频、视频、xml等,构建出了审计的立体化方法。(三)分析技术大数据分析与内部审计应用的结合,较大的改变就在于技术的更新,大数据分析可以实现大数字的整合,从五大技术方面进行了完善。即可视化分析、数据挖掘算法、预测性分析、语义引擎和数据质量与管理。这些新技术可以通过标准化的形式,建立数据新模型,提取隐藏起来的内部审计信息,利用图表展示数据分析的全过程,并做出前瞻性的判断,从而提高数据的分析性。

二、大数据分析内部审计的方式

首先,数据验证性分析朝着数据挖掘性分析转变。即由原来的多维分析验证数据变为挖掘性技术的使用,将数据仓库和模型构建起来,做好聚类分析,找到规律性内容,并提取关联性数据。例如,在电力审计过程中,可以建立起专门的数据资料库,找到电力使用的具体数据,分析用电情况。其次,审计方式由事后发现问题变为风险预警。企业经营难免会遇到各种风险,对市场形势进行分析,将可能存在的危机控制在萌芽阶段,是大数据分析有别于传统分析模式较大的特点。另外,大数据分析可以早期关注经济运行情况,发掘数据敏感性波动,并集合社保审计、债务数据、经济宏观运行数据,实现信息库的交叉使用,提升数据分析水平和审计能力。,单机审计向云审计方法的转变。云审计是基于云数据库设立的数据平台,它依靠的是中心统计分析,通过网络与“云”的对接,对审计成果进行共享。与此同时,在大数据分析云计算实施的过程中,必须坚持技术的创新与发展,建立预算、财务、执政一体化策略,设立专门的数据平台,提高信息化技术审核的质量,做好宏观分析。

三、大数据分析在内部审计中的应用

大数据分析与内部审计的综合应用是信息时代技术演变的新手段,在与内部审计结合使用的过程中必须坚持化使用,从制度流程、机构人员、审计业务以及技术上做好配合,推行新的审计方法。(一)创新大数据工作模式创新是进步的源泉,大数据分析的推行,与内部审计工作的结合,都必须坚持创新原则,对预算执行审计有一个的认识。传统的孤立审计已不适应大数据审计的要求,需要打破部门之间的界限,以审计项目为管理主线,成立大审计组,进行扁平化管理。结合各预算部门的财务数据,发现是否存在预算项目在连年结转的情况下仍然安排新增预算、造成资金闲置的问题。通过对数据进行宏观整体分析,发现是否存在预算执行效率不高、分配下达预算不及时、拨付转移支付资金超期等情况。(二)完善跟踪审计方式通过建设审计数据综合分析平台,搭建关系国计民生的重点行业联网审计系统,用Hadoop等专业工具处理半结构化、非结构化数据,规范高效地汇集和处理大规模数据信息。例如,在地税审计中,可利用地税联网审计系统,集中进行全省地税数据整理分析,探索“数据集中采集、集中统一分析、疑点分布落实、资源充分共享”的大数据审计模式,实现全省联动审计。此外,还要对资金分配结构、资金使用流向、资金管理情况进行总体分析,反映预算执行整体情况,实现对预算单位的审计监督全覆盖。(三)实现多数据融合,落实经济责任审计运用关联分析,找出数据间的相互联系,分析关联规则,发现异常联系和异常数据,寻找审计疑点。在经济责任审计中,可利用财政、税务、社保、培训等数据在横向和纵向之间都做好关联性研究,做好数据的跟踪分析,实施和推行经济责任审计模式,提高审计效率。另外,在深入挖掘数据过程中,还要利用数据仓库和模型分析统计数据变动信息,分析关联性内容,对体制机制性问题开展研究,挖掘行业性和趋势性问题。

四、结束语

综上所述,大数据技术的发展对审计工作提出了新的、更高的要求,也为审计提供了新的工具。传统的大数据分析与内部审计工作的结合不够紧密,技术应用不够突出,且人才缺失。基于大数据分析的新情况,内部审计工作必须从数据、资源、人才方面逐步积累资源,创新大数据分析的思路和模式,研究技术发展的情况,并建立覆盖公司业务流程的审计信息化管理系统,使公司各业务线在统一、透明、标准的审计监控下阳光运行,确保大数据在内部审计中的高效应用。

作者:向欣 赵婵 单位:国网四川省电力公司广元供电公司

大数据分析毕业论文:供电企业信息安全大数据分析方法

摘要:本文将针对供电企业中的信息安全大数据进行探讨,并针对大数据的分析方法进行研究。

关键词:供电企业;信息安全;大数据;分析方法;思路;探讨

前言

智能化的电网正在地实施建设。随着以大数据为中心的IT技术的不断融入,当前我国的供电企业展开了大数据分析的研究,以便更好地使得大数据应用到整个配网的规划当中。此外,还要根据电网的实际数据情况,把数据应用到智能变电站的建立、智能电网的调度及供电信息的采集等各个方面。进而有效地提高我国供电企业的管理水平及处理业务的能力。然而,信息化新技术在应用的过程中也具有一定的风险因素,所以需要建立大数据的安全分析结构,进而对数据进行相应的处理并把安全分析方法应用到整个供电企业的信息系统中去,进而更好地为供电企业的数据安全提供保障。

1供电企业的信息风险分析

大数据作为供电企业的管理工具是一把双刃剑,给供电企业管理提供了便利,提高供电企业的管理水平和管理能力的同时,也给供电企业带来了一定的挑战和风险因素。使得企业数据处理、收集及传输的风险等级提高。若企业内部的数据出现问题,则会使得数据在进行传输的过程中被盗取和窃听,这给企业的管理带来了很大的风险。除此之外,企业在进行数据中进行一定的储存和利用的过程中,也会由于大数据系统的内部维护不到位而带了很大的风险。若企业的数据被长时间地窃听,就会使得不法分子有机可乘,采用各种方法来对数据后台进行攻击和试探,并寻找系统的薄弱之处。实行致命的攻击,并造成系统的瘫痪。所以,大数据给在方便企业的信息管理的同时,也带来了一定的信息安全挑战。

2供电企业信息安全大数据所面临的数据安全的需要

传统的电力信息系统逐渐地走向了信息化处理的进程,智能化的电网模式带给了供电企业信息系统数据安全更大的要求。每次进行数据的访问时,都需要确定数据的访问权限,并核实访问者的身份,并查看是否被授权。供电企业的数据信息需要被完整地保护,并保障其不被删除或者恶意的篡改。一旦供电企业发生一定的突发事件,需要大数据平台对数据进行自动的备份,并使数据得到安全的保护。④要采取一定的措施来保障供电企业的数据在运行过程中的安全性不被破坏。⑤要切实保障整个供电企业的信息系统的网络安全,控制供电企业信息系统的基础安全信息网络和供电企业内部比较重要的业务系统的安全。

3供电企业的信息安全大数据分析思路

当前供电企业内容的安全信息系统逐渐地向着对抗型的信息安全系统方式转变,并使得电力系统的大数据网络可以积极地应对外界的攻击。并对潜在的敌人进行分析和识别,并归纳总结当前的供电企业的信息安全大数据的风险类型,从而采取相应的对策,并先发制人,提高安全大数据系统的防御能力。这就是当前供电企业的信息安全大数据的分析思路。大数据的分析和挖掘技术需要不断地融入到大数据的安全分析中去,下图是大数据的安全结构分析思路。供电企业的信息安全大数据分析思路是基于技术的安全分析和理念,是至今为止比较完善的大数据安全分析办法,是供电企业大数据的核心环节,是对相对分散的信息进行采集并实现存储,并对其进行一定的分析,把其分析结果进行分发,把所有的安全分析体系结合在一起,并实现安全技术的互动。

4供电企业信息安全大数据安全分析结构的数据处理

供电企业的信息安全大数据的结构具体根据业务的不同分为不同的数据库进行处理。关系数据库是当前最丰富的数据库,是进行供电企业信息安全处理的主要形式。而数据仓库属于一种多维的数据结构,可以允许用户进行汇总级别的计算,并对数据进行观察。事务数据库中记录了每一个事务,并同时附带了一些相互关联的附加表。文本数据库是对图象进行描述的数据库,文本数据库与图书馆数据库类似。而多媒体数据库则是对图像以及音频和视频的存储,并用于存放内容的检索。供电企业的信息安全大数据的存储往往需要先确定好处理的目标,并对数据进行量化的处理,对数据进行一定的评估,进行结果的展示。将大量的数据进行集中化的处理可以切实地反映出安全数据的指标,并根据指标对安全数据进行相应的评估。

5供电企业信息安全大数据安全分析方法

当前,进行供电企业信息安全大数据安全分析的方法有很多,随着大数据的技术体系逐渐成熟,目前对安全数据的分析算法也变得多样化,很多分析方法比如分类技术方法、序列分析方法等等对大量的数据的分析具有很好的效果。而对于不同的数据库可以采用不同的分析算法进行分析。比如,当利用关系数据库和事务数据库时,就可以利用序列分析的办法进行数据的挖掘和统计;而数据仓库除了需要进行联机处理以外,还需要进行数据的挖掘;文本数据库则是利用模式匹配以及关联分析等方法相互结合来进行数据的挖掘分析。

6结论

针对供电企业的信息安全的大数据分析有很多的途径,在进行供电企业信息安全的大数据分析时,需要对供电企业的安全数据信息进行预测,并利用多种分析办法综合处理。随着当前大数据网络技术的不断发展,根据大数据的分析特点进行安全分析的办法也在不断地完善。基于信息安全的大数据分析方法和思路具有很大的发展前景,安全大数据技术的不断革新,使得供电企业的防护网络更加地发达,并逐渐实现了供电企业的大数据信息安全的评估系统的完善,使得供电企业的信息安全大数据发展更为迅速。

作者:李迪 冷金敏 冯涛 单位:国网山东省电力公司聊城供电公司

大数据分析毕业论文:农业信息化与大数据分析

摘要:大数据作为“互联网+”行动计划的主要内容,其重要性得到了广泛重视。农业是大数据的重要应用领域,大数据技术为农业信息监测预警工作带来了新的发展机遇。介绍了我国传统农业发展面临的问题,阐述了互联网+农业对于农业转方式、调结构的重要作用,详细分析了发展互联网+农业物联网、互联网+农业电子商务、互联网+农业信息服务、互联网+农业大数据的重要意义和具体措施,为提高农业综合生产能力,降低农业资源消耗,构建基于互联网和大数据技术的现代农业提供参考。

关键词:农业;信息化;大数据;互联网+

1引言

当今世界已经进入了互联网时代,互联网为塑造经济与社会新形态、创新国家与社会治理理念和改变国家之间竞争格局带来了深刻变革。互联网日益成为创新驱动发展的先导力量,深刻改变着人们的生产生活,有力推动着社会发展。

2我国政府高度重视互联网发展

2015年3月5日,总理在十二届全国人大三次会议的《政府工作报告》中首次提出了“互联网+”行动计划,“互联网+”能充分发挥互联网在生产要素配置中的优化和集成作用,将互联网的创新成果深度融合于经济社会各领域之中,提升实体经济的创新力和生产力,形成更广泛的以互联网为基础设施和实现工具的经济发展新形态。作为“互联网+”行动计划的主要内容,大数据的重要性也得到了广泛重视。早在2014年3月5日,总理在十二届全国人大二次会议上所做的《政府工作报告》中指出,设立新兴产业创业创新平台,在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展。2014年7月25日,总理在山东考察浪潮集团时强调:“不管是推进政府的简政放权、放管结合,还是推进新型工业化、城镇化、农业现代化,都要依靠大数据、云计算。所以,它应该是大势所趋,是一个潮流。”2014年7月以来,国务院常务会议6次提到“大数据”,所涉及领域包括企业信息监管、小微企业信息系统建设、健康医疗与企业监管、服务贸易、在线审批监管以及疫病防治、灾害预防、社会保障、电子政务等方面。

3“互联网+农业”是农业转方式、调结构的重要驱动力

当前,我国农业发展既面临着价格“天花板”与成本“地板”的双重挤压,又面临着资源环境“红灯”和补贴政策“黄箱”的双重约束。“互联网+”作为信息技术发展新形态、新业态,能够加快传统农业的转型升级,破解“双重挤压”和“双重约束”,提升农业生产、经营、管理、服务的信息化水平,加速新常态下农业“调结构、转方式”的进程。“互联网+”现代农业通过将基于互联网的基础设施、智能装备、数据服务引入农业生产经营与管理服务,推动农业要素投入向技术密集型、数据密集型转变,提高农业综合生产能力,降低农业资源消耗与污染排放,推动农业从单纯的农产品供给向一二三产业融合持续发展转变。依托互联网平台,使高度分散的各类农业经营主体实现互联互通,通过大数据、云计算、物联网等构建虚拟家庭农场、虚拟农业企业、虚拟农民合作社、虚拟农业产业集群等虚拟组织,推动线下各类农业经营主体跨地域、跨产业整合优势资源,构建资源共享、协同分工的现代农业产业链。

4“互联网+现代农业”的四大重点领域

4.1互联网+农业物联网,实现农业智能化

农业物联网不仅能够实现农业生产的机械化、自动化,还能实现农业生产的精准控制和智能管理。关键是加强对农业生产环境及动植物本体感知数据的采集、汇聚及挖掘,加快推广节水、节药、节肥、节劳动力等节本增效信息化应用技术,构建以物联网为代表的现代信息技术农业产业应用体系,开展基于大数据技术的智能分析,指导农业精准生产,实现合理使用农业资源、提高农业投入品利用率、降低生产成本、改善生态环境、提高农产品产量和品质的目的。(1)推广节本增效的物联网技术目前,农业部在国家发展和改革委员会、财政部等部门支持下,组织黑龙江、江苏、内蒙古、新疆、北京开展了国家农业物联网应用示范工程,同时农业部在天津、上海、安徽开展了农业物联网区域试验工程。在已有的设施农业与水产养殖、大田生产物联网区域试验示范的基础上,推广物联网设备广泛应用于种植、畜牧、水产及质量安全追溯等生产流通全领域。在种植领域,大幅提升生产设备装备的数字化、智能化水平,加快推广节本增效信息化应用技术,提高农业投入品利用率,改善生态环境,提高产出品产量和品质;在畜牧养殖领域,建设“物联牧场”工程,实现畜禽养殖的身份智能识别、体征智能监测、环境智能监控、饲喂护理智能决策;在水产养殖领域,将物联网设备用于养殖水质实时监控、工厂化养殖监测、水产品安全追溯、养殖专家在线指导等,实现养殖全产业链的监控和重点养殖区养殖生产的智能化管理,有效提高水产养殖生产效率,促进水产养殖业转型升级;在农产品质量安全追溯方面,将移动互联网、云计算、二维码、射频识别技术等现代信息技术与传统农产品质量安全追溯管理方式结合,促进农产品质量安全主体备案、索证索票、产品监测、执法监管和举报受理等工作信息化管理,构建农产品从生产到进入市场或加工企业前质量安全追溯链条。(2)搭建全国统一的物联网平台在农业物联网公共服务平台建设方面,先后接入了北京农业科学院设施云公共服务平台、中国农业大学水产物联网平台、天津奶牛养殖物联网应用平台、黑龙江农垦精准农业物联网应用平台、江苏水产养殖物联网应用平台、安徽小麦“四情”物联网监测平台、山东设施蔬菜物联网应用平台等国内经验丰富的农业物联网应用服务系统。推动国家农业物联网技术应用服务平台完善和标准化,为农业物联网技术应用、集成创新、仿真测试、主体服务提供良好的硬件设施和软件环境。(3)推进农业物联网数据中心建设认真总结现有试验示范工程成功做法和经验,吸引更多的科研教学单位和相关企业广泛参与农业物联网工作,力求在农业物联网研发和应用方面取得突破,加快推出一批先进的技术、产品和市场化解决方案,并因地制宜地推广应用到农业各领域、各行业、各环节之中。同时,加强农业物联网理论、政策、制度、机制创新,加快标准体系建设,深入构建完善的农业物联网产业标准体系及多级农业物联网数据中心,夯实农业物联网发展基础。组织物联网技术应用单位、科研院所、高等院校和相关企业,依托国家标准委已立项的13项国家农业物联网标准,研究制定物联网农业行业应用标准框架体系。构建全国统一的数据中心和区域性数据中心,分别发挥数据资源汇聚整合、大数据分析应用和高水平公共服务以及为全国农业产业物联网应用提供共性的专业数据及软硬件服务的功能,两级数据中心互联互通、资源共享、协同服务,为市场主体生产经营活动、科研创新和政府决策提供服务。

4.2互联网+农业电子商务,实现农业经营网络化

随着互联网经济向农业农村领域渗透,农业电子商务已经成为一个新的电商热点。2014年,我国各类涉农电商企业已经达到3.1万家,农产品在线销售额突破1000亿元,继续保持翻番增长的速度。农业电子商务作为一种新兴业态和新的商业模式,将对农业生产经营方式产生深刻影响,推动农业生产从以产品为中心转为以市场为导向、以消费者为中心,是经济发展新常态下,加快转变农业发展方式的重要手段,是农业现代化和城乡一体化发展的新驱动力量。(1)推动利用电子商务改造农业经营模式推进农业电子商务,有利于促进农产品产销对接,降低损耗,逐步建立最少环节、最短距离、低费用、最快速度、最透明信息的新型农产品流通方式,可以有效应对农产品提价“天花板”、农业生产成本上涨“地板”的限制,可以有效解决“卖难买贵”问题。推进农业电子商务,有利于充分利用信息化平台,聚合农业生产和产品资源,在虚拟条件下实现规模经营,有效对接消费需求,实现农户“以销售定产”、农业“以消费定产”,改造传统农业生产管理方式,创新农业经营体系。推进农业电子商务,有利于提高农业可持续发展能力、农业竞争力,“倒逼”农业生产标准化,发展绿色农业、生态农业,推动农业品牌建设、农产品质量安全监管等工作。推进农业电子商务,有利于加速互联网经济与农业农村融合,推动产业链、价值链等现代产业发展理念和组织方式进入农业,转变农业发展方式和农业要素利用方式,让农民从产业链增值中获得利益,把更多收益留在农村、留给农民。(2)推动农业电子商务快速健康发展近年来,农业部把发展农业电子商务作为农业信息化的重点工作。通过加强调查研究,梳理了农业电子商务发展面临的形势和挑战,研究提出了推动发展的基本思路和重点任务。积极参与《国务院关于大力发展电子商务加快培育经济新动力的意见》的起草出台。举办多次高规格的农业电子商务论坛。多次与阿里巴巴、京东等企业,就平台建设、乡村网点布局、物流、支付、培训等方面进行探讨交流,达成了合作意向,初步明确了合作内容,并取得了一定的合作成效。下一步将紧紧围绕转变农业发展方式、加快建设现代农业的重点任务,以推动农业电子商务快速健康发展为目标,按照“市场主体、政府引导、创新驱动、分类指导”的原则,重点抓主体培训,提高农业生产经营主体的电子商务意识和技能;抓平台对接,组织多种形式的电商平台与农业企业进行深度对接;抓信息监测,建立农业部门与电商平台交易信息共享、信用信息共建、监管信息互换合作机制,推进农业电子商务信息监测统计制度建设;抓试点示范,与电商企业合作开展鲜活农产品和农业生产资料电子商务试点,探索扶持发展商业模式;抓环境建设,推动建立适应电子商务发展的产品目录、生产信息、分等分级标准体系等。

4.3互联网+农业信息服务,实现信息进村入户

自2006年开始,农业部开通了12316农业公益服务热线,组织各级农业部门利用语音电话、手机短/彩信、广播电视、互联网等现代信息传播手段开展多种形式的信息服务,这种服务的革新改变了农民传统的生产观念和方式,拉近了农户与专家、政府和企业之间的距离,开辟了简单、方便、互动的指导渠道。经过多年发展,12316热线成为了农民与专家的直通线、农民与市场的中继线、农民与党和政府的连心线。(1)加快推进信息进村入户试点2014年开始,农业部在系统总结多年来12316农业信息服务做法经验的基础上,在北京等10个省(市)22个县(市、区)开展了信息进村入户试点工作。信息进村入户试点工作以行政村信息站服务能力建设为着力点,以满足农民生产生活信息需求为出发点和落脚点,以构建面向“三农”的信息高速路为纽带,统筹“农业公益服务和农村社会化服务”两类资源,着力构建“政府、服务商、运营商”三位一体可持续推进机制,使普通农户不出村、新型主体不出户就可享受便捷、经济、高效的生产生活信息服务。一年来,试点工作取得了重要阶段性成果。目前,已建成运营近5400多个益农信息社,覆盖22个试点县行政村的80%以上,公益服务、便民服务、电子商务和培训体验服务已进到村、落到户,探索出了一些较为成功的市场化商业运行模式。(2)充分发挥互联网优化和集成作用信息进村入户充分发挥了互联网在生产要素配置中的优化和集成作用,对于促进农业发展方式转变、提供经济发展新动力、创新农业行政管理方式、缩小城乡数字鸿沟,具有重要的现实和战略意义。首先,信息进村入户是促进农业发展方式转变的重要途径。信息进村入户引导生产与消费需求双向对接,可以发挥物联网节本增效作用,发挥电子商务降低流通成本、创新流通方式的作用,发挥科技及时生产力的作用,为农业插上科技的翅膀,推动现代农业发展。其次,信息进村入户是提供经济发展新动力的重要平台。2014年已有10多家企业参与信息进村入户试点工作,2015年又有20多家企业联合保障积极参与试点工作。信息进村入户能够为很多企业开拓农村这片“蓝海”提供机遇,能够为大众创业、万众创新提供良好的条件和环境,切实发挥消费对促进经济增长的基础性作用。再次,信息进村入户是创新农业行政管理方式的重要抓手。信息进村入户能够聚合各类资源,在为农民提供公益服务的同时,以商业服务支撑公益服务的落地,通过“羊毛出在牛身上”的利益置换机制实现公益服务的可持续。同时,随着信息进村入户的深入推进,将把全国60万个行政村连成一张大网,将来就可以实现农情直报,形成农业大数据,提高政府的决策能力和水平,向农户和新型农业经营主体精准推送所需信息。,信息进村入户是缩小城乡数字鸿沟的迫切需要。信息进村入户必将推动互联网与农业、农村、农民相融合,能够扩大农村信息消费,拉动农民手机用户快速增长,还能够形成工业品、农业生产资料下乡与农产品进城双向互动的流通格局,把世界带到村里,把村子推向世界,让农民与城里人一样享受信息化发展成果,有效缩小城乡数字鸿沟,促进城乡发展一体化。下一步,信息进村入户试点工作将继续扩大覆盖范围,力争2016年覆盖所有省份,2020年基本覆盖到所有县和行政村。农业部和试点省份、试点县将紧紧围绕加快转变农业发展方式和现代农业建设的中心任务,坚持以改革创新为动力,加快推进步伐,集聚服务资源,完善运行机制,着力提升能力,推动信息进村入户试点工作有力、有序、有效地开展,把益农信息社建设成为大众创业、万众创新的重要平台,把信息进村入户打造成“互联网+”行动计划在农村落地的示范工程。

4.4互联网+农业大数据,实现预测预警

近年来,大数据热潮席卷全球,引发各领域各行业生产模式、商业模式、管理模式的变革和创新,对经济社会发展及人们生活方式产生了深刻影响。大数据能够有效地集成国家政治、经济、文化、社会、生态等领域方方面面的信息资源,为国家治理提供重要数据基础和决策支撑,大数据的广泛应用将会为“数据治国”产生深远影响。2015年8月,国务院印发了《促进大数据发展行动纲要》,对发展大数据作出部署,其中对发展农业农村大数据作出专门安排。农业是大数据的重要应用领域,大数据技术为农业信息监测预警工作带来了新的发展机遇,将极大地改变和创新农业信息监测预警工作模式。构建基于大数据的新型农业信息监测预警体系,既是农业部门提升管理效率、转变政府职能和完善公共服务的重要途径,也是保障农业产业安全、国家粮食安全和增加农民收入的有效手段。(1)加快大数据技术与农业产业融合对于政府决策和行业发展而言,大数据的核心价值不是对过去客观事实的统计,而是基于对大量事实统计的基础上,利用分析工具实现对当前形势的科学判断和对未来形势的科学预判,为科学决策提供支撑。主席指出“农业结构往哪个方向调?需求是导航灯”。只有理顺贯通整个产业链的“数据流”,让需求端的数据流向生产经营决策端,才能实现科学的生产经营决策。从实际工作的角度看,大数据目前较大的价值是和产业的融合。2015年5月26日,马凯副总理在贵阳国际大数据产业博览会上也指出,融合是大数据的价值所在,应大力推动大数据与产业融合,促进产业提质增效升级。大力推动大数据与公共服务融合,充分挖掘大数据的社会价值,推进政府治理和公共服务能力和水平。比如,农业大数据研究可从粮食产量预测、生猪供求变化等问题入手,整合数据资源,摸清分析方法,形成较为实用的大数据系统。(2)加快形成全产业链数据系统主要思路是以产业链为线索,通过梳理产业环节,摸清现有数据情况查缺补漏,对已有的数据集打通数据壁垒,优化现有数据存量,对于政府决策和企业经营决策需要但是缺乏的数据,逐步建立统计调查制度,结合企业业务和互联网生成的外部数据,完善数据链条,然后将整个数据链条放在同一维度去挖掘分析。以生猪为例,谈谈具体做法。一是摸清当前各环节数据采集情况。调研了解生猪产业链中畜牧、兽医、检疫、屠宰、批发市场等各产业环节中各部门已经统计和采集的数据集。二是开展数据共建共享工作。打通已有数据的“信息孤岛”,把各环节已有的数据按照一定的标准组织起来,逐步建立覆盖生猪全产业链的农业信息体系和共建共享机制。三是补齐当前缺乏的数据集。根据“生产、消费、库存、进出口、价格、收益”六大核心数据框架和构建需求导向的农产品调控机制的需要,考察现有数据集,对于目前缺乏的数据,探索建立消费调查制度和方法,结合企业业务和互联网生成的外部数据,完善数据链条。四是开展大数据挖掘分析工作。大数据的目的不是数据,而是通过数据产生有价值的信息。在生猪全产业链数据形成和完善后,通过对各环节数据比对、深入挖掘分析,找出当前生猪产业发展的核心问题,研究发现供求变化的先导性指标,逐步构建更为科学的“数据驱动”型生猪调控政策。总而言之,品种和产业链是构建农业大数据体系的一个重要抓手,也是集聚数据的一个线索,通过这个线索先把一个个散落的同品种各产业环节数据集串在一起。首先实现品种内的大数据系统。在此基础上,逐渐扩大品种,形成18个品种全产业链数据,并逐步构建覆盖全球、农业全行业和全产业链的农业信息资源和监测预警体系,这是未来努力的方向。

作者:王小兵 单位:中国农业部市场与经济信息司

大数据分析毕业论文:数学专业教师数学模型大数据分析

一、东北地区数学专业教师大数据来源及准备

通过查阅资料与调查,收集到东北三省各高校数学教师相关大数据,包括教师教龄(誗年)、收入(誗元)、税收(誗元)和职业病情况等方面的实际数据。由于得到的数据信息量大,轻重各异,所以首先需要进行数据预处理,即清除异常数据、错误纠正、格式标准化等,再通过数据挖掘技术,利用一系列相关算法和数据处理技术从大量的数据中提取人们所需要的重要信息,也就是上面所提到的实现信息的“增值”,同时大大提高数据处理效率,下面具体介绍本项目所采用的模型和计算方法。

二、东北地区数学专业教师大数据分析与结果

收集并处理好教师教龄、收入、税收和职业病情况等方面的数据后,本文主要针对三个方面进行了详细的分析:1.教师收入随年份的变化(1)数据范围:1994年-2014年东三省各高校数学教师收入(单位:元);(2)计算条件:matlab软件,最小二乘回归分析,高性能计算工作站;(3)求解过程:年份作为自变量x,收入为因变量y,从总体上看,二者统计关系大致符合一元线性的正态误差模型[3],即对给定xi的有最小二乘一元线性回归公式yi=b0+b1xi+εi,其中εi是由变量可能的内在随机性、未知影响因素等随机扰动造成的误差。总之,它可看成是众多细小影响因素的综合代表。,由Matlab提供polyfit函数实现回归函数拟合[4];(4)结果分析:计算结果表明,随着年份的增加,教师收入也在不断增加。估计的因变量的系数b1约为191,也就是说,每过一年,教师收入大致可增加近191元。2.教师职业病情况与教龄的关系(1)数据范围:1994年—2014年东三省各高校数学教师教龄(单位:年)、职业病情况;(2)结果分析:首先利用matlab软件,以横轴为某年东三省数学教师教龄,纵轴反映相应教龄的平均职业病情况(为方便,规定越接近纵轴正方向,职业病越严重)利用matlab软件绘制图形[5],发现教师教龄越长,职业病也愈加严重。每一年的教师职业病情况均可绘制一张图表,通过将这11张图表的较高值(即每一年职业病的较高值)做比较,发现其趋势是先逐年下降,趋于稳定。3.对教师专业发展阶段的研究(1)数据范围:2014年东三省各高校数学教师收入、教龄、税收和职业病大数据;(2)计算条件:IBM处理器、大数据挖掘分类算法;(3)求解过程:用神经网络研究方法(即模拟生物上神经元工作的方法)。图中每个椭圆形节点接受输入数据,将数据处理后输出,输入层节点接受教师信息的输入,然后将数据传递给隐藏层,隐藏层将数据传给输出层,输出层输出教师专业发展处于哪一专业成熟阶段;(4)结果分析:若将教师专业成熟过程分为三个阶段:形成期、发展期和成熟期。那么利用IBM处理器和以上算法,在所调查的教师中,约70%处于发展时期,是其基本适应教育教学工作的时期;约20%处于形成期,是形成良好心理素质和正确教育思想的关键时期;约10%处于成熟期,是掌握教学主动权,成为学校教学骨干的时期;(5)研究意义:研究东三省高校数学教师专业发展成熟阶段,可以基本掌握教师资源结构,从而能够遵循不同发展阶段的不同特征、观念、心理、发展需求,制定相应教研活动、政策和制度,促进教师持续发展[6]。

三、结果讨论

1.数据呈现以上结果的原因(1)随着国家科教兴国战略的深入实施,教师的工资和待遇将被逐步纳入国家工作人员统一管理,教师的收入将得到很大的提高。另一方面,数学能力的培养是学习各专业、走入各行业的基础,国家将加大数学知识的教育力度,进而数学专业教师所付出的辛苦也更加不可小觑,综合以上几个重要原因,教师收入随年份增加而增加也是符合经济理论的。(2)教龄越长,职业病也越严重的依存关系,我们容易理解。但随着时间的推移,职业病的严重性呈现下降趋势正是反映了我国科技的革新:环境的改变、教学设备和教学技术的更新使得教师的课堂教学更加高效和轻松便捷,如多媒体、电子白板使得课堂不再“尘土飞扬”。(3)在对教师专业发展阶段的研究中,处于专业发展时期的教师所占比例较高,达到近70%。实际上,他们多数处于青壮年的人生阶段,是社会的中坚力量,又曾在高等教育多样化与综合化的背景下受到过良好的教育,并具有较丰富的教学经验和紧跟新时代的创新思想,自然在专业发展的角度也占有较大比例。2.合理的相关预测大数据最有价值的特点就是其“预见性”。上述数值结果表明,在经济平稳发展和社会稳定的前提下,东三省数学专业教师的收入在未来的几十年依旧处于增长趋势,教师职业病总体减轻,专业发展越来越成熟,使得教师队伍整体素质越来越高,而未来教师的考核奖励制度也会变得更加严格和。3.建议(1)无论是对教师行业还是其他行业感兴趣,都要关注其变化,分析其形势及趋势,以便对此行业的认知更加科学合理。(2)本文采用的大数据处理所用模型和方法,可以进一步推广到其它相关领域,使之成为研究大数据的更通用的工具。本文利用matlab软件、最小二乘法模型及IBM处理器分析了东北地区数学专业教师大数据,得出的结果对于掌握该地区数学教师基本情况并预测其发展趋势有着重要的作用,还为热心同类问题的研究者提供高效的方法和技术。当我们不能有效处理所获取的大数据,它们就是一些平凡的数字和符号。如果我们能够很好地驾驭大数据,它们必定会为我们带来诸多的方便。最小二乘法模型在处理大数据时有一定的优势[7],统计分析,神经网络算法和遗传算法都是处理大数据的有效方法,如果能将这些方法有机的结合起来,将更能获得许多满意的数值分析结果。当大数据超过计算条件的时空允许时,不仅耗时费力,甚至使得计算成为不可能,通常需要采用并行算法等高效计算手段。在高性能计算方面,我们并没有用到并行算法,如果能利用并行算法,所处理的数值结果容量会更大更有参考价值。

作者:张哲 单位:沈阳师范大学

大数据分析毕业论文:大数据分析下电子商务发展策略研究

[摘要] 伴随信息技术与网络技术的迅猛发展,大数据在诸多行业领域得到广泛应用与推广,同时对电子商务发展也产生了极为深远的影响。从大数据下的电子商务入手,凭借大数据分析、预测功能,为电子商务发展创造了良好契机。而电商企业同样面临着掌握大数据、驾驭大数据、数据安全防护等方面的挑战。电商企业应结合电子商务发展实际情况,利用大数据,通过打造电子商务数据信息平台、推动电子商务精准营销、推进商业模式创新、开展数据处理工作、确保数据隐私安全等对策,积极促进大数据时代下电子商务有序健康发展。

[关键词] 大数据分析;电子商务发展;策略研究

一、引言

大数据时代的来临,凭借大数据分析、预测功能,为电子商务发展创造了良好契机。依托大数据分析,商品推荐产生了个性化、精准化的商业模式,电商企业运营方式不断推陈出新[1]。然而,大数据时代电商企业同样面临着掌握大数据、驾驭大数据、数据安全防护等方面的挑战。由此可见,对基于大数据分析的电子商务发展策略开展研究,有着十分重要的现实意义。

二、大数据下的电子商务

全球科学期刊《自然》于 2008 年推出将大数据作为封面的专刊,着重关注数据给各个行业领域带来的影响。2012 年,联合国大数据政务白皮书《大数据下的机遇与挑战》,提出了大数据时代已到来,大数据对于各国而言既带来了机遇也带来了挑战。2014 年,我国政府工作报告中首次提到了大数据一词,并将大数据界定为一种基础性战略资源,可为预防、调查、决策等事务提供有力依据。在大数据时代下,依托的大数据采集、分析,可进一步推动电子商务价值创造朝精准化方向发展。不管是电商平台、移动终端还是相关第三方服务平台,只要期间电商企业与消费者产生了交集,便会形成一系列电子商务数据,而这些庞大的信息数据是传统处理分析手段所难以有效处理利用的[2]。同时,电子商务数据还具备高度多样化的特征,其中不仅包含了消费者的个人信息,还包括了消费者的评论、反馈意见等等,数不胜数。以电商企业网络为例,消费者消费行为意向收入大数据,当电商企业对采集的大数据开展分析,并获取消费者消费行为意见相关影响因素时,电商企业便可进一步为消费者提供有针对性的服务,使消费者选择电商企业的产品。大数据时代,过去被认为是无过多价值的信息数据极可能经由大数据分析,为电商企业提供尤为、及时的消费者信息,进一步为电商企业营销活动开展提供有力支撑。

三、大数据为电子商务发展带来的机遇和挑战

(一)大数据为电子商务发展带来的机遇

1.大数据使商品推荐趋向于个性化、精准化,进一步推进商业模式创新。通过对庞大的消费者行为数据开展分析,研究个性化、精准化地开展广告推送、推广服务,建立相较于当前广告、产品推广形式性价比更突出的新型商业模式,向消费者推荐他们切实需求的产品,进一步有效提升电商企业销售量。

2.大数据为电商企业整合品质产品信息。以淘宝、天猫电子商务平台为例,基于对平台数据信息的整合,结合商品购买情况及浏览数据筛选出时下热门或品质的产品,形成有力的电商企业与消费者的产业链信息,形成强有力的数据处理能力,为消费者产品检索提供有效便利。

3.大数据为电商企业提供细化服务。电商企业通过对大数据开展采集、分析,推进供应链上下游有效协调,以达成信息资源的优化共享,进一步促进电商企业在市场管理、产品营销、技术研发等环节的转型升级,打造全新的覆盖面广的营销平台,以吸引更多的消费者,增强企业市场竞争力。

(二)大数据为电子商务发展带来的挑战

1.电商企业面临掌握大数据的挑战。大数据时代下,电商企业要想实现进一步发展,离不开大数据的有力支持。对于电商企业来说,很大程度上谁先掌握了大数据便意味着谁先拥有了核心竞争力的有力武器,便意味着谁先拥有了致胜的法宝。

2.电商企业面临驾驭大数据的挑战。电商企业要对各式各样大数据开展分析,不可仅凭直接开展经营决策制定,应尽可能对所有与消费者关联的业务数据开展分析,以达成对消费群体的有效维护,并吸引他们买入更多产品,如此以来,很大程度为电商企业开展全新信息化投资、建设带来了挑战。

3.电商企业面临数据安全防护的挑战。各式各样数据的汇集,包含电商企业的运营数据,消费者个人信息等等,这些数据均被电商企业收集于企业数据库中,由此对电子商务如何开展好对该部分数据的安全防护工作带来了挑战。

四、大数据时代下电子商务发展策略

(一)利用大数据,打造电子商务数据信息平台

在市场经济逐步深入背景下,电商企业要想在日趋白热化的市场竞争中脱颖而出,利用好大数据至关重要。近年来,各式各样应用软件推陈出新,很大程度上推进了移动电子商务的发展,大数据库中收录了更多更精准的用户信息、用户定位。电商企业通过对大数据的科学合理利用,打造电子商务数据信息平台,旨在增强电商企业对大数据时代的适应性。鉴于此,电商企业应当强化对云计算技术的引入,并于短时间内对海量数据信息开展实时动态筛选、分析、处理,从而将数据信息切实转化成企业自身有效资产。与此同时,电商企业应强化对数据的分析、整合,达成对大数据的有效利用,通过对消费者消费行为习惯偏好的有效掌握,进一步为电商企业制定运营策略、确立目标消费群体、提升市场占有率、改善经济收益等提供有力支撑[3]。

(二)利用大数据,推动电子商务精准营销

精准营销指的是电商企业对消费者个性化需求予以满足,借助网站推荐系统自动向消费者推荐商品,同时开展个性化商品筛选的过程。基于精准营销支撑,可为消费者提供更便捷、更人性化的消费体验。现阶段,大部分电商企业还尚未构建有企业自身个性化的推荐系统,抑或企业采用的推荐系统尚不十分成熟,更未与大数据开展有效结合。如此一来,最终使推荐效率、推荐精准度均不尽如人意。以电商企业网络广告为例,大数据时代,网络广告在网络营销中可起到至关重要的作用。现如今,电商企业面对的消费者数据不断增多,电商企业应当基于现有营销数据平台,建立更为科学完备的个性化推荐系统,推进实时动态对广告受众开展分析,依托大数据分析,充分结合消费者个性兴趣偏好制作广告开展精准营销,为消费者提供更高质量的服务,与消费者构建和谐融洽的关系,增强消费者忠诚度。于此方面,阿里巴巴、淘宝、天猫中的“找相似”、“找同款”、“看了又看”等广告营销便为广大电商企业提供了很好的示范。

(三)利用大数据,推进商业模式创新

伴随互联网在商业领域的广泛推广及大数据时代的到来,商业模式不断推陈出新,较具代表性的商业模式有O2O、O2P 等。其中,O2O(Online To Offline),指的是将线下机会与线上电子商务进行结合,使线上电子商务转变成线下交易平台的一种商业模式。O2P(Online To Partners)指的是借助移动互联网技术手段,达到具备本地化、社交化特征的线上线下互动电商平台,以实现渠道朝社区化、乡镇网点全覆盖,不同品牌类型的同时运作。通过建立多方参与多方共赢的格局,构筑具备核心竞争力的互联网生态圈,转变成相关标准定义者与游戏规则制定者。不管是哪一种新型商业模式,均应当紧紧围绕消费者,并对一系列端口数据开展优化整合,实现数据信息的实时推送。

(四)开展好数据处理工作,确保数据隐私的安全

近年来个人隐私遭受窃取、重要信息被不法篡改等现象屡见不鲜。倘若数据信息难以得到切实安全防护,大数据便会转变成广大消费者的恶梦,对消费者日常生活造成极大的负面影响。鉴于此,电商企业应当提高对数据安全防护的重视度,依托大数据技术对数据安全状况开展实时监控,结合各种风险实际情况有针对性的采取科学的安全防护及精准化的预防措施,一方面要防范数据信息泄漏给电商企业带来的法律上不利影响,另一方面要防止过度开发或者越界营销可能引发的侵犯消费者隐私的一系列纠纷。此外,电商企业还应当强化对大数据中涉及的消费者个人隐私的安全防护,防止出现信息泄漏、信息倒卖等情况;,要及时了解国家关于个人信息保护的法律、政策规定,迅速开展经营策略优化调整[4]。

五、结束语

大数据分析并非偶然形成的,而是当今世界信息技术与网络技术迅猛发展的产物,对不同行业领域可起到至关重要的影响,电子商务亦不例外。鉴于此,相关人员务必要不断钻研研究、总结经验,清楚认识大数据以及电子商务的特征内涵,分析大数据为电子商务发展带来的机遇和挑战,结合电子商务发展实际情况,“利用大数据,打造电子商务数据信息平台”、“利用大数据,推动电子商务精准营销”、“利用大数据,推进商业模式创新”、“开展好数据处理工作,确保数据隐私的安全”等,积极促进大数据时代下电子商务有序健康发展。

作者:万胤岳 单位:无锡科技职业学院

大数据分析毕业论文:大数据分析在外汇管理的运用

摘要:当前,大数据正日益成为国家基础性战略资源,大数据在金融监管等领域将担任越来越重要的角色。与此同时,外汇管理要适应新形势的要求,就必须更新外汇管理理念和方式,深化外汇管理体制的改革和创新,完善外汇管理的大数据监测分析。本文从数据挖掘技术的角度出发,在介绍大数据定义、分析方法及主要应用场景的基础上,阐述了大数据分析方法在外汇管理领域的具体运用,并对开展大数据分析工作提出相关建议。

关键词:大数据;金融监管;外汇管理

一、大数据定义及常用分析方法

(一)定义。对于什么是大数据,迄今为止并没有公认的定义。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。(二)数据挖掘常用分析方法。数据挖掘就是对观测的数据集(经常是很庞大的)进行分析,目的是发现未知的关系和以数据拥有者可以理解并对数据拥有者而言有价值的新颖方式来总结数据。常用方法类型介绍如下:一是关联分析。是在未有既定目标情况下,探索数据内部结构的一种分析技术,目的是在一个数据集中发现、检索出数据集中所有可能的关联模式或相关性,但这种关系在数据中没有直接表示或不能肯定。常用的关联分析算法有:Apriori算法、FP-growth算法。该技术目前广泛应用于各个领域,如我们在电商平台浏览商品时都会显示“购买此商品的顾客也同时购买”等提示语,这正是我们日常生活中接触最多的关联分析应用实例。二是聚类分析。是在没有给定划分类别的情况下,根据数据相似度按照某种标准进行样本分组的一种方法。它的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度将其划分为若干组,使组内距离最小而组间距离较大。常用的聚类算法有K-Means、K-Medoids、DBSCAN、HC、EM等。当前,聚类分析在客户分类、文本分类、基因识别、空间数据处理、卫星图片分析、医疗图像自动检测等领域有着广泛的应用。三是回归分析。是指通过建立模型来研究变量之间相互关系的密切程度、结构状态、模型预测的有效工具。常用的回归模型有:线性回归、非线性回归、Logistic回归等。四是决策树。是一个预测模型,在已知各种情况发生概率的基础上,通过构成决策树来求取期望值大于等于零的概率、判断可行性的决策分析方法,是直观运用概率分析的一种图解法。常用算法有CART、C4.5等。五是人工神经网络。是人脑的抽象计算模型,是一个大型并行分布式处理器,由简单的处理单元组成。它可以通过调整单元连接的强度来学习经验知识,并运用这些知识推导出新的结果,属于机器学习的一种。

二、大数据分析在金融监管领域主要运用场景

当前大数据在前瞻性研究、风险防控、客户分析、舆情监测等方面都取得了巨大的成效,在金融领域实现了广泛应用,有效地提升了金融监管的针对性,为金融管理、风险识别带来了无限的可能性,成为当前不可或缺的分析手段之一。一是运用大数据开辟“线上溯源,线下打击”的治假新模式。2015年5月,某省“双打办”联合某电子商务企业发起行动。某电子商务企业首先运用大数据手段识别售假线索、锁定犯罪嫌疑人、分析串并背后团伙,根据警方需求批量输出线索用于侦查破案。行动期间,该省侵犯知识产权立案数同比上涨120%,破案数同比上涨77.3%。与传统打假模式相比,“大数据治假”模式实现了对犯罪嫌疑人线索信息的实时收集,为执法部门线下查处和打击提供了更精细、精准的线索和证据。二是运用大数据提升监管有效性。2016年,某交易所通过监控发现沪股通标的股票成交、股价涨势存在明显异常。运用大数据方法对历史资料进行关联匹配映射分析后发现,来自香港的证券账户与开立在内地的某些证券账户有操纵市场的重大嫌疑,根据上述线索,监管部门查获唐某等人跨境操纵市场的违法事实,成为沪港通开通以来查处的首例跨境操纵市场案例。大数据方法为资本市场的进一步对外开放提供了新的监管思路。三是运用大数据实现风险分析、风险评级,打击电信诈骗。通过收集和整理各行业、机构的黑名单,利用多样化的机器学习模型及大数据关联分析等技术,为银行、个人等提供风险管控和反欺诈的服务;运用数据挖掘技术,发掘与相关账户信用相关的预警信息,形成预警信号并向相关风险管理系统主动推送,进而跟踪预警信号处置流程,直至得出最终结论或风险管控方案,形成一个风险预警、通知、处置和关闭的闭环处理流程。四是运用大数据助力风控。例如,某电子商务企业旗下小贷平台建立了决策系统,借助大数据分析结果选择风险可控的企业开放信贷服务,实现贷前小额贷款风险管理控制,提升集约化管理的效率。该平台信用贷款部分客户的贷款年化利率可低至12%,对比原先降低6个百分点。依靠平台和数据优势,该平台在风险控制方面已形成了多层次、多方位的微贷风险预警和管理体系,实际运行中该平台的不良贷款率一直保持在1%以下,风险控制成效良好。

三、对大数据分析在外汇管理领域运用的思考

(一)引入大数据分析方法的必要性。近年来,外汇管理部门通过不断完善国际收支申报体系和加强外汇管理信息化建设,掌握了海量的数据信息,为外汇管理从侧重事前审批逐步转向侧重事后监测分析奠定了扎实的基础。在当前主流的事后监测分析框架中,通常按照业务条线,采用“宏观—中观—微观”自上而下递进式分析方法。这种分析方法有一定的优点,可以实现对各业务系统的充分利用,与宏观形势和业务管理信息结合较为紧密。但同时也存在一些缺陷:一是数据之间关联度不高,监测分析主要以各业务条线事后核查为主,数据相对分散,数据之间的关联分析较弱,监测结果相对滞后;二是难以发现潜在风险苗头,特别是在数据量巨大或关联关系复杂等特定场景下,有时无法取得满意的监测分析结果。在此背景下,可以考虑适时引入大数据分析方法。该分析方法是考虑在整合内部系统、互联网等各类信息数据的基础之上,利用数据挖掘、建模等工具方法,对企业、集团等主体、各类交易数据及互联网信息进行多层次、多角度、多项目的情况分析,并通过反馈的结果,修改完善模型,不断提高分析预测结果的性,既能解放大量人力资源,又有助于提高事中事后监管的针对性和效率,同时提高外汇管理的信息化程度。(二)大数据分析方法在外汇管理领域运用的具体思路。1.打造大数据监管中心,探索构建各类监管模型设立大数据监管中心,整合各业务系统数据及互联网外部数据,构建各类监管模型,多层次、多角度、多方位对各类主体交易数据实施监管及风险防控,探索实现主体监管、本外币一体化监管等,提升监管效率。一是交易数据监管。将当前各项法规、政策、制度数字化,建立合规性核查模型,通过对交易信息进行模拟仿真测试,获取交易数据的边界条件,判断交易的合规性,自动报告不合规交易。二是交易风险预警。通过对以往违规的交易进行分析建模,结合当前的经济金融形势,对每笔交易进行风险分级,自动报告高风险的业务数据。监管部门判断核查后,系统根据反馈结果通过机器学习等完善预警模型,不断提升预警度。三是主体监管。以企业或集团公司为主体,整合利用多方位数据,运用神经网络等技术对主体的投融资、结售汇、资金管理与调配等内部交易行为进行分析,了解不同类别主体异同点,对主体进行适当性分析评测,及时识别潜在违规行为。2.预测汇率、跨境收支走势,了解并引导市场预期通过收集影响汇率变动、跨境收支相关因素信息,建立模型预测汇率、跨境收支走势,并通过机器学习等方法,自动或人工调整模型,不断提升预测结果的性,同时掌握902017.09市场预期,及时进行引导。一是汇率走势预测。整理收集通货膨胀、利率、政府债务、市场心理等影响汇率变化的信息,通过回归等各类模型方法,分析某一项或多项与汇率之间关系,预测特定时间段汇率走势。二是全国或地区跨境收支形势预测。整理收集行业价格、汇率、经济金融形势等外部信息,观测、分析经济金融形势、汇率、人民币即期交易差价等对地区跨境收支或进出口的影响,预测跨境收支或进出口走势变化。三是掌握人民币汇率市场预期。收集网络上关于人民币汇率相关信息、搜索频率等,通过文本分析等方法了解人民币汇率走势的市场预期,便于适时采取引导措施。3.舆情实时监测,快速预警反馈整理收集互联网各大网站评论、博客等信息资源,尝试以数据情感分析角度,实现对文本评论数据的倾向性判断以及所隐藏的信息的挖掘并分析。一是获取政策反响。收集各大网站某项政策的相关评论、帖子、博客等信息,通过深度学习、语义网络等多种数据挖掘模型,分析判断数据倾向性,以数据角度反映政策执行效果及反响,为政策的进一步完善提供参考。二是设立舆情监测平台。运用数据仓库、文本分析、机器学习、神经网络等技术手段对金融敏感信息、舆论情况、政策解读反响等进行实时监测、分析,覆盖公共新闻网站、行业网站、微博、博客、论坛、贴吧等信息平台,在及时时间捕获相关舆情,并及时发送分析报告,合理引导市场预期。(三)初步实践与尝试。我们以某地区2015年1月至2016年10月涉外支出数据为例,对其与CNH、CNY进行了回归分析。1.涉外支出与CNY回归分析回归预估方程为:涉外支出(亿美元)=-52.15CNY+530.17。但P值为0.4912(一般认为P<0.05时通过显著性检验),表明CNY与涉外支出无明显关系。2.涉外支出与CNH回归分析回归预估方程为:涉外支出(亿美元)=-24.05CNH+349.82。但P值为0.7526,表明CNH与涉外支出无明显相关关系。3.涉外支出与CNY、CNH回归分析回归预估方程为:涉外支出(亿美元)=2466.1CNH-2498.2CNY+364.6。其中CNH、CNY、截距项P值分别为2.3×10-5、1.9×10-5和0.246,表明CNH、CNY与涉外支出有显著的相关性,截距项与涉外支出没有明显的相关性,拟合优度为0.5897。4.涉外支出与即期交易价差(CNH-CNY)回归分析回归预估方程为:涉外支出(亿美元)=2489.06(CNH-CNY)+157.3,其中P值分别为3.73×10-12和1.38×10-5,表明两项预估值的显著水平均较为理想,拟合优度为0.6006。从上述情况可以看出涉外支出与即期交易价差存在较强的线性关系,即某地区涉外支出随着人民币价差(CNH—CNY)的收窄而减小,随价差的扩大而增加。在知悉若干变量对另一变量存在影响的情况下,可使用该方法分析各自变量与因变量的具体相关性,逐步求取模型,获取变量之间的线性关系,如:分析汇率与购汇金额之间的关系;分析产品进出口金额、进出口量与产品价格之间的关系。

四、政策建议

(一)转变理念,利用大数据分析手段提升监管效率。一方面,大数据分析方法着眼于从海量的数据中寻找数据内部关联与逻辑关系,并归纳出特定主体或交易行为的规律与特征。另一方面,外汇管理部门已逐步从制定规则的角色转向风险判断的角色,而这又依赖于从数据中找到规律和关联,进而识别数据变化提示的风险。大数据挖掘技术和分析方法可以极大地提高对历史数据的利用价值,同时也为管理职责的转变提供必需的技术支持。从这一角度来说,监管部门需及时转变理念,在传统事后监测分析框架之外,引入市场前沿技术分析手段,进一步提升监管效率。(二)建立大数据分析工作机制。一是可以考虑设立大数据监测中心或直属大数据分析公司,从事外汇监测、舆情监测等数据分析专项工作,打造大数据分析团队。二是建立统一的大数据综合运用平台,整合各业务系统、互联网外部信息和工商、海关、税务等部门信息,在此基础上,根据监管需求及经济金融形势,开展各项监测工作,逐步完善各类监测模型,提升监管工作成效。(三)规范大数据结果的运用机制一是定期向相关部门通报舆情预警、汇率预期、跨境收支走势预期等情况,为决策提供有益参考。二是实时汇总异常交易、风险预警等分析预测结果,及时向业务主管部门反馈,为其开展事后。核查等工作提供线索。(四)以区域试点模式开展大数据分析工作。当前,大数据分析在市场多领域已有应用,但在金融监管领域还未有成体系的实践做法。建议选取部分地区开展大数据分析试点,并尝试与外部机构合作,借鉴市场的成熟经验及各类监测、预警和预测模型,不断探讨、完善大数据分析在金融监管领域的运用。

作者:徐珊 李慧强 单位:中国人民银行营业管理部

大数据分析毕业论文:大数据分析助力数学知识突破

摘要:随着互联网和计算机技术的飞速发展,大数据时代已经给我们的生活和学习带来很多的便利,在大数据的时代背景之下,大数据分析也应运而生,大数据分析在学科教学中发挥了重要的作用,本文就大数据分析助力高中数学知识突破进行了研究,首先阐述了大数据分析的概念,阐述了基于大数据分析下的高中数学课堂教学策略。

关键词:大数据分析;高中数学;教学策略

一、引言

在大数据的影响之下,我们的传统的教育教学方式正在发生着剧烈的改变,大数据分析在教学中的应用也越来越明显,特别是在高中数学中的应用,未来的大数据分析必然会对教学产生巨大的作用,因此,研究大数据分析是一件至关重要的事。

二、大数据分析的概念

对于数据的本身来说,是用来记录信息的,但是随着计算机和互联网技术的发展,我们在生产和生活中的各个领域都有了突飞猛进的进步,这相应地带来的是各种数据的处理方式更加的复杂,数据的数量以及涉及的规模也在不断地扩大。大数据的特点可以和经济学的观点一样,从微观和宏观两个方面来理解,但是目前大多数对大数据有研究的专家来说他们都是从宏观的角度来分析大数据的定义的。大数据处理的数据数量很多,即使新数据也能很快地进行处理,这些数据的类型也是多种多样涉及很多的领域,而且处理的数据具有真实性。大数据分析的重点在于分析,就是利用大数据技术对收集到的数据进行多方位的分析,大数据分析的优势明显,哪怕你的数据量非常大,但是分析也能快速地完成,并且还能保障数据的真实性。大数据分析的目的是通过对历史数据的分析和解决,进行科学的总结,发现其规律性和模式,同时结合稳定的动态流数据预测事物发展的未来趋势。

三、高中数学课堂教学策略的大数据分析

(一)更新高中数学教学思想,以此构建数据分析的概念。很多的老师因为受传统的教学观念的影响,思维方式和教学方法都已经模式化了,并没有树立数据分析的教学观念,俗话说,物质决定意识,意识是物质的反映。如果老师的教学观念还没有及时更新的话,那么,教学行为在这些思想的影响下还是不会出现根本性的变化,为了解决这一难题,在国家新的课程改革中明确提出了“数据分析”这一概念,这一概念的提出标着在大数据的时代背景下我们的国家也越来越重视数据分析在教学中的实际运用,各位老师应该牢牢把握住数据分析的观念,在实际教学中,帮助学生构建数据分析的知识框架。(二)勇于探索,在数学教学中尝试分层教学。现在的高中数学教学的过程中,采用的还是以班级为单位的固定的教学方法,这种教学方法已经是一种既定的模式,对知识接受不同程度的学生他们上课的内容是相同的,这样接受能力强的学生的潜能得不到发挥,接受新知识能力弱的学生跟不上老师讲解的内容,打击了他们学习的积极性和主动性。早在几千年之前,我们的大教育家孔子在教学的过程中就提出了因材施教的教育理念,要求老师在课堂教学中地把握每一个学生的性格特点,来进行知识的传授,不错过任何学生的潜力,同时进行不同类型的教育。在高中数学课堂教学中,教师可以分层次地教学生。一班上有不少学生,学生与学生之间存在个人和个人之间的差异,不同学生的不同类型的教学可以有效地促进教学课堂。个人差异和个体差异明显的小学生,也可以尝试不同的教学方法,尝试新的教学模式,面对个人差异,分不同层次的分析教学给他们,这有助于促进学生更好地学习数学,也充分挖掘学生在数学上的潜力。(三)学习分类和重视数学知识的积累。高中数学是一个强大的抽象性和逻辑性的学科,需要有更大的知识量,这就要求学生学会分类,分类各种数学知识,这有助于学生加深对数学知识的理解,也可以帮助学生理清数学知识的静脉,学生进入下一阶段的数学学习会学得更好。另外,还要强调数学知识的积累。

作者:冯雄德 单位:武威第七中学

大数据分析毕业论文:大数据分析人才队伍资源建设研究

摘要:人力资源的世界充斥着大数据分析和人力资源变革潜力等相关内容。本文以将大数据的未来作为一个战略管理功能,同时将绩效组织得更好。实际上人力资源行业对这一新兴领域上存在部分潜在的缺点,在实际工作和战略中制定更好的方法和途径,它将对人力资源分析现有做法带来变革。而目前的发展趋势是人力资源行业逐步增加对大数据的分析,加大在公司高层战略层面的影响,进而有利于组织发展,并减少损害员工的利益。

关键词:人力资源分析,大数据,人力资源信息系统

1大数据的定义和人力资源分析

数据分析是一门学科,它主要是指已开发的工程,计算机科学,决策和定量方法的组织、交叉、分析和意识。现在越来越多的数据产生在当代社会。数据分析是人力资源专业方向被描述为一个“必须有”的能力,一种创造和扩大人力资源职能的战略影响的价值工具。复杂的人力资源分析行业,主要是围绕产品和服务,这不能提供人力资源创造和捕捉人力资源数据的战略价值的工具。我们认为,对于员工和组织来说,人力资源分析可能有人力资源专业本身的一些负面的后果。具体地说,有风险的分析将进一步嵌入到董事会层面制约人力资源行业的战略,进而影响人们管理财务和工程方面。及时,它可能损害工作生活质量和员工福利,因为它们涉及到人力资源管理方面的影响因子。第二,我们提供了一个概述的学术思考人力资源分析及其潜在的贡献。第三,我们认为这些想法都是不被采用,因为对人力资源行业的人力资源信息系统的局限性,结合部分失败案例和分析行业的重大问题。根据大量引用的行业报告,大数据是什么?对于典型的数据库工具能够获取,较大的存储、管理和分析,具备一定的主观和灵活的定义,大数据定义其范围从几十到上千万兆字节的存储量。大数据的概念和特征与大多数新兴事物概念一样,研究人员没有实现关于如何定义大数据的一致性。但综合众多学者对大数据的定义,我们发现大数据具有海量的,高增长,多样化,新方法,更令人信服的结果。虽然学者对大数据的定义有不同的看法,但他们统一认识到大数据有四个基本特征:体积、变化、速度和价值(低密度数据值)。这是所谓的四大特性的大型非结构化数据的标准。但大的标准来定量数据集用于社会学和能够产生“智能”的见解。相比之下,前者的定义将重点放在非结构化数据,包括电子邮件内容,通过社交网络,网络搜索,数字图像和视频片段,以及智能手机和其他电子设备的定位数据。因此,在实践方面,人力资源数据分析既包括传统的关系型数据库和电子表格分析,又包括新的数据库软件,允许大量数据存储和组织更有效的新技术,通过可视化的数据形式表示。一旦工人受雇于一家公司,对员工的工作时间和薪水的数据进行收集和存储。工作过程中对劳动者以小时向客户计费、个人产量、措施等内容收集,对员工绩效考核起到作用。此外,还有各种“软”的性能数据,可以从评价和绩效管理系统收集,并对其进行培训和发展。事实上,在人力资源的发展过程中,更好地利用这些数据来创建和捕获价值是一个必要的先决条件,更先进的大数据分析的形式正在开发中。

2人力资源分析采用的方法

主要的问题是在于关于人力资源数据和分析的想法,在这里,这些思想已经渗透到人力资源的思考,还有实践方面的问题。人力资源功能缺乏的技能,知识和洞察力的人力资源数据,关于这一点,可能有足够的数据来解释大量的问题。在人力资源管理相关应用中,人力资源是推广和销售有助于人力资源分析方法的解释。要理解这是为什么,有必要研究这个行业和它提供的产品。提供专业人才管理/人力资源信息系统软件,它汇集了现有的一系列人力资源相关数据,最初开发单独的人力资源流程自动化,建立为一个基于云的数据仓库。这些软件包还具有用户友好的图形用户界面,面向员工,其目的是为了协助职业生涯规划、绩效管理、进一步的知识学习和共享。这种软件通常集成与其他企业资源规划的软件模块,包括金融,会计,供应链和物流,客户关系管理和制造管理等领域。这种类型的人力资源信息系统的主要目的是通过使它更容易和更快的访问和了解人力资源,提高人力资源流程和操作数据。主要管理咨询机构都开发了业务销售组织实施综合性人才管理套件的技巧和诀窍。通常,一个公司的人力资源管理系统的使用,是建立在公司的以前的客户的基准(即比较对象),并在此基础上,并提出了一个新的IT战略。顾问公司建议新的软件和硬件产品,这将好地满足战略目标。从战略人力资源的角度来看,这类软件的问题是什么?不是提供战略和预测分析,人力资源信息系统通常提供的答案是在更有限的时间内主要提供集中在业务报告。这些报告并不是没有太大价值。通过报告以确保制度执行的法律合规性。有证据表明,在组织环境中,个人的绩效可以衡量奖励绩效工资,标准的仪表板报告关键绩效指标可以产生令人印象深刻的性能改进。然而,种种迹象表明,这种形式的分析,并不是较大地提高了性能。咨询驱动的实施方法也可能是有问题的,因为咨询活动往往是针对销售产品,而不是解决客户的问题。采购过程组织聘请顾问服务,简而言之,人力资源数据的大部分价值是通过使用它来回答人们如何为组织创造价值的战略问题而实现的,因此价值可以被捕获和利用。这些问题最终的结果是,即使是大型跨国机构,在人力资源分析进行了大量的投资,并在嵌入分析企业报告说他们的人力资源分析计划没有超出历史信息报告等领域的长足进步。因此,许多公司一直在试图制定前瞻性的战略分析受挫,而不知道如何将大数据纳入其人力资源分析计划。在这种类型的争论中,关键是在工作过程中似乎是一些公司在特定行业经历了一个真正的人力资源相关的问题。这个具体问题被重新想象为所有大公司所面临的普遍问题。一个昂贵的软件开发,该解决方案不在自己的工作,因为它没有解决本职工作,而声称是发展应对能力;相反,它是一个工程项目没有足够的时间思考要建立何种模型。然而,模仿的同构是以积极的销售活动从大型IT公司和咨询公司的驱动导致的广泛采用。导致没有对产品的弱点分析,对结果的失望,但在转移的企业环境,新产品是为了解决这些新环境的挑战,转向开发和销售,为新产品建立在以往产品的基础之上的,并受到类似的限制,结果也同样令人失望。

3具体解决方案

在数据分析中,如果大公司预算他们的股东的资金在昂贵的专有分析软件包,不履行他们保障做什么,如果大多数企业HR功能缺乏从事分析议程倾向技能,如果人力资源不能充分参与建模过程,在模型的方式被从根本上误解了人力资本投入的性质为生产和服务提供的过程构建较大的范围。而不是认识到劳动的灵活性,生产力和性能的变化与技能,时刻参与的动机和设计的过程的相互作用,劳动建模为一个固定的成本,需要加以控制。除非分析嵌入在一个完整和的分析模型,在仪表盘的数据格式在有限的信息内容,可能被误解的运营和财务管理的一个有限的耐心和人力资源的考验。这不只是一个假设问题,已经有大量的例子,如何建模和基于算法的管理方法正在降低工作质量和破坏性能。其中一个比较好的例子来自零售业。然而,假设劳动力是被控制的成本没有考虑到劳动力投入的质量与绩效结果有关系。用更少的人减少人力成本也可以降低劳动投入质量工作者传播更薄,因此没有时间来确保显示组织诱人,股价保持移动到货架或客户收到帮助请求时,这个过程也对工人不好,谁失去了他们的工作或看到他们的收入削减。在美国,工人的后果可能尤为严重,因为这种方法可以用来确保工人被遵守的时间门槛,使他们能够享受较好的员工福利,如薪酬待遇和医疗保险等等。在某些情况下,工作经验成为工人的行为和互动越来越在大数据算法上需要尽更大的努力和减少员工自主性和实时控制。相反,经过研究发现,增加人员编制水平实际上增加了盈利,因为高质量的劳动力投入和销售的增加大于额外的劳动力成本。正是这种实验,人力资源分析应促进和鼓励增加编制。所以员工的策略在某种程度上通过大数据分析仪表板,从人力资源战略的输入是不必要的,可以采取削减员工人数和相关规定的人力资源政策。

4在实际操作中应用

我们相信,学术界扮演重要角色。目前分析软件缺少的是建立纵向的,多元的计量经济学模型的能力,需要进行“终端到终端”的分析。我们自己的对话与人力资源分析专业人士在组织中取得了重大进展,在桥接分析/人力资源差距表明,即使这些组织不具备技能或专业知识,更先进的统计和计量经济学技术。这种类型的分析,理清相关的因果关系,通过实验和准实验分析是必要的。标准信息分析软件包不具备的灵活性和力量来进行这种多元的纵向分析,这需要专业的统计或计量经济学出现,因为学者可以提供失踪的专长和因为他们理解定量分析和人力资源,所以能够很好地帮助弥合差距的人力资源专业人士和组织为基础的数据科学家之间的相互理解。学术研究人员还需要面对本体论和方法论的问题,如果这种合作是证明富有成效的。超实证主义的本体论框架,已经占据大部分的工业心理学、劳动经济学的可能障碍有效的学术从业者的合作。这种方法是针对预测和控制在所谓的封闭系统,而不是发展因果关系的现实世界的开放系统的理解。理论推导的措施往往在包括在实证模型抽象的组织社会背景,意义是模糊的。人力资源相关的学者通过在人力资源分析和大数据研究,为高校教学的发展提供了实践支持,促进学术人力资源和组织绩效之间的关系的理解。在研究经费下降的情况下,通过对研究对象的一部分参与调查,在一定程度上会推进人力资源及性能关系的理解方式。

5结语

在大数据分析技术方面,人力资源管理功能落后于其他管理领域。相反,从行业来看,基于大数据的人力资源分析正在发展成为一个“必须有能力”,这将确保人力资源的未来作为一个战略管理职能。人力资源行业的许多人不理解人力资源的大数据分析,而分析团队不了解HR。作为一个结果,昂贵的分析能力,通过新的形式提供,也未能提供人力资源战略分析能力。人力资源分析的一种不同的方法是必要的,这开始与人力资源数据如何可以用来创建,捕捉,杠杆和保护价值的问题,然后寻求发展的答案,通过更先进的纵向多元建模的形式,这是问题的答案。那么这个结果可以用来通知人力资源实践和发展意义的日常指标。学者可以在这方面发挥建设性的作用,但也可能做更多的事来阐明战略人力资源分析的实践,进而有益于组织的发展,减少损害员工权益。

作者:袁全波 赵雅琪 付劲松 单位:北华航天工业学院