在线客服

社交媒体文本分析实用13篇

引论:我们为您整理了13篇社交媒体文本分析范文,供您借鉴以丰富您的创作。它们是您写作时的宝贵资源,期望它们能够激发您的创作灵感,让您的文章更具深度。

社交媒体文本分析

篇1

文献标志码:A

文章编号:1002-0845(2007)06-0000-00收稿日期:2006-12-04作者简介:张福远(1978-),男,河北廊坊人,教师,硕士研究生,从事比较高等教育、教育社会学研究;宗淑花(1969-),女,河北香河人,讲师,从事职业教育研究。

“如果拨开美国高等教育的美丽光环,笼罩在下面的本科生教育质量问题就会暴露出来”。自20世纪80年代以来社会各界对美国研究型大学的指责就不绝于耳,而其中批评最多的则是忽视本科生教学的问题。

一、功利主义的驱使

美国的研究型大学之所以将本科生的教学置于边缘地位,其中一个主要的原因就是“惟利是图”。这种功利主义的驱使让学校和教师对本科生的教学都无法热衷起来。

1.对经费和排名追求―――忽视本科教学的幕后黑手

美国研究型大学经费来源主要有五条渠道:联邦政府、州及地方政府、学费、私人捐赠以及学校的销售和服务。以1995年为例,联邦政府及他渠道对大学投入的研究经费总共为269亿美元,而大学本身的投入为39亿美元,只占总投入的14.5%[1]。可见,研究经费主要来自大学外部的支持。大学在获得外部经费支持的同时,一些不利影响也相伴而生。其一,外部对大学的投入明显带有实用主义倾向。这迫使大学潜心于见效快、易赢利的应用型研究,从而忽视了基础研究。其二,效益至上企业精神被贯穿到大学的管理之中。大学过分强调这种精神势必会导致教师太注重个人可见业绩,而忽视教学。其三,联邦政府对大学研究经费的资助大幅缩减。据统计,自20世纪80年代后联邦政府对研究型大学的经费资助不到以前的60%[2]。为了缓解财政危机,研究型大学不得不以更快更多的研究成果来换取外界的经济援助。然而,本科教学与外界的经济支持没有直接关系,这也是忽视本科教学的一个主要原因。

为了获得更多的经费,大学必然要施展浑身解数。其中开展研究项目、建设一流的学科、追求大学的排名为各大学所热衷,因为这些与研究经费的申请直接挂钩。于是申请项目、引进知名教授,以此来提高学科和大学的排名,就成了大学获取研究经费的主要手段。美国伯克利大学教授Clark Kerr 认为,这种盲目的追求是造成本科教学被荒废的一个主要原因。在他的著作《The Uses of the University》中写到:由于一个学校的品牌是争取科研经费的门面,这就需要引进一流的研究教授。于是造成了大学花大价钱去挖“明星研究员”的情况[2]。然而,这些重金聘请来的大牌教授不愿意从事本科教学,大学只好再聘请专门的“教书匠”来应付本科生的教学。由此可见,研究型大学为了在研究经费的竞争中获得更多的份额,纷纷将精力投入到研究项目的建设、学科排名的提升等领域中。而对于本科生的教学,因为不能得到实惠就自然居于次要地位了。

2.不合理的晋升与报醚机制―――教师远离本科教学的“罪魁祸首”

人们工作的主要目的之一就是要追求更高社会地位和经济收入,这本来无可厚非,美国大学的教师对此也同样津津乐道。问题并不在于此,而在于研究型大学不合理的晋升和报酬机制,使教师在追求这些目标的过程中产生了偏差。

首先,来看晋升机制。在美国许多大学教师梦寐以求的是能够获得一个“终身教授”的职位。然而这极为困难,申请者需要做多项独立科研、发表高水平文章、指导博士生等工作才有机会争取到“终身教授”的职位。这些晋升的条件中,科研和学术是最重要的因素。2001年美国博耶本科教育委员会对研究型大学进行了一次调查,调查中教师在回答“你为何重研究,轻教学?”这个问题时,许多教师都提到:感觉教学并未被领导给予足够的重视―――奖励太少、在晋级中分量太轻[3]。这是一个非常现实的问题,研究型大学的教师要想获得晋升机会就要在科研和学术上大做文章,本科生的教学自然就受到了冷落。再来看教师的报酬与学术和教学的关系。在研究型大学研究者与“教书匠”的收入差别很大,研究型教授年薪可以到20万美元,但是以教学为生的“教书匠”教一门课只有三千美元;还要面临失业的危险。所以在研究型大学,同事们将专心于本科教学的教师戏称为“奉献型教师”[4]。这种不合理的晋升与报酬机制长期存在,教师的思想中就产生了一种强烈的功利主义倾向,即要想迅速提高自己的收入与威望,就要以研究为重。长此以往,对本科生的教学重视―程度就可想而知了。

二、分类和评价机制的偏好

1.缺失的分类标准―――本科教学遭遇冷落的隐患分类机制会使事物产生一种“升级效应”,也就是说会产生一种追求更高类别的趋势。美国大学的分类机制,也同样对其产生着“升级效应”。但是,由于这种分类标准将某些重要的因素排斥在外,于是造成了在追求升级过程中的一些隐患。1900年美国大学协会确立研究型大学的两条标准:一是该大学是否设有研究生院,二是该大学是否为大学协会会员。1970年卡内基教学促进基金会首次提出了《高等教育机构分类》的报告,其中提出了研究型大学分类的两个量化指标:博士学位的授予数和科研经费的数量。1994年,卡内基教学促进基金会在1987年的分类标准基础上,制定了新的分类标准。新标准将研究型大学区分为研究型大学I 类和研究型大学Ⅱ类。[1]

从卡内基教学促进会对美国研究型大学分类的不断修正中,可以看出虽然分类的量化指标系数在不断变化,但是主要是以博士学位的授予权和数量,以及得到研究经费的数量两个方面作为标准。而分类标准中对本科教育的相关条件却只字不提,这无疑为美国大学在追逐研究型的过程中忽视本科教学埋下了隐患。

2.有失偏颇的评价机制―――把本科教学导向低谷的无形之手美国大学的评价在世界上是最丰富的,其中以《美国新闻》的评价被认为最具权威性。笔者就以《美国新闻》的大学评价指标体系为例来说明评价机制对研究型大学本科教学的影响。其大学评价指标包括7项指标,分别是:同行评价和学校声誉(25%)、师资质量(20%)、在校生的回返率和毕业率(20%~25%)、新生质量(15%)、学校资金(10%)、毕业率的增长(5%)以及校友捐款人数的百分比(5%)。从这7项评价指标中可以看出,没有一项指标是直接将“本科生的教学质量”作为衡量标准。只有在“在校生的回返率和毕业率”这个选项中提出两个维度:“其一是一年级新生的回返率;其二是6年的毕业率。”第一年的退学率往往是4年中最高的,回返率占这一标准的20%。另外,美国大学实行学分制,学生毕业少至3年,多至七八年。因此,6年毕业率成为衡量大学质量的另一重要标准,占此项的80%。于是,在评价指标体系中回返率和毕业率,就成为了能够代表学校教学和服务质量的标准。在这样的评价机制下本科生的教学质量很难得到准确的评估,也就是说本科生的教学对于大学评价影响不大。

三、学术观念的偏差

大学是学术的圣地,教师或多或少都摆脱不了对学术的倾慕,而学者型教师正是美国所倡导的大学教师形象。在美国的研究型大学绝大部分教师都赞同这样的观点:学术起始于对知识的发现,即研究。因此,研究成了学术的最初含义与重要内质。教师往往把研究等同于学术,由此导致学者的职责就是研究。进而推之,学者的责任感越强,就越乐于把研究视为个人之事,就越易于出现自己埋头搞研究的现象。美国大学的大批教师正是因为有此学术观,才表现出重研轻教的行为。从另一方面而言,把学术等同于研究的学术观是排斥学者以教学为重的,因为教学不是研究,本科教学尤其与学者的研究存在着诸多差异。

然而,“学术二研究”吗?对这个概念的认识直接影响着大学教师的职业认同。如果将学术与研究划等号,则无法解除大学教师认识的内心矛盾。因此,必须建立新的学术范式,重新界定学术的内质。基于此,博耶先生提出了一种新的学术观,即学术包括发现、综合、应用知识与教学四个方面[7]。这种新的学术观,将学术看作是一个动态的过程即:发现―综合―应用―传播,四者交替进行、相互作用、不断循环,构成了学术健全的身躯。而教学就是一种最有效的传播方式,于是教学就成为了学术研究过程的一个环节,也就不能被排斥在学术研究之外。如果研究型大学的学者们都能以博耶的范式来界定学术,把教学看作学术研究的一部分,那么就可以给教学以足够在重视,研究型大学的本科教学就不会受到今天这样的冷落了。

综上所述,美国研究型大学对功利的追求导致的短视效应,缺失的分类与评价机制以及狭隘的学术观是造成许多研究型大学教师只顾研究不重本科教学问题的深层原因。

参考文献:

[1]沈红.美国研究型大学的形成与发展[M].武汉:华中科技大学出版社,1999

篇2

1.在金融学研究中文本大数据的挖掘方法

传统研究方法通常采用人工阅读方法对文本信息进行识别,因为文本数量庞大、信息构成复杂,人工识别效率较低,而且信息识别质量不稳定,信息识别效果受到阅读者专业素养、理解能力等多方面因素影响。计算机技术发展后逐渐被应用于分析文本大数据,利用计算机技术获取语料,对文本资料进行预处理、文本表示、抽取特征等操作。完成上述步骤后,在研究分析中使用文档特征,从而开展深入分析[1]。在分析文本大数据时,主要采取如下流程:(1)从众多信息来源中获取语料,对语料文档进行解析,明确文本定位,清洗数据,获得文本分词,标注词性,将其中停用词清除。(2)构建词云、词嵌入、词袋模型与主题模型。(3)分析文本情绪、可读性、相似性,分析语义关联性。(4)监督机器学习、词典语法处理[2]。

1.1获取语料

获取语料的方法主要分为两种:(1)人工获取;(2)利用网络工具爬取或抓取。其中人工获取语料投入成本较高,耗时较长,需要投入大量人力,因此网络抓取的可行性相对较高[3]。网络抓取方法可有效应对大量文本量,在一定程度上降低文本大数据获取难度。在网络抓取语料时,需要借助编程语言,通过直接抓取或爬取的方法获取文本大数据。采用此种语料获取模式具有两方面显著优势,不仅获取文本信息耗时较短,效率较高,而且可直接使用编程语言整理内容和规范形式,为后续文本分析工作奠定基础[4]。

1.2预处理环节

获取目标语料后,前期需要预处理文本,解析、定位文本,清洗数据,标注分词与词性,最后去除停用词。金融市场通常要求企业采用PDF格式作为信息披露文档格式,文本预处理中首先需要解析富格式文档,获取文档信息。定位文本和清洗数据环节中,利用计算机程序定位文本信息[5]。在该类研究中,MD&A研究热度较高,使用正则表达式进行财务报告正文MD&A定位首尾信息部分,提取上述信息。此外,文本信息中除核心内容结构外,还包括超文本标记语文、脚本语等代码信息、图片信息、广告信息等,该类信息在文本分析中属于噪声内容,需要删除和清洗相关信息,从文本中筛选有价值的核心内容[6]。文本分词处理与文本语言密切相关。英文文本使用空格划分单词,即自然存在分词形式,也可采取提取词干、还原词形等方法划分单词。中文文本中不使用空格分词,根据中文语言习惯,词语为最小语言单位,可独立使用。基于此种背景,分析文本时需要专门分词处理中文文本,例如:使用Python开源“jieba”中的中文分词处理模块处理文本,股票论坛帖子文本、年度业绩说明会以及企业财务报告均可使用该类工具处理,完成分词。在针对中文文本进行分词处理时,其中实施难度较高的部分是识别新词、歧义词与控制切分颗粒度。在处理歧义词时,需要科学选择分词方法,采用“jieba”针对文本进行分词处理时,选择分词模式是否科学直接影响分词精准度。分词处理新词时,需要用户在相应模块中自行添加新词,完善自定义词典,从而使分词软件识别新词[7]。语义信息被识别的关键依据是词性等语法特征,词语切分后标记词语词性操作被称为词性标注。词性标注操作可帮助计算机进行词语种类识别,避免词语歧义,对语法结构进行有效识别,从而促进计算机顺利进行语义分析。词性标注时,中英文操作方法不同,词性划分英文单词要求比较严谨,利用词尾变化反映词性变化。在英文词汇中,许多固定词尾可提示详细词性信息。在处理中文词语中,并无明确词性指示,词性识别依据主要为语法、语义等。简言之,英文词性识别标记注重形式,汉语词性标记以语义为主。在处理文本信息时,需要将文本信息中停用词去除,从而保证文本挖掘信息具有较高精度。所谓停用词,即自身词义表达有限,然而对于句子语法结构完整性而言非常重要的词语。停用词导致文本数据具有更繁琐维度,导致分析文本的成本较高。英文中动词、连词、冠词均为常见停用词。中文处理方法比较复杂,必须结合语言习惯分析停用词,不仅需要处理特殊符号、标点符号,还需要处理连词、俚语。除此之外,应根据具体研究内容确定停用词。在进行文本情绪研究时,特定标点符号、语气词等会影响文本表达的情感信息,对于此类信息需要予以保留,从而保证文本情感程度得到准确分析。

1.3文档表示环节

文本数据为高维度数据,具有稀疏特点,使用计算机处理文本数据时难度较高,预处理实施后,必须通过特定方式表示文档信息,通过此种处理降低后续计算机分析和人工研究难度。词云、词嵌入、词袋模型、主题模型均为核心表示方法[8]。词语技术具有可视化特点,是文本大数据技术之一。所谓本文可视化,即使用视觉符号显示复杂内容,展示文本规律。根据生物特性,人们习惯于通过视觉获取文本信息,实现文本可视化可提高信息提取效率。使用词云技术可有效描述文本中词汇使用频率,采用醒目形式显示高频词汇。词袋模型的构建基础是无严格语序要求的文字词组存在[9],以此种假设为前提,文本相当于众多词语集合,采用向量化方法表达文本,在此过程中只计算各个词语出现频率。在词袋模型中含有两种构建方法:(1)独热表示法;(2)词频-逆文档频率法。前者的应用优势是可行性较高,操作难度较低。例如:现有如下两个文档:(1)文档一:“经济学中文本大数据使用”;(2)文档二:“金融学中文本大数据使用”。以文档一、文档二为基础建设词表,根据词序实施词袋化处理,确定词袋向量。对于出现的词,以“1”表示,未出现的词以“0”表示。但是在实际操作中,不同词语在文档中出现频率存在差异,通常文本中高频词数量较少,许多词汇使用频率较低。为体现文档中不同词语的作用,对单词词语赋予权重。TF-IDF是计算文档定词语权重的有效方法。含有词语i文档数描述为dfi,集合中文档总量描述为N,逆文档频率描述为idfi,第j个文件中词语i频率描述为tfi,j,第j个文档内词语数量描述为aj,第i个文档内词语i权重描述为tf-idfi,j,则公式应表示为[10]其中,的前提条件是不低于1,0定义为其他情况。较之独热表示法,TF-IDF方法的特点是对每个单词赋予不同权重。在赋予其权重的基本方法时文本中该词汇出现频率越高,其重要性越高,与此同时语料库中该词汇出现频率越高,则其重要性相应降低。词嵌入处理中,主要是在低纬度连续向量空间嵌入指定高维空间,该高维空间维数包括全部词数量。在金融学领域中进行文本研究时,词嵌入技术通常采用Word2vec技术,该技术中主要使用CBOW技术与Skip-Gram神经网络模型,针对神经网络进行训练,促使其有效捕获词语中包含的上下文信息,对词语进行向量化映射,得到的向量语义信息更加丰富,信息密度更大,信息维度更低。主题模型中应用频率较高的是LDA模型,应用此种模型进行文本分析属于无监督机器学习法,通过此种方法才能够大量集中语料中提取主题信息。在应用该方法时,将生成文档的过程分为两步,首先假定各文档具有对应主题,从这些主题中抽取一个主题,然后假定文档具有对应词汇,对比之前抽取的主题,从词语中选取一个与主题对应的词语。完成上述迭代后,将其与文档中各词语拟合,从而获得各文档主题、主题中词语分布情况。LDA模型主要优势是,与手动编码相比,该模型性能更完善,可有效分类大规模文档。该模型做出的文本主题分类支持复制,准确性较高,而采用人工手段分类文本时较易受到主观性影响。此外,使用此种模型时,无需人工分类进行关键词、规则设定。LDA模型的缺点是在主题预设个数时,受到研究者主观因素影响,选择主题个数的数量受此影响显著,因此生成主题过程与归类文本主题时较易受到相关影响。

1.4抽取文本特征的方法

文本特征是指文本可读性、相似性、文本情绪以及语义关联性。其中文本可读性即读者在阅读文本时是否可较容易地理解文本信息。在编辑文本时应保证文本具有较高可读性,保证投资者通过阅读文本可有效理解文本信息,即确保文本对投资者投资行为产生积极影响。有研究者在文本分析中使用迷雾指数,该类研究认为,迷雾指数与年报可读性呈负相关。年报文本字数、电子文档规格也是影响年报可读性的重要因素。在使用迷雾指数评价文本可读性时,常见的问题是,随机排序句子中词语将导致文本难以理解,然而正常文本和经过随机排序处理的文本在分析计算时,显示相同迷雾指数。不仅如此,在进行商业文本测量时采用迷雾指数作为依据具有显著缺陷,例如,当对企业披露信息进行可读性分析时,难以有效划分年报可读性与该企业实际复杂性。基于此种背景,在针对年报文本可读性进行评价时,需要结合企业业务复杂性等影响,提出非文本因素[11]。在提取文本情绪时,通常采用有监督机器学习法与词典法进行提取操作。词典法即在文本情绪、语气语调研究中使用情绪词典辅助分析。词典确定后,该类研究即支持复制。不仅如此,建设词典时还需要融合大量金融学专业知识,从而使词典与金融文本分析需求一致。使用现有多种类词典、文献等分析媒体报道情绪,针对财务报告进行语气语调分析,以及进行电话会议等进行语气语调分析等。中文大数据分析时,通常是以英文词典、词库等为模板,构建中文情绪词典。使用该类词典辅助分析股票成交量、收益率,评估股市崩盘风险高低。在词典法应用中需要结合加权法进行文本情绪分析[12]。有监督机器学习法包括支持向量机、朴素贝叶斯等方法。采用此类方法时,重点环节在于对分类效果进行检验和评价。交叉验证法是常见检验方法。有监督机器学习法的缺点是必须人工编码设置训练集,工作量较大,并且人工编码较易受到主观因素影响,分类效果鲁棒性较差,并且研究难以复制。其优点是分类精确度较好。

2.文本大数据分析

大数据分析主要是进行财务报告等公司披露文本信息、搜索指数、社交网络文本以及财经媒体报道等进行分析。通过文本挖掘从海量文本中抽取核心特征,分析其可行性、相似性、语义特征、语气语调等,然后分析股票市场行为与文本特征等相关性。分析披露文本信息时,主要是利用文本信息对企业财务、经营、管理层长效经营信息等进行研究。在进行此类研究时,重点是分析文本可读性、相似性,以及分析语气语调。披露文本可读性较高时,有利于投资者有效获取公司信息,影响投资行为。迷雾指数理论认为,财务报告具有较高可读性的企业通常具有更长久的利润。此外,有研究者提出,财务报告可读性直接影响盈余预测离散性和可靠性。财务报告可读性较低时,公司为减轻此种消极影响,可采取自愿披露措施缓解消极影响。管理者通过控制财务报告可读性可对投资者行为做出影响[13]。在针对企业发展情况和股票市场发展趋势进行分析时,披露文本语气语调具有重要参考价值。相关研究认为,MD&A语气内含有增量信息,该类信息为企业长效经营能力进行预测,同时可根据该类信息分析企业破产风险。管理者情绪状态可表现在电话会议语气中,此种语气分散情况与经营决策具有相关性,同时语气对投资者感知、分析师评价产生影响。分析财经媒体报道时,主要关注媒体情绪,分析媒体报道着眼点,针对经济政策进行分析,了解其不确定性,此外还需要研究媒体报道偏向信息、假新闻等。进行社交网络文本研究时,主要是分析策略性信息披露情况与文本情绪。搜索指数研究方面,主要通过搜索指数了解投资者关注度。

篇3

长期以来,互联网舆情是人们所关注的重点。通过网络所、传播、共享的舆情信息,是展现广大人民群众心态、体现政府能力和信心的重要手段。随着当前社交网络、移动网络等新型互联网平台的出现,目前对互联网舆情服务的要求正在日益增强。

现有的互联网舆情监测评估系统在语义处理上采用基于关键词的技术,其在网页处理上直接的局限表现在不能有效地进行实体识别,影响了主题定义的质量,导致系统在热点追踪、文本分类等核心功能的实现质量不高;在数据处理能力方面,由于系统运行在能力有限的物理分割服务器上,导致海量舆情数据的分析能力不足[1]。本文引入语义计算[2]、云计算[3]、主题检测等技术,为舆情分析提供了强大的数据采集、存储和处理能力,可以依据不同需求的用户提供不同的舆情分析能力和服务。

本文所提出的针对互联网中出现的新型移动平台、社交平台、舆情数据海量化等新兴状态,采用云计算技术、社交网络分析技术、语义计算技术、文本流主题检测技术、垂直搜索引擎技术等在内的多项新型技术,针对多样化和海量化的舆情数据展开监测和评估,并通过云计算所具备的全新计算架构,针对不同需求的用户提供按需计费、可定制和可弹性管理的商业服务模式,最大程度上契合用户的需求并降低用户的使用费用,通过空间、虚拟机和舆情评估模块定制等跳过用户自行投资信息化硬件建设的成本,为用户提供低价优质的全新舆情监测与评估体验。

1 整体方案

下面,本文将分别从舆情检测技术、云计算平台架构、舆情传播分析技术等三个方面阐述本文所提出平台的技术方案。

1.1 舆情检测技术

主要由三个部分组成:(1)信息采集:主要完成网络舆情信息的采集工作,用户可以通过指定站点、频道、时间范围等对这部分功能进行定制。信息采集主要通过Crawler对网页进行采集,或者通过专用DB导出工具,直接挂接到站点的服务器上实现舆情信息的高效采集。(2)用户接口:允许用户采用专门需求对自己的评估监测需求;允许用户专业特点、应用体验对系统的功能重新进行定制;完成舆情监测评估的报告的反馈呈现功能。(3)舆情监测评估控制:对监测评估需求进行语义解析,并据此调度监测评估程序库的程序,来完成监测评估结果,而后将结果以图形、表格、文字报告等形式反馈给用户。

1.2 云计算平台

云计算平台主要分为四个层次:基础资源服务层(即IaaS层)、数据服务层(即DaaS层)、平台服务层(即PaaS层)和软件服务层(即SaaS层)。在这四个层次中:(1)IaaS层:基础资源虚拟化、基础资源动态负载平衡、超大规模高速网络聚合带宽技术、云安全控制。(2)DaaS层:基于ETL的海量舆情实时信息处理、大规模舆情信息文本流分类管理、海量舆情数据安全防灾管理。该层中将通过结构化数据库(Oracle)和非结构化数据库(HBase和Hive)等同时管理存储数据。(3)PaaS层:标准接口管理、异构数据交互与转化、服务部署、任务分配与平衡。该层中将部署节点控制器、集群控制器等实现平台管理。(4)SaaS层:统一访问门户、舆情采集、管理与分析挖掘应用部署。

1.3 舆情传播分析技术

当重点聚焦当前舆情传播中的用户社交关系的分析和处理:(1)用户社交关系路径获取与分析技术:实现不同ID情况下用户身份的统一识别和认证;继而对用户的网络社交关系、社交圈等进行记录和分析,从而获取用户对于每一个舆情主题的传播路径等。(2)用户社交关系的计算基础技术:该技术为用户社交关系、社交圈、社区身份等信息提供可计算的逻辑基础,从而使每一个用户的社交关系、身份信息等具备可定性或定量计算的可能。(3)用户关系在舆情传播中的路径和影响力预测技术:该技术可计算并预测不同程度和性质的用户关系可能会导致舆情主题的传播方向,传播对象和传播群体;同时可针对不同用户关系,预测这些关系和路径对舆情主题传播可能产生的附加影响力。

2 关键技术

本文所提出的舆情数据服务平台主要包括以下四个方面核心技术。

(1)大规模网页信息采集、网页信息抽取、文本实体识别技术:通过构建云计算平台,利用云计算技术实现计算资源整合,并进一步利用虚拟机动态分配、网络节点分布式计算等实现大规模网页舆情数据的爬去的采集;利用语义计算、垂直搜索引擎技术、文本过滤、自然语言处理技术等实现了网页信息的抽取与文本实体识别,最终完成舆情信息的采集、分类、抽取等功能。

(2)基于云计算的大规模、分布式舆情信息分析处理能力:在云计算平台下,划分出专门的虚拟机,通过云平台下MapReduce并行算法,完成舆情信息的汉词切分、语料分析、主题提取和分类、舆情情感计算,最终实现舆情信息的分析处理功能。

(3)基于社会关系的移动社交网络(微博等)信息舆情传播模式分析技术:依据互联网媒体平台中用户的社会关系,对移动互联网、社交网络等媒体中所出现的舆情数据进行深度分析,利用用户社会关系实现对舆情传播模式分析,最终完成主题传播跟踪、舆情影响力评估、舆情预测等功能。

(4)大规模舆情文本流主题检测分类技术:针对互联网大规模文本流舆情数据,利用在线舆情文本进行主题建模技术、在云计算平台进行自动的非监督学习,对舆情文本进行分类、检测等。

3 结语

本文提出一种以云计算、语义计算、用户关系计算、文本流主题检测等技术为基础,克服了传统舆情检测系统仅仅依赖于关键字、词频等统计手段的缺点,同时涵盖了互联网、移动互联网、社交网络等不同传统和新兴网络载体,以面向服务的互联网舆情监测评估系统作为主,并向行业应用以及个人应用服务。

参考文献

篇4

[3]孙茂松,王洪君,李行健,等.信息处理用现代汉语分词词表[J].语言文字应用,2001,(4):23-28.

[4]ICTCLAS[EB/OL].http://.

[5]黄美璇.基于主题发现的舆情分析系统的设计与实现[J]. 北京联合大学学报,2012(2):34-36.

[6]唐果,陈宏刚.基于BBS热点主题发现的文本聚类方法[J].计算机工程,2010(7):79-81.

[7]蒲筱哥.Web自动文本分类技术研究综述[J].情报学报,2009(2):233-241.

篇5

有趣的是,他们在论文中以自身最熟悉的领域——可视化研究作为其中一个案例,将2001年至2010年间发表在IEEE Vis和InfoVis两个学术会议上的933篇论文作为文本数据集合,通过TextFlow模型得出了与实际学术发展潮流相当吻合的图表,其结论令人信服。例如,整体上看,过去10年间Vis相关主题有日渐式微的趋势,2006年之后各个主题独立发展;InfoVis与之相反,整体的趋势是上升的,主题之间的合并和分割非常多,说明该领域的研究更活跃。

他们是如何做到的呢?崔为炜向我们解释了文本可视分析的步骤(如上图所示)。首先,主要由机器来完成海量文本的收集和预处理工作。然后,利用自然语言分析中的概率模型HDP(Hierarchical Dirichlet Process)计算出文本所属的主题(topic)。这里假设每个主题都是由一组关键词来描述的,关键词以不同的概率出现在不同的主题中,每篇文章自然也会以一定的概率属于不同的主题(注:传统聚类方法会认为每个文本只属于一个主题)。刘世霞强调,HDP模型的优势是可以自动确定文本中的主题数量,但是它只能计算出一组静态文本数据的主题,无法进一步找出主题之间的关系。2010年的时候,他们成功改进了HDP模型,将这个语言模型扩展到能处理动态的文本数据流。简单地说,就是跟踪比较T1和T2两个时刻文本内容的变化情况,由此来确定主题之间是否发生了合并或者分裂。文本分析的最后一步就是利用前面得出的主题演化结果,计算出其中的关键事件和关键词,从而更好地展示事件发展的来龙去脉。

在谈到TextFlow模型对于主题合并和分割判断的准确率时,刘世霞表示目前还没有一个固定的样本集可供测试,但把多个领域的分析结果拿给相关领域专家查看时,他们都认为结果比较准确,可以达到满足应用的水平。另外,我们还了解到TextFlow模型的主要算法本身与语言是无关的,中文与英文的区别主要在于海量文本预处理阶段的分词技术,这方面已经有成熟的技术可以完成。

William Ribarsky是北卡罗莱纳州大学Charlotte可视化研究中心创始董事,非常关注微软亚洲研究院在文本可视分析方面所做的工作,他在美国召开的一次学术会议的发言中提到刘世霞所做的交互式可视文本分析,并称“这项成果令人刮目相看”。在扑面而来的大数据时代,相信未来利用TextFlow模型可以做许多帮助企业提升生产效率的事情。崔为炜向我们演示的案例中既包括对历史新闻事件的回放,也包括跟踪社交媒体的数据预测即将发生的新闻事件。由此引申开来,所有之前难以度量的文本数据或许都能迎来一次重生的机会。在信息时代,谁能把握住信息的脉搏,谁就能更好地把握住时代的脉搏。

文章开头虚构的面试题,大家找到答案了吗?

声音

我们应该把文本挖掘技术和可视化这种交互技术结合在一起,让人去做人擅长的事情,机器去做机器擅长的事情。机器擅长做什么呢?机器比较擅长去存储,做大数据量的运算,而人有分析的能力。因此,我们的工作主要就是把人的智能和机器的计算能力结合在一起。

——刘世霞

微软亚洲研究院网络图形组主管研究员

篇6

另一方面,由于微博的加入,其实时性、开放性与交互性使得整个“周一见”事件文本的生产与消费方式越来越高明,每一个媒介文本的出现都恰如其分,整个事件的媒介文本逻辑严密,文本的交互性呈现无处不在。这两个方面的传播现象共同的介质就是媒介文本,并且在微博的推波助澜下,媒介文本的“互文性”生产愈加灵活多样。

网络造句的热度反映着受众对事件和文本的消费热情,这种热情也在推动着媒介文本连续剧式的呈现。从谢晓的“微博预告”开始,小道消息满天飞,网友猜测,真实图文报道,到文章的供认不讳和致歉声明,马伊琍的微博回应,文本的呈现至此将事件引入一个高峰。舆论的压力让文章微博继续发声“我贱命一条,陪你们到底!”直接叫板《南都娱乐》,让网友们联想是否是《南都娱乐》报私仇,《南都娱乐》官微回应否认“报私仇”传闻,随即署名为“马伊琍爸爸”的微博号发文质问《南都娱乐》,希望还家庭安静,事情发展接近尾声,喧闹的文本现象也逐渐平息。但我们从主要媒介文本的呈现经过可以看出,每一次媒介文本的生产及呈现都恰如其分,有严密的逻辑性和故事发展情节。事情的发展以《南都娱乐》发起,并于每次与当事人交锋引起舆论,文章的反应和其岳父的发文以及网友一边倒的谴责文章同时也暗示着《南都娱乐》的传播目的成功实现。

二、互文性文本的两个维度

互文性不仅体现在文本交互性呈现的表现形式上,通过互文性的文本呈现也深刻揭示着整个事件中媒介文本生产与消费的意义。著名媒介文化研究学者约翰·菲斯克在《电视文化》中从水平和垂直两个维度分析电视文本的互文性,笔者借用菲斯克分析电视互文性的两个维度的研究思路,并结合互文性的广义(解构主义)视角——发生性互文与接受性互文分析“周一见”事件涉及的媒介文本的互文性生产,将文本按水平维度分为事件当事人文章、马伊琍的言论;按垂直维度,将事件当事人文章、马伊琍的文本分为一级文本,将媒体报道、网友评论分为二级文本(见下表)。

发生性互文和接受性互文是分别从文本的生产和接受两个角度对媒介文本进行剖析的。而在利用互文性视角解析文本生产时,接受与生产是必不可少的两个过程。“周一见”事件的二级文本基本是对一级文本的回应,是在对一级文本接受、解构的前提下并结合历史文本生产的结果。而一级文本的生产过程也是基于对先时文本的接受、解构进而产生的回应与结合。正如大量网友指出的文章的致歉声明有抄袭高晓松之前酒驾致歉声明之嫌,说明文章的微博致歉声明或多或少是对高晓松版致歉声明有某种程度上的接受,而又因事件性质的不同和身份的不同,存在具体内容的差异,因而最终产生的文本是一个对先时文本的接受、解构与再生产的过程。又如“伊琍挺住”、“伊琍不哭”等网友评论,首先是对一级文本文章致歉声明的抗拒性解读与对马伊琍“且行且珍惜”微博的接受性解读;其次,“挺住”“不哭”等句式初在2008年汶川地震时便已出现,成为一种流行的固定的网络文体,用以表示对汶川的支持,后来在玉树地震、雅安地震中也大量出现。网友将这个文体用在这里,显然是借对这个历史文本的互文性生产表达对马伊琍的同情与支持。因此,在互文性的文本分析视角下,不论是一级文本还是二级文本,都是在对先前文本的接受或解构的前提下,或结合历史文本,或结合现实环境生产的结果。

而这些文本生产与消费对于事件的内涵意义的生产方面,也从水平和垂直维度的文本中得到体现。从水平维度来看,媒介文本是由事件的当事人文章所发,代表了当事人的传播意图和立场。文章的致歉声明与之后的微博因互文性相互关照,后文是对前文意义的强调。文章所发微博虽然言辞粗鲁,但是很急切的表达了他不希望事情继续发展,希望媒体息事宁人。但当事者生产文本的本意却并没能够得到受众的完全解读。因为从垂直维度来看,媒体的报道和网友的评论呈现愈演愈烈的态势,并且舆论的导向也偏离文章减轻形象伤害的意图。在此事件中,二级文本的生产者站在一级文本生产者的对立面,例如谢晓接受腾讯访谈称“马伊琍给我发了一条感谢短信”,更加印证事件的真实性和文章出轨男的形象,以及《南都娱乐》所发表的言论始终坚持一个态度和立场,引导受众按自己的传播意图去解读这些文本。在这场对立文本生产与消费过程中,网民受众是一群基础性的存在,他们的评论和立场推动着一级文本和二级文本的生产,他们的评论即构成了对所有媒介文本的消费。

三、微博文本生产与消费的背后

&ld quo;周一见”事件的发生、发展过程的报道表面上是一个新旧媒体争相爆料、共同发声、合理推进的过程。实际上,在新兴媒体和移动互联网的冲击下,传统媒体面临激烈的竞争压力,该事件某种程度上可以看做《南都娱乐》为提高自身公信力和影响力而制造的一次对自身传统报业品牌的营销活动。

微博具有传播速度快、流传广的特点,同时它也是一个负面消息散布极快的平台。《南都娱乐》最先选择微博发声是刻意为之,意在利用微博的传播特点和强大用户群体,使话题迅速扩散,产生社会影响。从对文本的分析以及事件的发展可以看出,《南都娱乐》一直掌控着报道的导向和受众的导向,比如最先的微博预告中“我也理解当事人此时的焦灼,但请相信此报道绝无任何阴谋论,记者也拒绝了巨大的利益诱惑”表明信源的真实公正客观,树立传统媒体的权威性。不论是“周一见”热词的火爆、网民的全体参与,还是文章的回应“我贱命一条,陪你们到底!”都在印证着《南都娱乐》的借势营销、传播意图取得成功。

通过对“周一见”事件的微博文本分析说明,一个热点娱乐事件或热点社会事件的产生和发展、其文本的生产与消费既有宏观层面受众、媒体和技术发展的因素,也有微观层面文本生产的方式的影响,文本的互文性生产与呈现、文本生产者的立场与文本传播的意图都对整个事件的文本的产生与消费起着重要作用,特别是在新媒体技术的支持下,对社交软件的精心驾驭能够一定程度上促进事件的传播。

参考文献

①胡晓云、陆琪男,《“故宫星巴克”事件中的媒介文本研究》[J].《广告大观》,2007(5)

②约翰·菲斯克:《电视文化》[M].商务印书馆,2005

篇7

1、引言

伴随着旅游消费群体的日趋年轻化以及具有旅游分享等功能的社交媒体的普遍应用,社交网络成为众多旅游企业认识和影响潜在消费群体、推广旅游服务产品、开拓新兴市场的重要平台。然而,现有研究文献中,对于旅游服务的网络营销问题主要集中于传统的媒体营销理论,同时对于红色旅游的网络营销特点与社交网络行为具有较深入的考察。比较有代表性的有,张伟对我国旅游企业网络营销的总体状况进行了分析,并结合网络媒体营销的特点对旅游企业开展网络营销提出了相关建议〔1];闰贺平和甘永萍以桂西为案例对红色旅游的营销对策进行了研究〔2];吴丽对我国旅游传统网络营销的研究现状进行了系统的回顾和梳理 〔3];周刚以云南省为例对该区域红色旅游的市场营销与网络应用做了分析与展望〔4]。

为此弥补上述研究空白,本文以湖南韶山红色旅游为研究对象,采用技术软件实时采集与营销相关的微博数据,并通过建立社交网络营销影响效应评价体系并采用文本分析等研究方法,系统考察韶山红色旅游社交网络营销的发展现状与存在的主要问题,探索推进红色旅游服务的社交网络营销绩效的相关措施。

2、韶山红色旅游社交网络营销现状与影响效应评价

本文通过网络爬虫技术主要采集了从2013年9月到2014年2月间新浪微博上与韶山景区相关的内容数据。其中,包括热门签到地点的微博分享数据,具体地点有故居、韶山铜像广场、同志纪念馆、韶山宾馆、毛家饭店(韶山纪念园东)、韶山纪念园(纪念伟人花卉大观园西北)等等,共采集到微博1123条,除去与红色旅游无关的微博,保留有效微博695条。另一部分是同一时期“湘潭市旅游局”、“湖南红色文化研究所”、“湖南红色旅游文化节”、“韶山下的成人礼”等韶山红色旅游主要企事业单位与活动主办方自有账户的微博分享数据,主要对其中的账户粉丝量、微博数量、申请时间(以第一条微博时间为准)、关注数量等进行了收集整理。

从中可以看出,韶山红色旅游的相关自有账户微博更新频率低,更新时间较为集中,微博更新不规范。粉丝数量相对较少,影响力较低。进一步采用文本分析技术,分析上述账户的微博内容,可以发现其微博内容较为杂乱,与红色旅游相关且体现营销行为的内容较少,缺乏原创性内容分析,多数为转载和摘抄。具体问题如下:

(1)整体上,缺少正规的韶山红色旅游网络宣传平台及运营维护团队。在搜寻韶山红色旅游微博内容过程中,我们并未发现以“韶山红色旅游”命名的正规账户,多是以事业单位和主题活动命名的公共账户,且该类账户主要用于主题活动的信息,比赛结果公开等,没有体现具体的旅游内容与互动性。

(2)内容数量少,更新频率低,更新时间不规律。在所统计的4个主要自有账户中,两个已经停止更新,账户微博总量最多的为127条,日均博更新1.8条,最少的只有127条,日均更新仅有0.1条。微博数量少且更新不及时,直接影响营销力度,体现出旅游企业对社交网络营销宣传的重视程度不高。

(3)营销内容缺乏针对性。调查发现,韶山红色旅游的相关微博内容公共账户的微博内容多为时政热点、活动宣传,广告推销等,而游客更关注景区的交通状况、特色美食、景点容量以及景区环境质量等。缺乏吸引力,而且与红色旅游产品及服务相关的内容较少,对红色旅游的宣传及推广作用有限。

(4)传播形式单一,缺乏与消费群体的良好互动。现阶段的营销内容主要是景区的形象宣传,传播形式上采取单向推送,反复转载。主动推介和与关注群体互动较少,并且传播活动缺少较细致的策划和专业设计。

进一步地,我们参考孙尚清提出的红色旅游评价体系〔5],将红色旅游社交网络营销行为对潜在消费者的影响效应分为饮食、住宿、旅游便捷、购物、景区质量等五个方面12个评价指标(见表2)。并采取中文分词和关键词统计,计算微博营销内容的平均值、标准差、提及次数及其排名。我们用指标平均值作为营销对消费群体的影响度(我们采用5分评价值,其中3分以上为偏正面评价,3分以下为偏负面评价),用提及次数作为消费者对旅游服务相关内容的重要性评价,即重要度。从表2数据来看,目前潜在消费者对韶山景区的旅游产品主题丰富程度的重要性最为认知,其次是饮食、旅游服务特色和交通情况,对旅游住宿、环境卫生与纪念品的重要性认知程度最低。说明现阶段红色旅游社交网络营销的重点集中在旅游产品本身及其区域特色,而对于旅游体验中的基本保障条件缺乏营销力度,这将在一定程度上会影响潜在消费群体对旅游整体体验的评价。而从营销的影响度来看,潜在消费者对韶山红色旅游的旅游特色、饮食与购物、住宿环境、服务质量等评价较高、而对住宿价格、交通情况、旅游产品丰富程度评价较为负面。因此,结合对社会网络营销效应影响度与重要度的评分,营销改进策略应该是推进当前评价较为负面且又是营销较为缺少的方面,即红色旅游的产品丰富程度、交通和住宿等等。

3、结论及建议

通过对韶山红色旅游的社交网络营销现状与影响效应的分析,可以发现现有旅游企业在营销过程中存在明显的营销定位偏差,缺乏系统规划,深层次的原因是其企业营销策略缺乏针对性与网络营销平台建设不够完善。因此,为了促进红色旅游网络营销的有效实施,强化景区知名度与景区形象,挖掘潜在市场,深度影响潜在消费人群,建议做如下改进:

(1)建立专业网络信息系统及运营维护团队。须建立专门的网站营销部门,以社交媒体公共账户为核心,培养专业的运营维护团队,引进包括日常维护,网页制作、网站维护、语言编辑、内容推广等各方面的专业人才,建议规范的运营体系和质量控制机制,确保网络营销活动中信息传递的准确性、及时性、互动性和传播层面的广泛性。

(2)突出具有红色旅游特色的个性化产品宣传。网络平台不仅仅是销售平台,更是旅游企业与消费者交流的平台〔6]。相关企业应该充分利用社交网络平台的丰富互动功能,加强自身产品的营销模式与内容结构,突出个性化的红色旅游产品与服务,强化互动性和体验感,使游客更为了解旅游相关产品。同时,还应侧重对旅游主题的品牌建设与口碑宣传,引入意见消费者,营造更为紧密的消费者与企业间关系。

(3)以游客需求为导向,加强社交网络信息的收集与挖掘。网络平台既是旅游企业自我宣传的媒介,也是获得消费者需求与评价的重要信息来源。通过构建基于大数据和商务智能等数据挖掘机制与技术平台,改进红色旅游的服务质量,创新产品设计,挖掘新兴市场。

(4)与多种网络营销模式组合,形成立体营销网络。现有的网络营销方式多种多样,口碑营销、媒体营销、新闻营销、电子杂志营销、软文营销、SNS营销、QQ群营销、社会化媒体营销等等营销模式与社交网络互动营销具有较强的互补性。旅游企业可以多种营销方式组合,建立全方位立体的网络营销体系,扩大对影响的覆盖面与渗透力度,〔7〕从而推动对潜在消费人群网络营销的深入发展。

〔参 考 文 献〕

〔1〕张伟. 关于我国旅游企业网络营销状况的分析〔J〕. 产业经济,2006,12:371.

〔2〕闰贺平,甘永萍.红色旅游营销对策研究-以桂西为例〔J〕.东方企业文化,2007,11:68-70.

〔3〕吴丽. 我国旅游网络营销研究综述〔J〕. 乐山师范学院学报,2013,(01):92-97.

〔4〕周刚. 关于红色旅游市场营销研究-以云南省为例〔J〕,北京第二外国语学院学报:旅游版,2006,(06):54-60

篇8

非结构化处理流程主要以网页处理为例来阐述,包括三个阶段,分别是信息采集、网页预处理和网页分类。

信息采集是将非结构化的信息从大量的网页中抽取出来保存到结构化的数据库中的过程;网页预处理主要是进行一些数据清洗的工作,保证分类质量;网页分类工作则是通过数据挖掘算法训练出来的分类模型,对分类数据进行分类提炼,得出有价值的信息。

信息采集

信息采集面对的是特定的专业人群,其采集的信息只限定于特定的主题和相关的领域,出于对性能和成本的考虑其不必也不可能对整个互联网进行遍历,因此主题信息采集中通常需要研究以何种方式预测链接指向的页面与主题的相关性,并判断其是否值得访问;需要研究以何种爬行策略访问Web,以在尽可能多地采集到主题相关页面的同时尽可能少地采集到主题无关的页面。

信息采集的基本方法是通过预先设定的种子链接集,利用HTrP协议访问并下载页面,在用各种分析算法分析页面与主题的相关性之后提取出待访问的链接,预测链接指向主题相关页面的可能性,再以各种不同的爬行策略循环迭代地访问网页。

信息采集根据基于主题的不同可分为以下两类:一类是基于内容的主题信息采集:它需要建立一个针对主题的词表。另一类是基于超链接的主题信息采集:它是基于网页之间的引用关系,类似Page rank算法。

网页预处理

网页预处理部分本文主要介绍一下网页去重,网页去重可以归为两类:一类是基于URL的对比去重,它适用哈希算法;另一类是基于内容的对比去重,它适用基于信息指纹的文本相似度算法。

网页去重需要先对文档对象的特征抽取,需要将文档内容分解,由若干组成文档的特征集合表示,该步骤主要是为了方便特征比较计算相似度。之后需要针对特征的压缩编码,主要通过哈希编码等文本向数字串映射方式以方便后续的特征存储以及特征比较,起到减少存储空间,加快比较速度的作用。最后需要进行文档的相似度计算,这一步需要根据文档特征重合比例来确定是否重复文档。一般是对网页提取一个信息特征,通常是一组词,或者是词加权重,调用特定的算法,转化为一组代码,也被称为指纹。若两个页面有相当数量的相同指纹,那么可以认为这两个页面内容重复性很高。

网页分类

分类问题是人类所面临的一个非常重要且具有普遍意义的问题。将事物正确地分类,有助于人们认识世界,使杂乱无章的现实世界变得有条理。自动文本分类就是对大量的自然语言文本按照一定的主题类别进行自动分类,它是自然语言处理的一个十分重要的问题。文本分类主要应用于信息检索,机器翻译,自动文摘,信息过滤,邮件分类等任务。文本分类的一个关键问题是特征词的选择问题及其权重分配。

在搜索引擎中,文本分类主要有以下用途:相关性排序会根据不同的网页类型做相应的排序规则;根据网页是索引页面还是信息页面,下载调度时会做不同的调度策略;在做页面信息抽取的时候,会根据页面分类的结果做不同的抽取策略;在做检索意图识别的时候,会根据用户所点击的URL所属的类别来推断检索串的类别等等。

网页分类方法有SVM分类方法和朴素贝叶斯方法:其中比较推荐的是SVM分类方法,Vapnik等人在多年研究统计学习理论基础上对线性分类器提出了另一种设计最佳准则。其原理也从线性可分说起,然后扩展到线性不可分的情况。甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(SupportVector Machine,简称SVM)。支持向量机的提出有很深的理论背景。支持向量机方法是在近年来提出的一种新方法。

典型的SVM分类有两种,一种是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;另一种是基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。

典型的朴素贝叶斯分类,它可以分为模型训练、模型分类和分类结果评估三个阶段:模型训练阶段,主要计算训练集下所有类别的先验概率,以及所有特征词在每一个类别下的条件概率;模型分类阶段,对训练集建立模型;对每个待分类文档计算后验概率,后验概率大的类别为文档所属类;分类结果评估阶段:对分类结果进行抽样、人工检验。分别计算出每个类别分类的查准率和查全率,通过F―度量公式评估模型准确度。

二 自然语言处理的典型方法与应用

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。研究能实现人与计算机之间用自然语言进行有效通信的理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。

自然语言处理部分主要以舆情分析为例,舆情分析系统的数据来源有三个渠道,一是网络上公开的信息,如各大交易所每日评论,社交网络各方观点和财经门户网站。二是从合作方获取的信息,如交易信息等。三是微博、人人网等社交网络信息。

网页信息摘要

网页信息摘要需要将同一主题下的多个文本描述的主要信息,按压缩比提炼出一个文本的自然语言处理技术。对于互联网上海量的期货分析报道,如果能从中提炼出一个覆盖性强、形式简洁的摘要将具有重要的意义。

如何收集企业的战略信息?面对海量信息,一个研究员需要花费4个小时阅读相关信息。借助语义引擎,把50篇文献缩略成10余条概要,面对概要信息,一个研究员需要花费3分钟阅读相关信息,并形成思考。借助文字情绪引擎,把概要内容指数化、知识化,面对指数信息,一个研究员需要花费2秒钟阅读相关信息,并获得决策支持所需的知识。

热点事件预测

热点事件的发现与预测的算法有很多,最行之有效的方法是做大规模的逻辑回归。在大数据的背景下,我们拿到的数据是全量并非抽样,这使得类似逻辑回归等简单算法起到事半功倍的效果。通过历史事件传播数据,提取向量,并做逻辑回归出规则,就可以做很多预测。例如美国大选,疾病传播,甚至预测死亡。

维克托・迈尔-舍恩伯格写的《大数据时代》一书中就有这么几个关于热点事件预测的案例:

案例一:华尔街“德温特资本市场”公司首席执行官保罗霍廷每天的工作之一,就是利用电脑程序分析全球3.4亿微博账户的留言,进而判断民众情绪,再以“1”到“50”进行打分。根据打分结果,霍廷再决定如何处理手中数以百万美元计的股票。他的判断原则很简单:如果所有人似乎都高兴,那就买入;如果大家的焦虑情绪上升,那就抛售。这一招收效显著――当年第一季度,霍延的公司获得了7%的收益率。

案例二:美国一个超市将女性顾客中的孕妇视作购物的黄金消费者。为了将这部分目标人群在怀孕前就争取过来,该超市通过调查罗列出几十种购物偏好,当某位顾客的收银条上集中呈现这类商品时,就会被认定为可能是孕妇或家中有孕妇,超市随后向其发送孕妇产品广告。一次,当有人以“家中并无孕妇却总是收到相关产品广告”为由控告这家超市后,却发现原来是自己还在上高中的女儿怀孕了。

案例三:2009年甲型H1N1流感病毒出现,在没有疫苗的情况下,公共卫生专家能做的只是减慢传播速度,要做到这一点,专家必须先知道流感出现在哪里,这只能依靠各地医生发现并告知疾控中心,信息肯定是滞后的。可是,Google的工程师们比疾控专家更早地判断出流感从哪里传播出来,他们依靠的就是Google所掌握的大数据。

历史相似事件可使用文档相似度比较。文档相似度比较算法首先采用TF-IDF方法把文档建模为词频向量,然后使用向量距离计算算法求得。常用的距离计算方法如:Jaccard距离、欧式距离、余弦相似度等。

情感分析

正负情感度量化统计分析一般用于分析金融机构和大众对期货产品的态度、情感和观点倾向,对行情走势往往具有十分重要的意义。通过对收集来的信息进行情感度分析后,可以统计出社会舆论对期货未来走势的观点倾向度。通过计算历史舆论观点与走势的相关度可以验证情感度分析模型的有效性。

情感词监测模块是通过对金融期货网站定时采集更新,对舆论话题进行连续监控,提取热点关键词,实现热点信息的实时发现。通过搜索引擎抓取情感关键词热度,计算关键词与趋势相关性。

主题词表的优劣在相当程度上影响了系统后续的信息采集内容和效果。首先,由领域专家给出相关领域的权威网站作为基础语料来源,通过对权威网站网页内容的整站抓取获得领域语料资源。之后对语料资源进行中文切分词和词频统计,获得一张高频词表。再由领域专家对高频词表中的高频词汇进行整理,人工选取出与领域相关的词语。然后,对从高频词表中选取出的领域主题词进行上位词(花是鲜花的上位词,植物是花的上位词)、下位词、同义词、近义词扩展,去除重复词汇,从而最终形成相关领域的主题词表。在信息采集系统后续的采集中还将不断收集相关领域的新词汇,在发现领域新词后加入到领域主题词表中,形成系统性的反馈机制,从而不断对主题词表进行更新维护。

正负情感度量化统计分析是从抓取的文章中进行情感度分析打分,分数范围为不等。负数越大表示负面观点强度越强,正数越大表示正面观点强度越强,0表示持有中立态度;通过情感度分析可以统计出一段时间内社会舆论对于某个话题的正负面态度,舆论压力往往可以导致市场波动。

情感词检测通过对金融期货网站定时采集更新,对舆论话题进行连续监控,提取热点关键词,出现频率较高的词语作为热点信息词,实现金融热点的实时发现。

趋势分析和预测

根据交易的价格曲线走势,与综合指数对比,使舆论指数趋势体现与交易价格曲线的相关性和一定的前瞻性。通过构建时间序列模型,对未来走势进行预测,如图1所示。综合指数包括各个相关因素的变化趋势(天气因素等)以及舆论指数。

三 行业应用案例

数据挖掘和自然语言处理的应用范围广泛,其中也不乏一些有意思的案例,它可能应用于运营商、银行、传统企业和券商,挑选几个具有代表性的案例与大家分享。

电信行业

某城市电信运营商的上网日志分析系统,该系统通过收集用户上网日志历史记录数据,分析出每个用户的偏好。首先该系统通过并行统计清洗出每个人有效历史上网日志URL;然后从日志URL中抓取网页内容,提取正文,并通过文本分类算法计算分类;最后通过统计出每个用户上网关注类别总数,分析出每个用户的偏好。

金融行业

某大型股份制商业银行供应商风险评估系统,该系统通过抓取供应商内部数据,如企业年报、公司变动、领导情况、财务状况等数据,分析公司运营指数;通过计算各供应商社交数据,对其社会影响力做评估;通过同行之间的数据分析对比,对供应商进行实力评估。这些数据指数可以有效协助商业银行进行供应商风险评估。

地产行业

某房地产企业的社会化品牌实时营销系统,该系统通过社交媒体(微信、微博等)数据,进行网络口碑监测,负面情绪被及时发现并制止;通过与客户进行互动,争取客户忠诚度;通过监控同行及竞争对手的各方面资讯,量化评估竞争态势;快速提升品牌知晓度和美誉度,将媒体影响力转换为客户量,缩短人气聚集周期。

篇9

一、研究问题及意义的引出

似乎由罗永浩的锤子手机引发,“情怀”开始流行。2014年5月,锤子手机会上他宣称锤子手机是富有情怀的设计、同年12月为宣传而进行《一个理想义者的创业故事》系列演讲、以及2015年8月推出坚果系列锤子手机后,由锤子团队策划吸引全民炮制“漂亮的不像实力派”情怀风海报。围绕他的锤子手机,媒体和受众的解读变成了“卖的是情怀”“较量在市场与情怀之间”等。

那么,罗永浩的“情怀”被拿来营销了吗?笔者找到了同样被定义为“情怀营销”的澎湃新闻、快看漫画等热门事件,提出这样几个问题:1.为什么是“情怀营销”而不是“情感营销?这是一种新方式吗?2.“情怀”这么意识流的存在是如何传播的?笔者观察到的共同点是:几起事件都离不开社交媒体的推广,还有传者创造的具有影响力的文本;3.所谓“情怀营销”用“情怀”打营销牌,是否存在一些问题?

二、界定研究对象

(一)“情怀”是什么?他们具有情怀吗?

“情怀”一词在《新华辞典》里有四层意思:1.心情;2.情趣,兴致;3.胸怀;4.文学情致。

从这些定义中我们可以得出这样几个内涵:“情怀”大多与文艺有关,表示文人、理想主义者的一些心情、兴趣、理想、想法。

罗永浩的身份,用他自己的总结:“2002年从互联网出道,在作为公众人物的这些年里,做牛博网、做汶川赈灾、做英语老师,后来办自己的英语培训学校,面对公众做的事几乎都是好评一片。”他已经表明了自己身上的几个符号:公众人物、从事文艺公益事业。作为他的粉丝,笔者解读到的情怀还有:他对于社会不公的敢怒敢言,以及狂妄不羁的表达和创建民主社会的理想。

邱兵,复旦新闻系才子,东方早报社社长,澎湃新闻CEO。除了《我心澎湃如昨》外,著有《邱兵的理想主义篇章邱四篇》,为了抵制刻意讨好读者的通俗文章的《如果重要不妨枯燥》等,从他的这些身份和构建的文字符号不难看出,他身上“文艺”“理想”的情怀标签。

安妮,90后,创业者,漫画家,微博红人。她一直以独立漫画家和“文艺”“励志”段子手的身份活跃在微博上,2014年12月15日《对不起,我只过1%的生活》以漫画的形式勾勒了她从大学至今的奋斗历程,最后点出了她创业的励志梦想,结尾是她《快看漫画》的3元收费App下载链接。不难看出她身上的“文艺”“理想”的情怀标签。

(二)他们营销了自己的“情怀”吗?

1.陈安妮与《快看漫画》

上面已经谈到,三起事件中“1%生活事件”是最明显的例子,安妮以漫画的形式讲述了自己实现梦想的路,最后推出自己的APP,希望网友们下载。这在微博上已累计转发了38万次,点赞31万次,评论7.9万次,在朋友圈里也高速地转了起来,有超过30万的用户下载了她的APP。简单地以单个APP需要3元的推广单价来看,陈安妮已经从这次营销中赚到了90万元的费用。此外还有各种隐形的营销成功,更多的粉丝,更多的读者,更高的知名度,甚至吸引来更多的合作机会。

2.邱兵与《澎湃新闻》APP

《我心澎湃如昨》一文讲述的其实是80年代一批纸媒理想主义者和报纸谈了一场直至最后令人心碎扼腕叹息的恋爱,字里行间流露着媒体人更懂的同感,“我们爱了四年,我无法确定我是爱着你,还是爱着我爱你的这些岁月。”文章很浪漫,但不要忘了现实是:澎湃新闻要上线了。从文字符号看,看似在抒情追忆,实则用恋爱的故事、用“初恋”的字眼在表征对报业的热爱会转移到新媒体中,这其实是在向读者表决心。这就是澎湃新闻的发刊词,这就是一个盈利性媒介用它的情怀文俘虏阅读者的同时,也强势地营销了产品。

3.罗永浩与锤子手机

锤子手机会前一周,罗永浩发出“如何让一部手机看起来有‘教养’?”的微博,这种“犀利的调侃”的罗氏风格,不难看出是在为7天后的会预热。

接下来,罗永浩用自己“言论大牛”的身份成功地将一个手机会变成了“单口相声”:如播放PPT时草草念了一些专业词汇,说道,“这些你不用懂,你只需知道是目前量产的全球最快的移动CPU,全球最好的显示屏之一”。不难看出他跳过了技术解读、直接带入“罗氏”讲解风――“强调牛逼不解释”,这和他那句至理名言“彪悍的人生不需要解释”如出一辙。另外,当外界质疑英校长如何领着英语老师做手机?罗永浩回答:“我不为输赢,只是认真”,可见,他在面对外界质疑一样“偏执”“理想主义”。

类似的风格在微博上同样有迹可循:称即使有同事劝他实体键多了容易坏,他还喜欢三个实体键的设计。这条微博引发了他与网友间的骂战,他理想主义式的回答“不做市场调研,让大部分用户去死,我们是给精英人群做的”,让我们大跌眼镜,原来那个说话放荡不羁的罗永浩还在,他的“情怀”不变,并且在这对话中激发了他内心销售“情怀”的表达。

(三)“情怀营销”和“情感营销”是不是一回事?

从上面的分析中,我们看到了在三起事件中确实存在“情怀营销”,那么从专业角度看,“情怀营销”可以成为一类营销方式吗?为什么不是“情感营销”?

1.情感营销是什么?

赵保国综述了目前关于情感营销的定义,情感营销指把消费者个人情感差异和需求作为企业品牌营销的核心,借助情感设计、促销、服务等策略,通过准确的产品定位和销售中有分寸的“切人”,使消费者持续不断地感受心灵的冲击。

不难看出,“情感营销”是一种沟通方式、强调将用户情感设计到产品中的一种设计理念、更强调关注受众情感。

2.“情怀营销”与情感营销一样吗?

从“情怀”的定义看,它的特点是,主体上多为赋有理想、文艺爱好的人;从“情怀营销”分析来看,它更看重的是传者自身具有的魅力,如老罗的情怀、邱兵的新闻理想、安妮只过1%生活的励志故事,因而营销的对象也就变成了传者个人魅力的认可者或者他们的粉丝;从营销的符号看,“情怀营销”多以抒情的文字为主;目标多标榜“理想”而不是成功或者盈利。从这些来看,“情怀营销”与“情感营销”显然是不同的。

笔者尝试给出一个定义,“情怀营销”是以传者个人理想主义价值观而不是受众体验为内容,以抒情符号为表现方式,以传者价值观的认同者或其粉丝为对象,以标榜“理想”而不是“成功”“盈利”的营销方式。

三、“情怀营销”是如何运行的

由于情怀营销的主体是传者而不是受众,那么仅凭传者个人魅力显然难以完成一次营销,那么它的运行机制到底是什么?

(一)传者构建文本的意义――以陈安妮与“1%的生活”为例

快看漫画因为安妮“对不起,我只过1%的生活”的微博营销迅速走红,从其文本分析,有这样几个主要原因:

1.微博直指“梦想”主题。这是时下很热的一个话题,几乎算是一个永恒的话题。主打“梦想”这个点,关于梦想,大家怎么听都不嫌多。

2.有故事。不是每一个拿“梦想”说事的都能够疯狂地转起来,要有故事,讲自己的故事、自己努力后终于成功了更动人。“每一个人在感动的时候其实都是在为自己感动,如果我也像你一样”,这种逻辑自然渗透到了每一个受众中,得到愈来愈多的支持。

无独有偶,《我心如昨澎湃》一文之于澎湃APP,老罗个人语言之于锤子手机的营销,更见明显:将个人理想和情怀包裹在文字、语言中,以过度阐释形式吸引着与之产生情怀共鸣的读者,进而完成产品的营销。

(二)粉丝在社交媒体上的行动

社会化媒体加速了情怀的传播。从传者出发,他们只要拥有一个微信或微博的公众号,就抢到了话筒。当话语足够漂亮,对已有产品的攻击足够到位,就形成了有力的传播武器,比如情怀文《我心澎湃如昨日》在朋友圈内引起的大量转发,以及安妮的1%生活在微博、微信中数十万的转发等。

从受众看,社交媒体赋予了他们寻找身份认同和共同阐释空间的可能。通过“推荐”或者“转发”寻找与自我相符合的文化,比如安妮的1%生活,邱兵的《我心澎湃如昨》,他们的情怀触摸到了受众的神经上,造成他们共同的行动。如蔡琪认为,“在互联网大行其道的时代,网络为粉丝构建阐释性社区及帮助他们勾勒对集体身份的想象都有帮助”。

四、关于“情怀营销”的一些隐忧

除界定“情怀”营销的内涵,还应该看到它的问题:“情怀营销”关注传者本人的理想价值,容易忽视产品本身的考量。

有专业评论称安妮靠“条漫”而称的漫画没什么技术含量;更有专业人士从营销出发,批判“情怀营销”忽略了产品应有的规模、技术及运营,如快看漫画App成功运行后的一大问题是:安妮团队忽略了内容聚合上的版权问题,许多刊登的漫画未标明来源。

2014年一个流行的段子是:“熬夜看完老罗会的录像,老罗做事认真,关注每一个细节,真不错。我已经准备好了钱,等锤子手机一上市,我马上就买一个iphone6。”这段话来自他的粉丝。仅从会的观众构成来看,他们大多都是听着老罗语录长大的大学生,如今已成为各行业的骨干。他们理解老罗的情怀,但同时拥有更为缜密的逻辑和自主意识,因而对于他们,在消费上性价比、质量这些标准比“情怀”更重要。

参考文献:

[1]罗永浩:在情怀和市场间较量[EB/OL].http:/// a/20140530/12444058_0.shtml.

[2]赵保国,余宙婷编著.营销策划与案例分析[M].北京:北京邮电大学出版社,2012.

篇10

一、汉派服装品牌的现状与机遇

汉派服装在20世纪90年代曾经名噪一时。然而进入21世纪后,汉派服装在产业结构和产品结构的调整中却逐渐落后于长三角、珠三角服装产业集群(刘晓慧,2012)。近年来,湖北省政府和武汉市政府规划对服装产业进行重点产业调整和振兴。2012年,纺织服装产业的营业收入占湖北省工业比重的7.1%。2014年3月,武汉市政府常务会议通过了《武汉市振d服装产业专项规划(2014-2019)》,计划2014-2016年共投入6000万元专项资金支持在汉服装企业发展,以期在2019年实现全市纺织服装产业产值突破1000亿元,打造“中国服装名城”。然而,在解决了政策利好和资金投入的背景下,汉派服装尽管坐拥科教和产业基础的优势,但是其缺乏品牌建设的“木桶效应”日益凸显。专家认为,汉派服装的品牌建设应从名牌、人才、创新、企业文化、社会责任(罗颖,2003;陈汉东,2009)五点策略出发,重视品牌服装文化的传播功能。但这些建议并没有结合网络媒体的兴起,对重振汉派服装品牌提出具体的传播策略。某种程度上,汉派服装品牌建设的滞后,与汉派服装企业在互联网的产业融合趋势中被边缘化是分不开的。这就需要汉派服装站在互联网的战略高地上重新寻求品牌突围的机遇。

社交媒体是一组基于Web2.0的网络技术和传播理念建立起来的互联网应用,它实现了用户生产内容的传播(Kaplan & Heanlein, 2010)。新兴的社交媒体在品牌与利益相关者建立稳固关系的方面表现突出。它为品牌以“自然人”身份涉足利益相关者的社会网络,挖掘人际关系价值提供了便捷方式,实现了针对特定利益相关者进行互动的精准品牌传播(舒咏平,2010)。其工具性价值不断被服装品牌所重视。

《2012中国企业内容传播和新媒体应用调查报告》(美通社,2013)显示,91%的零售/服装/快速消费品企业开通了社交媒体主页/官方微博。在过去12个月,72%的零售/服装/快速消费品企业表示曾因社交媒体上的粉丝的意见或反馈,调整或修改过产品、服务或市场策略。欧美服装品牌在利用社交媒体方面已经积累了成功的经验。巴宝莉借助社交媒体的全球品牌传播,已经成为数十亿英镑级的英国服装巨头(Phan, Thomas & Heine, 2011)。美国的快销服装品牌GAP运用社交媒体与消费体验相结合的品牌传播策略,通过与利益相关者的深层互动凝聚了老顾客和青年一代消费群体(Mangold & Faulds, 2009)。

尽管汉派服装企业也注册了社交媒体账户与消费者直接沟通,但其表现并不尽如人意。本研究试图通过发现汉派服装品牌在社交媒体传播中的问题,帮助汉派服装企业认识到问题之所在,并提出相关建议。这一研究结果对其他地区服装品牌,甚至其他行业的企业运用社交媒体进行品牌传播同样具有借鉴意义。

二、研究方法

本研究遵循“现状调查――案例对比――问题分析――策略总结”的研究思路,运用内容分析以及案例分析的方法,同时对汉派服装品牌、杭派服装品牌、国外服装品牌的社交媒体传播情况展开网络调查。

(一)样本选取

本研究以社交媒体的提及率为主要指标,兼顾市场占有率,选取了20世纪90年代以后成立的五个汉派服装品牌:元田树、太和、红人、佐尔美、名典屋作为研究样本。同理,选取JNBY江南布衣、LESIES蓝色倾情和衣香丽影三个品牌的社交媒体账户为杭派服装品牌的样本。ZARA、GAP和优衣库的社交媒体账号为国外服装品牌的样本。其中,杭派女装品牌因与汉派服装品牌有着相似的发展背景和模式,一直被视为汉派服装品牌的直接竞争者。以“快速反应”著称的西班牙品牌ZARA,美国老牌服装品牌GAP,世界第四大服装零售商日本品牌优衣库,则代表了国际服装品牌使用社交媒体进行品牌传播的前沿水平。

同时,考虑到社交媒体在使用意识、考虑、购买、服务和忠诚的购买周期模型中扮演了不同的角色。本研究选取新浪微博(后称微博)、腾讯微信(后称微信)和天猫官方旗舰店(天猫)三个平台作为社交媒体应用的样本。其中,微博的社交关系公开属性对考察消费者的品牌认知有重要作用;而微信具备较强的私密性,对维护品牌形象和提高品牌忠诚度具有重要作用;天猫的消费者口碑是提升品牌认知度和树立品牌形象的重要渠道。

(二)服装品牌社交媒体传播评价体系的建构

为了更好地实现品牌之间的横向比较,本研究在已有的社交媒体品牌传播效果评价指标体系研究基础上,结合数据的可获得性,建立了品牌社交媒体传播的三级指标评价体系。主要包括:(1)社交媒体的使用概况评价指标,包括媒体工具使用、发帖规律等;(2)社交媒体品牌传播内容评价指标,涵盖服装品牌社交媒体的传播方式,内容风格,传播理念。(3)社交媒体消费者品牌认同的评价指标,从认知、态度和行为三个层面进行构建评价指标。具体指标体系见表1。

(三)数据来源及其统计分析方法

本研究搜集了2014年7月1日至2014年12月31日微博、微信、天猫三个社交媒体平台上的有关数据。针对三个社交媒体平台的数据特点,本研究分别采用了三种不同的数据采集和分析工具。其中,微博上的品牌用户数据主要由ROST CM6软件分析。该软件是武汉大学沈阳教授研发编码的国内目前唯一的以辅助人文社会科学研究的大型免费社会计算平台。可以实现微博分析、聊天分析、词频统计、聚类分析等一系列文本分析。火车采集器软件(Locoy Spider)用于采集天猫的消费者评价数据,以及微博关注者的评价内容,该软件是一个供各大主流文章系统,论坛系统等使用的多线程内容采集程序,适宜于搜集品牌用户每一条微博之后的用户评价数据。而微信目前没有可靠的数据挖掘软件工具,主要以人工收集的办法获取数据。此外,对文本内容的分析主要通过研究者的编码和解读完成。

三、汉派、杭派与国外服装品牌的社交媒体传播比较

通过与国外、杭派服装品牌的社交媒体传播情况进行横向比较,本研究发现汉派服装品牌在运营社交媒体中存在的问题主要体现为:

(一)社交媒体的整合传播意识不足,单一平台孤掌难鸣

从社交媒体的使用概况来看,杭派服装品牌和国际服装品牌都完成了微博、微信、天猫三个平台的认证。其发帖时间集中在工作时段之外的11-13点、18-20点。其中,国外服装品牌的日均发帖量最高,其官方账号有效地整合了三个社交媒体平台的传播特征,粉丝和关注者最多。譬如:优衣库的微博内容以图文为主,对不同产品系列的服装进行分类推送,并及时实体门店的促销信息。而微信的内容则运用了图文、动画、用户输入等多种网络技术,还特别设置了 “优型动”栏目,通过公关活动与目标受众展开深度互动。其中“旧衣助人”公益活动将社会救助注入品牌传播,既能够调动受众与品牌互动的积极性,又帮助品牌积累了正面的品牌评价。优衣库的微博、微信账号围绕产品信息和品牌互动对用户进行心理建设,用户最终可通过网页链接,轻松地导入天猫完成商品交易。

而汉派服装品牌只有太和同时在微博和微信上完成官方账号认证,并持续更新内容。其他汉派服装品牌仅仅重视微博或微信一个社交媒体平台的品牌建设。由于微博和微信的用户群体不同,用户使用习惯也存在差异,单一平台的品牌建设难以实现用户数量积累与广泛的用户互动,所产生的品牌传播效应也有限。

(二)社交媒体的内容建构欠技巧,难以诱发互动

在内容维度上,国外服装品牌的原创率最高。杭派服装品牌和国外服装品牌的内容以消费者互动为主。三类品牌都植入了购物链接,杭派和国外服装品牌还利用二维码技术植入链接。与汉派服装品牌相比,杭派服装和国外服装品牌的内容主题较为集中,回复粉丝和关注者的频率也较高。

相较而言,汉派服装品牌的社交媒体传播内容流于杂散,如元田树在微信上推送的内容有:#YANTETREE 贴士#、#YANTETREE 养生#、#YANTETREE 护肤#、#YANTETREE 搭配#等等,乍一看似乎满足了女性受众全方位的美丽需求。但泛泛而论缺乏记忆点,难以使目标受众产生深刻的印象。

内容维度的二级指标,内容价值与互动之间存在显著正相关。国外服装品牌具有最高的内容原创率,回复用户的咨询和投诉的质量和数量最高,因而其赢得的评论量、点赞量、转发量显著高于汉派服装品牌和杭派服装品牌。其中优衣库的社交媒体阅读量、评论量、点赞量和转发量均位于榜首。相较而言,汉派服装品牌在内容建设上的投入明显不足,依靠有奖活动来引发用户互动的手法显得举步维艰。有的品牌账号不仅没有吸引新用户,还失去了老用户。

(三)社交媒体线上线下欠联动,销售转化难以为继

在消费者认同维度上,国外服装品牌在社交媒体上的被提及量是杭派服装和汉派服装的100倍以上。其中,汉派服装品牌的粉丝基数要小于其他两类品牌,拥有一定的品牌忠诚度。名典屋和红人的提及率较高,元田树的正面情w曝光率最高,名典屋的购买行为最多。江南布衣是杭派服装中购买率最高,正面评价最多的品牌。优衣库的社交媒体账号频频发起品牌活动,每一次活动都能形成线上与线下的联动效应,引发新一轮的消费风潮。优衣库的这一传播策略对消费者的情绪曝光、购买行为产生了显著的正面影响,是此次调查样本中在消费者认同维度表现最好的品牌。

而汉派服装品牌在社交媒体平台上的品牌传播,或只注重线上宣传忽略线下参与,或只注重线下销售忽略线上互动,没有将线上与线下活动有效地联动起来。例如:太和、红人都在微信上展开了“派送红包”的促销活动,粉丝用户通过领取线上的虚拟红包,就可以在线下门店消费时充当现金使用。然而在整个促销活动中,品牌账号只是了活动通知,告知微信的粉丝用户“有红包快抢啦,时间有限,先到先得,抢到即可到线下消费”。对促销活动开展的情况,消费者的参与程度和反馈等没有进行事中的跟踪报道以及事后的总结报道,导致这一促销活动未能将更多社交媒体用户转化为线下的实际消费者。部分粉丝用户在促销活动结束后就取消对品牌账户的关注,部分用户为了多得“红包”同时注册多个账号参加促销活动。“无效粉丝”的数量越多,则越说明缺乏持续内容建设配合的促销传播对线下销售产生的利好影响只会昙花一现。

四、汉派服装品牌的社交媒体传播战略

通过前述汉派、杭派、国外服装品牌在社交媒体传播指标上的横向对比,我们表现:社交媒体的品牌传播是一个系统性战略,需要企业从社交媒体的定位、要素分解、规划、运营流程、运营组织、运营考核指标、运营系统等逐步构建和打造一个有机的运营体系,提升品牌影响力,从而实现业务的增长和营业额的提升。针对汉派服装品牌在社交媒体传播上的不足,本研究从战略层面为其拟定了递进的三步骤对策。

第一步:树立“大传播”观念,协调使用多样化的社交媒体工具

社交媒体技术的发展将操控媒体的主动权交给了品牌主。对于品牌主来说,通过社交媒体的自建媒体渠道与消费者进行沟通,无论从成本核算还是信息控制方面考量都具有更多的便利性。然而,失去了传统媒体的权威性对于传播效果庇护,品牌传播的方向也变得模糊起来,这恐怕是品牌主在自媒体时代普遍面临的窘境。

面对社交媒体环境下广告信息载具日益碎片化的趋势,如何使用好媒体组合是品牌主首要解决的传播工具选择问题。本研究中作为样本的微博、微信、天猫是常见的社交媒体组合,除此之外,品牌官方网站、品牌APP集合了品牌信息传递、产品展示和销售、消费者互动等多种功能,可以和社交媒体一道被称为品牌传播的“三驾马车”。和传统媒体最突出的信息增值功能不同的是,“三驾马车”的组合更看重服务功能和互动功能。其目的是品牌主与目标消费者进行多个回合的互动,了解其消费需求,提升其精神体验,从而形成更高的品牌忠诚度。

J.D.Power and Associates公司在最近关于社交媒体标准的研究中发现,67%的消费者已经使用公司的社交媒体主页寻求服务,33%的消费者关注社交媒体营销,糟糕的社交媒体运营会对品牌形象和企业收益产生负面影响(J.D.Power and Associates,2013)。因此,社交媒体可以看作是大数据时代品牌主为目标消费者提供物质利益之外的附加精神价值的主要手段。社交媒体既是消费关系的建构工具,也是消费关系的维系工具。汉派服装品牌需要充分重视社交媒体的社会化客户关系管理功能。

第二步,挖掘社交媒体的用户数据,实现精准品牌定位之上的生动传播

使用多样化的社交媒体组合仅仅实现了传播工具的优化选择,而要提高工具的使用效率,则要优化社交媒体的传播内容。对社交媒体的应用需要从运营、从消费者信息采集和转化入手一步步实现。将基于运营中的社会化数据进行客户细分,再进一步实现精准营销和个性化服务,从而进一步总体提升企业的效率和价值(叶开,2013)。在传统媒体环境下,品牌主为了提炼广告主题,需要挖掘消费者洞察,通常的做法是投入大量资金和精力聘请市场研究人员对消费者数据进行收集和分析。而在社交网络环境下,消费者会通过个人媒体账号自发地将有关信息发送在公开或半公开的媒体平台上,品牌主收集信息的成本大大下降。只需依循一定的社会心理逻辑挖掘个人数据中隐藏的消费者洞察,就能实现精准的品牌定位,进而设置品牌传播内容。

例如:杭派服装的领军品牌江南布衣从职业女性的知性特点中进一步挖掘出崇尚自我的消费者洞察, 产生“JUST NATURALLY BE YOURSELF――自然・自我”的品牌定位。其社交媒体的内容设置紧紧围绕着这一品牌定位展开:微博账号的发帖以展示服装图片为主,文本则以故事化的叙事风格阐释服装设计师,典型消费者或时尚活动的个性化理念,给关注者既充满人情味又有独到观点的信息体验。2015年8月25日的微博以生活方式(lifestyle)作为切入点,通过网页链接功能,以长文展示了一名设计师的人生故事以及时尚理念。将“自然・自我”的品牌理念落实到生动人和人生经历上,不仅诠释了江南布衣的品牌定位,也进一步使得品牌定位变得生动及具有亲和力。

比较而言,同样以业女性为目标市场,汉派服装品牌缺乏深刻的消费者洞察,其品牌定位流于泛泛。如元田树的品牌标示语是“典雅、充满激情、展现都市女性细节中的美丽与自信”,太和倡导“为时尚优雅的女人而设计”,红人提出 “让女人更优雅、让世界更美好”。品牌定位的粗放直接导致了汉派服装品牌传播内容设置的杂散和平淡。

总之,越是在众声喧哗的社交媒体环境下,越需要品牌主对消费者洞察进行深入挖掘,寻求文化取向及个性差异的品牌定位。精准传播与消费者洞察相一致的品牌定位,才可能设置生动的内容、维系互动的传播效果。这还需要品牌在找准定位之外具备选择故事、讲故事的能力。国外服装品牌zara与优衣库的内容都善于用消费者视角的个人叙事来展现目标群体的生活态度,进一步凸显出服装品牌的设计理念,使品牌定位与目标消费者在精神上产生共鸣。这种共鸣不仅可以触发互动,促进销售,还可以建立消费者对品牌更为稳定的心理依赖。

第三步,激活社交媒体的联动环节,实现品牌效果与销售效果的双赢

社交媒体最突出的特征在于它的互动功能,因此,除了意识到精准传播的重要性,汉派服装品牌还要进一步意识到:社交媒体的品牌传播是一个连贯的过程,品牌账号的线上传播需要与线下产品销售有效配合,即,品牌账号除了日常运营,还需要在开展促销活动时完成活动前大量宣传、活动中刺激销售、活动后收集反馈。否则,即使品牌账号有阅读量、点赞量,实际的销售额也可能不升反降,或提升不明显。

以优衣库的微博账号为例,2016年4月,优衣库在微博上了其与美国漫威动画公司合作推出的漫画英雄人物系列T恤上市的促销活动。依循“提出悬念(4月11日-12日)”(互动1)-“挑起#英雄内战#+电影票优惠活动(4月14日-16日)”(互动2)―“父子装组合促销(4月17日)”(互动3)-“产品正式发售(4月18日)”的脉络,连续三次挑起粉丝用户的参与热情,对天猫优衣库的实际销售产生了持续的促销效果,漫威T恤成为这段时间销量排名最高的商品之一。

总之,品牌传播的效果可以分为作用于消费者态度和心理的品牌效果和作用于现金流回收的销售效果。而社交媒体的即时分享功能可以实现两种传播效果的同步与互促。因此,社交媒体的任意一次传播活动都要品牌主设定线上线下的联动目标,设置让用户广泛参与的环节,并在用户参与前、参与中和参与后进行跟踪反馈。而对于用户的评价、私信,无论是正面的还是负面的,品牌都要保持积极回复,慎用系统的自动回复功能。

结论

在“互联网+”思维的引导下,传统的服装行业需要更好地利用社交媒体完成产业转型。本研究提出的社交媒体品牌传播三步骤适用于转型期的汉派服装品牌。而对于汉派服装品牌来说,实现较高的社交媒体传播效果,也是提升自身管理水平,适应产业升级的题中应有之义。在今后的社交媒体传播活动中,汉派服装品牌需要按照“数”“质”“效率”“投资回报率(ROI)”四个标准全面衡量其现有社交媒体营销活动。“数”即观测平台粉丝数、博文评价转发量、阅读量、点赞量等在公众账号数据中心上可见的数据;“质”即通过用户评价、线上线下调查问卷获取消费者对品牌态度、情感强弱、满意度等定性数据;“效率”则着重于时间,如消费者的线上、线下反馈时间周期;“ROI”侧重的是品牌营销带来实质上的结果,如收入利润、顾客终身价值(CLV)、每获得新顾客成本等。

对于汉派服装品牌来说,社交媒体的品牌传播策略或许正是其面临诸多产业调整难题中最关键的一环。正如李・奥登(2012)所说,如果企业没有充分发挥社交媒体的互动特长,当然也不会创造有利于树立品牌形象或激发顾客购买、忠于或宣传品牌的体验。

参考文献:

篇11

今日头条则是完全脱胎于互联网环境、基于数据挖掘技术的新媒体产品,以移动客户端为主打产品。自2012年8月上线至2015年12月以来,今日头条已吸纳用户超过3.5亿,且在2014年6月获得1亿美元的C轮融资,并仍保持每天超过3500万的用户增长速度。这一基于数据挖掘技术和数据算法来完成的新媒体项目,对媒介融合和新媒体的创新发展也具有可研究价值。

一、平台:多渠道并进与专注APP的差异

(一)多渠道并进的澎湃新闻格局

媒介渠道是新闻信息流动的通路,合理有效的媒介布局是信息有效传播的基础。①向社交媒体平台延伸已成为传统媒体应对移动互联网时代的挑战、寻求生存渠道必不可少的转型方式之一。具备多元化传播渠道的澎湃新闻,不仅注重多平台内容传播,也重视不同平台间的关联性。基于网络端与移动端的使用差异,其界面设计和部分细节功能上也有所差异,而且相较于网站或WAP网页版的运作,澎湃新闻更重视对移动客户端的推广,例如其网站首页右侧顶端吸引用户的位置展示对移动端的推广信息,首页右侧则放置了微信二维码提醒用户扫码下载客户端。这种推广趋势意在表明,移动客户端在未来将会成为澎湃新闻的主要推广平台,也是其未来应对移动互联网发展进行多媒体转型的主要渠道。但重视推广移动客户端的同时,与同类新闻客户端相似,澎湃新闻也在客户端的文章结尾处提供了微博、微信等社交媒体的分享按钮,以期以此形成信息的多平台、多层次传播。

尽管如此,澎湃新闻以移动客户端为主要新媒介传播平台的渠道战略趋势仍较为明确,例如在其新浪微博和腾讯微博的每条博文中,都附有下载移动客户端的超链接,其官方微信账号的菜单栏设置有“下载APP”的按钮,且每篇推送文章结尾处也都提示读者通过“阅读原文”下载移动客户端。值得注意的是,除了澎湃新闻的官方微信之外,其运营团队还推出了包括“市政厅”等与其新闻客户端的子栏目同名的微信公众号,并分属给各自的内容团队运营,从而形成多平台紧密联系又各有专攻的渠道运作结构。

(二)以客户端为主的今日头条数据挖掘者

今日头条平台最大的特点在于它以自己的客户端为连接点,链接各大新闻门户网站的热门新闻,使其以新闻聚合工具的身份出现在媒介市场和公众视野。根据其对自身“基于数据挖掘的推荐引擎产品”而非新闻客户端的定位,今日头条得以运营、推广和盈利的基础是技术。如何实现网络媒体资源的再利用和再传播是今日头条的关注焦点。作为新闻聚合类应用,今日头条的算法模式与美国Prismatic公司有相似之处,即“收集网上资源并排序,这种排序建立在文本分析、用户喜好、社交网络普及和大数据分析的基础之上。”②这与其公司属性有关:虽然今日头条是新闻类产品,但其公司六成员工为技术开发人员,使该产品可以根据算法技术对用户偏好进行较为精准的分析与判断,并通过智能推荐方式,根据用户对推送设置的偏好,向用户实时推送信息。

同时,作为一款社交媒体,今日头条并不局限于重点打造的客户端平台,与澎湃新闻的多媒体关联运作方式相似,今日头条的客户端也通过分享功能将其与自身的微信、微博等其他社交媒体平台相关联,为用户收藏、分享或转发新闻资讯提供可能。这一方面使用户成为今日头条资讯的二次传播者;另一方面,通过用户自发传播的方式,今日头条也通过其他社交媒体平台再次推广了自己的移动客户端。

二、内容:侧重时政与海量信息的差异

(一)专注时政与思想的澎湃新闻

澎湃新闻的定位是“专注时政与思想的互联网平台”,以此定位为基础,“内容原创”成为澎湃新闻致力发展的目标和方向,同时也是其重点打造的核心竞争力。凭借上海报业集团的新闻品牌和公信力优势,澎湃新闻采集并汇聚大量原创报道,突出内容的独特性和不可替代性。而且澎湃新闻的采编队伍依托其传统媒体――《东方早报》,在内容采编观念上与传统媒体“内容为王”的核心理念相契合,使其能够利用并强化基于纸媒基础发展起来的深度报道特长,将内容集中在“时事、财经、思想、生活”四个方面,以时政新闻报道为主。同时,澎湃新闻并不拘泥于单一的新闻报道角度,而是多视角、多方面地报道同类新闻。

篇12

美国马萨诸塞州理工大学的伊契尔・索勒・浦尔(Ithiel de Sola Pool)教授最早提出“媒体融合”(Media Convergence)这一概念,他认为“媒体融合”的本质是传播媒体随着信息技术的发展呈现出多功能、一体化的发展态势,传统媒体与新媒体在传播功能上不断融合,逐渐发展成为更加完善的传播介质。

当今是媒体融合的时代,信息技术的发展使得各种信息在同一个平台上优势整合,一体化的趋势日益明显,广播也呈现出集音频、视频、图片、文字为一体的发展趋向。如何突破传统的经营瓶颈,努力探索一条利用新媒体拓宽传播渠道、提升影响力的创新发展路径,是广播媒体亟待思考和解决的难题。本文认为,广播具有报纸、电视等传统媒体所不具备的融合优势,与微信、手机客户端等新媒体融合可能是发掘自身优势、激发自身活力的重要方法之一。

一、广播媒体和新媒体融合的优势

移动互联时代的到来,使传统媒体、新媒体与移动通信业的渗透和融合不断加强。微信、手机客户端已经初步具备传播介质的功能,具有沟通便捷、信息及时、传播迅速等特点。从传媒发展态势上看,媒体融合已是大势所趋,广播媒体要在发掘自身优势、加强与微信、手机客户端融合上集中发力,利用新媒体平台激发自身活力、拓宽传播渠道、提升传播力和影响力。从传播特性上看,广播媒体和微信、手机客户端应用具有天然的融合优势。

首先,伴随性。手机集便携性、智能性、社交性于一体。广播是伴随性媒体,在传播上不受空间、地域的限制,一台小小的收音机就可以随时随地收听信息,在这一点上具有报纸和电视不可比拟的优势。

其次,即时互动性。自媒体时代,人人都是传播者。社交媒体软件正是满足了人们即时互动、沟通便捷、传播迅速的需求才广受欢迎的。微信最主要的功能就是传递信息、信息,用户可以通过移动互联网快速传递信息,并以视频、文字、图片的形式到朋友圈进行更广泛的传播。广播所具有的连线功能也具有即时互动性,较之报纸、电视等传统媒体,广播的即时互动功能更强。若广播与微信、手机客户端融合,其原来的传播模式将升级为更具灵活性的、多元化的传播。

第三,共享声音传播。广播是声音媒介,这是广播媒体的核心资源,也是广播区别于其他媒体最显著的特点。微信是以语音和文字为主要传输手段的社交软件,其语音功能和广播的电台互动机制有异曲同工之妙。在传统广播节目里,主持人和听众通过电话互动受线性传播的限制。如果借助微信语音则可以避免这个问题,听众无需拨号,只需要持续按触摸键就可以发送语音信息,方法更简单、更快捷。

二、中国之声与新媒体融合的实践探析

广播与微信、手机客户端融合不仅仅是做内容的搬运工,更要充分运用互联网思维,从理念、技术、运营手段上充分借鉴新媒体。目前,广播媒体与新媒体融合的主要形式有两种:一是借助于微信公众平台,这是传统广播实现数字化转型的最直接方式;二是广播手机客户端,如蜻蜓.fm、考拉FM、荔枝FM、豆瓣电台等。

中国之声是中央人民广播电台(以下简称中央电台)历史最悠久、知名度最高的一套节目,2011年率先在全国开通微信公众平台账号,后又在蜻蜓.fm上开辟专栏,借助微信、手机客户端的特色和功能,探索广播在新媒体语境里的创新之路。笔者以中国之声为考察对象,探索分析广播媒体如何借助微信和手机客户端创新广播新闻报道模式,提升广播传播力。

(一)借助微信平台增强用户黏性

开通微信公众账号,是传统广播与微信融合的最直接、最便捷的方式,这里所说的融合,并不是将广播节目内容完全不加改造照搬到微信公众号,而是传统广播与广播微信平台相互借鉴、沟通合作,利用彼此的优势,实现传播效果的最优化。

广播微信公众账号可以借助传统广播的节目资源和自身的新媒体技术在以下几个方面发挥优势:利用图片、文字、视频、音频等多种手段对广播节目进行预告、推荐或解读,既能弥补传统广播节目线性传播的缺陷,又能借助新媒体平台扩大节目传播范围;利用关键词自动回复功能增强受众收听节目的自主选择性;利用微信的互动功能开发一些以听众语音为主导的广播节目,突破传统广播节目以全知视角叙事的模式,探索广播节目播出方式的创新;利用微信的快速传播实现突发新闻的即时传播,增强时效性。

中央电台“中国之声”的微信公众号共分为收听节目、微社区、专题报道三个部分,其中收听节目根据节目内容划分为资讯头条、深度评论、精选特辑、王牌精品、历史人文等专区,用户可以随时根据需要收听节目;微社区是一个互动社区,用户可以在帖子下评论留言,针对热点问题进行讨论。“中国之声”微信公众号可以连接到蜻蜓.fm,用户只要点击“收听节目”就可以进入“中国之声―蜻蜓.fm”,在蜻蜓.fm和微信公众号上同时收听“中国之声”。此外,“中国之声”每天在午间、晚间时段各推送三到四条热点新闻,用户即便没有时间“听”,也可以阅读到图文并茂的新闻资讯。

笔者选取了中国之声微信公众平台2016年11月5日全天推送的消息内容,考察中国之声是如何借助微信平台创新新闻报道模式的。经统计,2016年11月5日,中国之声微信公众平台共推送9条消息,如表1所示。

从表1中可以分析出,中国之声微信公众平台在消息报道和推送上具有以下几个特点:从数量上看,全天共推送9条,数量比较适当。微信公众平台不同于传统广播,在消息推送上是讲究时间和数量的,量少无法引起受众注意,量多容易引起受众反感。据统计,中国之声微信公众平台每天平均推送的消息一般在5~9条之间,既满足了受众接收信息的需求,又没有进行信息轰炸;从时间上看,消息推送时间一般选择在午间休息和晚上下班之后的时间段,既避免了工作时间受众无法阅读的缺陷,又满足了受众工作之暇放松精神的需要,更加人性化;从内容和来源上看,中国之声微信平台推送的基本都是容易吸引受众点击阅读的热点民生新闻,消息来源不再局限于中国之声在线播出节目,而是综合了知乎、互动百科和其他媒体微信公众号,符合了网络传播的特点;从形式上看,消息形式比较多样,运用了文本、图片、视频、音频等多种方式,受可以在消息下面留言评论。

微信公众号在实时传播和互动沟通方面具有传统广播没有的优势。广播媒体通过充分利用微信传播的特点和优势,可以进一步增强广播用户的黏性。

(二)借助手机客户端扩展传播渠道

移动互联网和智能手机的普及催生了手机客户端这一新生事物,并迅猛发展。据统计,2015年中国手机客户端应用数量已达百万量级规模,功能丰富、方便快捷、界面亮丽的手机客户端已成为人们不可缺少的生活工具。

相对于微信公众平台,手机客户端的容量更大、形式更多样、互动方式更灵活。中国之声并不是将广播节目照搬到手机客户端,而是利用手机客户端的特点对节目资源进行深度整合,划分出每日最热新闻榜、楼市新变局、环球时讯、养生大讲堂、致富早班车、今日文体、各国观察员、深度调查、第一连线等39个专辑;除此之外,用户在收听节目时,可以拉动进度条快进或回听,还可以返回主页浏览其他新闻,具有很强的自主选择性;用户还可以下载、分享、收藏节目;蜻蜓.fm具有保存历史新闻的功能,用户也可以收听旧闻。

与传统收音机相比,中国之声在蜻蜓.fm上的板块设置摆脱了线性传播的限制,用户收听节目更加直观、灵活,选择余地更广泛;与网络电台相比,其基于手机移动互联网,具有电脑所不具备的伴随性优势,具有更强的便捷性。然而,略有不足的是,中国之声在蜻蜓fm上的功能还未得到充分开发。比如:互动不足,缺乏必要的互动社区。中国之声在蜻蜓.fm上的信息容量很大,却只局限于点对点的单线传播,受众只能在每条语音消息后进行评论,无法对主持人、编辑提出建议,更无法与其他用户开展交流。中国之声的音频雷同度高,且以硬新闻为主,缺乏创新意识,更新速度慢。如《朝花夕拾》是2016全国“两会”特别节目,3月17日就已停止更新,却仍出现在重要位置。整体节目内容风格偏于严肃,缺乏广播剧等轻松活泼的娱乐节目。

三、对广播媒体运用新媒体提升传播力的几点思考

与其他广播媒体相比,中国之声在微信公众平台、手机客户端的排名和好评度都名列前茅,但仍有进一步提升的空间。笔者认为,可从创新报道形式、增强与听众互动两方面入手培养广播工作者利用新媒体的意识和技能,从而拓展广播新闻传播的路径。

自媒体时代,人人都可以成为新闻的生产者和提供者。2016年微信用户数量统计显示,微信注册用户数量已达9.27亿,这是一个庞大的新闻消费群体,为广播微信公众平台提供了强大的智力支持。广播媒体要多鼓励微信用户通过文本、图片、音频、视频等形式提供新闻线索,选取真实准确的消息推送给广大用户,选取可以深入挖掘的线索采访调查,拓宽新闻来源。

微信是移动社交媒体,其消费者更青睐轻松愉快的报道,广播媒体要创新报道形式,尝试拍摄一些轻松幽默、契合时代主题的微型广播剧或视频节目,或以说唱的形式播报新闻,这比文本+图片的传统报道更能吸引受众关注。

与报纸、电视相比,广播与受众的互动是最便捷的,但在新媒体面前仍相形见绌。媒体融合时代,广播媒体要利用微信平台发挥声音优势,进行语音互动拉近与听众的距离,在手机应用上开设互动社区,让用户之间可以随时沟通交流、分享建议。

四、结语

《中国移动互联网发展报告(2016)》指出,中国移动互联网一方面稳健发展,一方面已呈现出明显转折迹象:从高速发展转向稳健发展、从粗放扩张转向深耕细作、从业务改造转向模式创新、从要素整合转向平台融合。这预示着媒体融合正由粗放型向集约型转变。广播要走媒体融合之路,仅仅做内容的“搬运工”是远远不够的。面对新一轮挑战,广播媒体必须清楚认识到自身的优势与不足,充分了解新媒体的传播特点,结合自身优势利用新媒体技术平台,拓宽新闻来源,创新报道形式,增强与受众互动,拓宽广播传播渠道,制作出符合新媒体用户收听需求的优质节目,打造融媒体时代广播传播新格局。

参考文献

1.周宇博《广播微信公众平台用户实证研究》,《中国广播》,2015年第1期。

2.田园 《广播与类微信App的融合探析――基于中国广播媒体与微信互动实践的思考》,《当代传播》,2015年第5期。

3.薛琦《化“微”为“机” 创新广播新闻报道模式――以中央人民广播电台中国之声开设微信平台的实践为例》,《中国广播》,2014年第4期。

篇13

自人类诞生以来,人类社会至少已经经历了四次意义重大的信息传播革命,每一次信息传播革命都把人类文明推向一个新的发展阶段。前三次的传播革命不断推陈出新,将“新媒体”转化为“传统媒体”,至今形成以报纸、广播、电视等媒介为主导的传统媒体的格局。智慧媒体是四次传播革命演化和增殖的新的媒介形态。

传播媒介形态的变化会因为可感知的需要、竞争、技术革新的相互作用引起,所以智慧媒体的形态是传统媒体和新媒体共同演化、增殖产生的新形态。通过智慧媒体的情景感知,受众可以有效地获取自己想要得到的内容,通过大数据的分析、挖掘,将信息进行选择与重装,为人们提供有效、即时和个性化的服务,通过精准的发送消息,将受众信息转化为价值。在大数据逐步由概念变为现实的当下,智慧媒体变得越来越触手可及,更是传播革命带来的新兴的、实用的、蓄势待发的媒介形态。

传统媒体在向新媒体和智慧媒体演进。传统媒体的报纸消亡论争执不休,广播电视业开始进行媒介融合,借力新媒体来实现自己的发展。新媒体时代,典型的有门户网站、自媒体、IPTV等等,媒体的革新带来丰富海量的数据,当大量的信息出现时,信息的过滤与选择又显得捉襟见肘。而在大数据的奠基下,智慧媒体的出现以互联网为基础,依托不同的智能终端,并结合云计算、云存储这些新技术,让用户快速地判断、分析他们想要的内容。

智慧媒体的特征是具备思考、感知、识别等多维度智能,能主动寻求目标受众并融入受众的社会关系网,出现核裂变式的传播,如根据用户的情绪感知为其提供高清、娱乐的内容,根据受众所在的地方、时间和消费习惯,智慧媒体能主动提供家庭娱乐、亲子和家庭购物等信息。我们不妨可以借用《大数据为智慧媒体时代奠基》(2013)一文中的观点,智慧媒体具有三大重要的特征:一是要多终端全天候的覆盖。智能手机的普及使人们随时随地都能够获取信息,用户时间极具碎片化,所以在用户接触移动终端的同时,媒体要多终端的覆盖并不间断的提供相应服务;二是从资讯媒体发展到智慧服务,智慧媒体不仅要资讯信息,而且要根据分析读者的需求提供个性化的服务,如工作、生活、社交等,特别是本地化的服务更能贴近用户的需求;三是从大众营销转化为精准营销,根据网络文本分析来匹配相对应的广告,并通过分析读者的偏好来提供个性化的营销策略。

智慧媒体借力大数据

大数据为智慧媒体这一媒介新形态提供基础。通过分析读者的需求来预测用户的行为和偏好,媒体的订阅用户、微博粉丝、微信的关注账号,这些客户数据都可以用来进行分析。无论用户行为分析还是内容的抽取和挖掘,都是基于庞大的数据展开。分散化的网络用户以及多元化的网络媒体使整体网络的用户覆盖和页面的浏览量被众多媒体瓜分和稀释,网络数据被极大地控制和浪费;广告主面对浩瀚的互联网无所适从,网络广告需求得不到更高层次的满足,与此同时互联网广告预算却在增加。做好大数据分析和挖掘,为用户推送个性化内容、广告和信息服务才能够将数据转化为价值,形成智慧媒体。所以,大数据的分析和应用是构建智慧媒体的基础。