简析创新大数据时代企业竞争情报革新与进展前言

更新时间:2024-03-06 作者:用户投稿原创标记本站原创
摘要:文章概述了大数据的主要特征,分析了大数据对企业竞争情报研究的影响,包括企业竞争力的提升需要大数据的支持,现有企业竞争情报数据处理面临的一些新问题,企业竞争情报分析方法亟待创新,提出在大数据时代企业竞争情报研究的发展方向,应重视数据和信息的集成、注意对数据的清洗与过滤、关注新的数据类型的挖掘分析方法、促进数据分析的可视化、探索大数据新的分析技术和工具的应用等。
关键词:大数据 企业 竞争情报 数据挖掘
 1003-6938(2012)06-0009-06
1 引言
随着信息技术的不断发展,互联网的普及利用,各种终端设备记录了人类社会复杂频繁的信息行为从而产生了惊人的数据量。据国际数据公司(IDC)的研究报告称,2011年全球被创建和被复制的数据总量为1.8ZB,并预测到2020年,全球将拥有35ZB(1ZB=10亿TB)的数据量[1]。大数据已经渗透到每一个行业和领域,被视为“未来的新石油” ,逐渐成为重要的生产因素。随着消费者、企业、各个经济领域不断挖掘大数据的潜力,我们正处在一个巨大浪潮的尖峰,这个浪潮就是大数据驱动的技术创新、生产率提高、经济增长以及新的竞争形势和新价值的产生[2]。近年来,大数据技术研究和应用迅速发展,许多国家已经意识到了大数据的重要性,并作为战略性技术大力推动其发展,大数据时代已悄然而至。
2 大数据的含义与特征
目前对大数据还没有标准的定义,通常认为它是一种数据量很大、数据形式多样化的非结构化数据。亚马逊网络服务、数据科学家John Rauser曾提到一个简单的定义:大数据是任何超过了一台计算机处理能力的庞大数据量[3]。维基百科定义为:大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合[4]。百度百科定义为:大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。从各种各样类型的数据中快速获得有价值信息的能力,就是大数据技术[5]。IBM从三个基本特性角度来定义大数据,即:“3V”:体量(Volume),速度(Velocity)和多样性(Variety)。也有人为大数据包括三个要素,即:大分析(Big Analytic)、大带宽(Big Bandwidth)和大内容(Big Content)[6]。
概括起来,大数据的特征主要体现在如下几个方面:
(1)数据总量规模增长巨大。同一类型的数据在快速增长,目前在传感器网络、地理信息导航系统、社会网络(如微博)、即时通讯(如)、电子商务(如淘宝)、数字图书馆、网络日志等领域都产生了庞大的数据,规模在不断扩大。如淘宝目前每天活跃数据量已经超过50TB,共有4亿条产品信息和2亿多名注册用户在上面活动。零售巨头沃尔玛每小时都要源于:毕业论文总结www.808so.com
处理100多万笔客户交易,数据库估计超过2500万亿字节——相当于美国国会图书馆书籍数的167倍,而移动互联网用户发送和上传的数据量达到1.3EB[7]。
(2)数据增长的速度呈指数级持续增长。目前很多领域的数据都以惊人的速度增长,根据WinterCorp的调查显示,最大的数据仓库中的数据量每两年增加3倍(年均增长率为173%),其增长速度远超摩尔定律增长速度。照此计算,2015年最大数据仓库中的数据量将逼近100PB[8]。大数据的动态性强,要求分析处理应快速响应,在动态变化的环境中快速完成分析过程,有些甚至必须实时分析,否则这些结果可能就是过时、无效的。如导航定位系统、股票分析系统等对数据实时处理有着较高的要求,大数据分析和处理的方法必须能快速地适应相关业务更新频率加快的需求。
(3)新的数据来源和数据类型在不断增加。目前产生大数据的领域在不断增加,数据类型不仅包括普通文本、照片、动画、音频与视频等,还有像位置信息、链接信息等新类型的数据。伴随着社交网络、移动计算和传感器等新技术不断的应用,大数据中有许多是非结构化数据或半结构化数据,没有特定的描述模型,数据结构是不固定、不完全或不规则的。
(4)数据的价值日益突现。大数据犹如一座富矿,通过海量数据的处理、整合分析,可以发现新的知识,从而创造新的更大的价值。大数据为许多行业带来新的商机和发展机遇,充分利用大数据可为企业带来强大的竞争力。大数据分析能从庞大的数据中发现稀疏而有高价值的知识和规律,为预测和决策提供相关支持。如视频监控的数据量通常十分大,虽然绝大部分可能没有实际利用价值,但几秒镜头捕捉到某罪犯体貌特征,可能对门而言就是十分珍贵的。大数据分析就是要进行披沙拣金,发现这些珍贵的信息。
综上所述,对于大数据中“大”的理解,主要有两个方面,第一是指大量的、快速增长的数据,第二则是数据中所蕴含的价值量较大。可见,大数据之“大”,并不光是指数据的数量之大,它的意义还在于数据的价值之大。
3 大数据对企业竞争情报的影响
情报研究是利用数据和信息提炼出有价值的情报,为决策提供有关方案,也就是对数据进行处理、组织和解释,以揭示其潜在的知识,转化为可执行利用的情报。企业竞争情报分析就是从原始的数据中发现关于竞争环境、竞争对手和竞争策略情报的过程,从而形成高附加价值的产品。因此,大数据分析在对象、运用的方法和目标等方面都与企业竞争情报研究有许多交集,大数据的兴起必然对企业竞争情报产生深刻的影响。
3.1 企业提升竞争力需要大数据的支持
数据竞争已经成为企业提升核心竞争力的利器。来自各个方面零碎的庞大数据融合在一起,可以构建出企业竞争的全景图,洞察到竞争环境和竞争对手的细微变化,从而快速响应,制定有效竞争策略。庞大的数据更具有统计意义,能为各种预测模型提供支持,从而能预测未来的发展趋势,帮助企业获得先机。相关的数据整合在一起,能不断产生新的信息和知识,有助于提高生产率、降低经营成本。如2008年初,阿里巴巴平台上整个买家的询盘数急剧下滑,自然导致买盘的下降,说明欧美对中国采购量在下滑。海关是卖了货出去以后再获得数据,而阿里巴巴提前半年时间就从询盘上推断出世界贸易发生变化了[9]。企业的竞争不再只是劳动生产率的竞争,而是知识生产率的竞争。数据是信息的载体,是知识的源泉,是企业创造价值和利润的原材料,因此,基于知识的竞争将集中体现在基于数据的竞争上。正如马云所说,未来是数据竞争的时代,谁拥有数据,谁就拥有未来。如今各行各业都出现了以数据分析为竞争力的企业,它们都是在数据分析的基础上与其他企业展开竞争,以提升核心竞争能力,保持或获得行业领先地位,如谷歌、宝洁、沃尔玛等世界知名公司。沃尔玛就建立了一个超大的数据中心,其存储能力高达4PB以上,通过大数据分析,沃尔玛掌握了顾客的购买习惯,不同商品一起购买的概率,购买者在商店所穿行的路线、购买时间和地点,从而确定商品的上架布局以及对分类进行优化;决定对各个商店的不同商品进行增减,以保持最优的库存,降低成本;洞察销售全局,瞬间捕获到各种细微的变化,从而快速响应,制定营销策略;利用大数据工具对供应链进行分析以选择供应商、优化物流配送方案和进行谈判等;利用大数据分析工具对热销商品品种和库存的趋势进行分析,以选定需要补充的商品,分析顾客购买趋势和季节性购买模式,以确定降价商品,并对其数量和运作做出反应[10]。可见,大数据已经成为企业的核心资产,对数据的掌控可以形成对市场的支配,并且获取巨大的回报。大数据是企业用于提升核心能力的重要手段,而为提升企业竞争优势的大数据分析是企业竞争情报研究的重要范畴。源于:论文网www.808so.com
4.2 注重数据的清洗与过滤
大数据时代企业所要处理的数据比较多,但数据的质量往往参差不齐,如有些数据不一致或不准确、数据陈旧以及人为造成的错误等,通常被称之为“脏数据”。由于数据挖掘是数据驱动,因而数据质量显得十分重要。“脏数据”往往导致分析结果的不正确,进而影响到决策的准确性。由于大部分的数据库是动态的,许多数据是不完整的、冗余的、稀疏甚至是错误的,这将会给数据的知识发现带来困难。由于人为因素的影响,如数据的加工处理以及主观选取数据等,从而使得数据具有某些噪声,会影响数据分析模式抽取的准确性。大量冗余数据也会影响到分析的准确性和效率。因此,在数据挖掘分析时,首先需要进行数据预处理,也就是要对数据进行净化和过滤,删除一些无关的数据。数据清洗是一个减少错误和不一致性、解决对象识别的过程[12]。一般通过概率统计等原理查找数值异常的记录。如在网站的日志文件数据处理中,可以通过检查URL的后缀删除认为不相关的数据,可使用一个缺省的后缀名列表帮助删除文件,去掉一些不能反映用户行为的记录,过滤一些请求错误和失败的记录等。
在大数据时代,不能不计成本盲目的收集各种海量的数据,否则将成为一种严重的负担。数据的体量只是大数据的一个特征,而数据的价值、传递速度和持续性才是关键。为了达到这些目标,企业竞争情报收集可以采用最小数据集的方法,指通过收集具有代表性的最少的数据,更好地掌握一个观察对象所有的特点或者一个事件所处状态,其核心是针对被观察的对象建立一套精简实用的数据指标,采用一定取样标准选择和过滤相关数据。总之,通过对数据质量的控制和管理,可以提高数据分析的准确性,进一步提高竞争情报工作的效益。
4.3 关注新数据类型的分析方法
在大数据时代,企业无论是日常运营,还是重大战略决策,都会在各种各样的信息系统中留下各种数据记录,这些数据通过技术整合起来,可以再现一个企业的运行轨迹和发展全景。竞争情报研究就是发现有价值的知识和模式,洞察企业竞争环境,预测未来,从而获得竞争优势。随着信息技术的普及应用,新的数据类型不断产生,下面一些新的数据类型和分析方法值得关注。
(1)实时数据。如微博、短信等大量的动态数据流,是一种十分重要的竞争情报源。数据流挖掘是对数据进行单遍现行扫描,快速处理数据,提供实时近似结果的技术。如窗口技术采用分而治之的策略,将流数据按照特定的需求分配到不同的窗口,进入窗口内的数据才会被处理,以减少分析处理的数据量;而概要数据结构技术将数据流进行概括统计的数据结构代表原始数据,而不是保留数据流中的全部数据,从而减少处理的数据量[13]。在大数据时代,竞争情报分析的数据许多是连续、快速、随时间变化的,对如此巨大的数据流,企图存储或者扫描所有的数据都是不实际的,只有采用动态的数据流挖掘分析技术才能有效解决数据的冲击,获得实时近似的结果。数据流挖掘技术能为竞争情报提供实时查询服务和处理,从而促使企业的“触角”保持足够的敏捷性。
(2)动态数据。从时间的维度发现有关变化规律。时间序列分析是指从大量不同时间重复测得的数据中发现前后数据相似或者有规律的模式、趋势和突变的方法,主要的技术主要是相似模式发现,包括相似模式聚类和相似模式搜索时间序列,采用的主要挖掘方法主要有小波变换法和经验模态分解法[14]等。在大数据时代,各种数据源源不断的产生,比如交易数据、网站访问日志等,从中必然会呈现出时间上的规律,企业希望从积累了大量的历史数据中分析出一些模式,以便从中发现商业机会,通过趋势分析,甚至预先发现一些正在新涌现出来的机会,比如企业可以通过数据时间序列分析了解产品销售的旺季和淡季,制定针对性的营销策略,减少生产和销售的波动性,从而获得利润和竞争优势。
(3)关联数据。关联数据发现技术是分析数据之间的联系,将源于:论文格式字体www.808so.com
孤立、离散的数据点结合产生数据链或者数据图,随后从多个数据源中查出匹配给定关联模式的实例、最后再对匹配的实例评估。目前已应用的主要方法有:图论的稀有度监测法、图熵法和基于谓词的逻辑归纳推理法等[15]。关联发现技术特别适合于动态的数据发现未知的模式,而大数据中隐含了大量未知、潜在的关系,新模式的发现有利于企业采取“蓝海”战略,抢占先机,从而获得竞争优势。
(4)社会网络数据。社会网络分析也叫链接挖掘,是通过网络中的关系分析探讨网络的结构及属性特征,其挖掘重要任务的是基于链接的节点排序、基于链接节点的分类、节点聚类、链接预测、子图发现等[16]。在大数据时代,大量相关的数据聚合在一起,相互支撑解释和印证,形成了复杂的数据网络,数据之间的关系具有非常重要的价值,如通过消费者行为的链接数据挖掘能发现顾客网络,从而制定找出利润最大化的顾客群,又如从人际关系的网络节点的中心度来分析竞争对手,从而制定相关的竞争策略等。
4.4 促进数据分析的可视化
数据可视化技术指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像显示出来,并进行交互处理的方法和技术,其本质是从抽象数据到可视化结构的映射。在大数据时代,数据只是原材料,其真正的价值需要通过知识和情报来实现。企业竞争情报分析的结果必须是可理解的,才能较为容易地转化为生产力。可视化可以反映数据的语义关系,加快数据的处理速度,使庞大的数据得到充分有效利用;可以在人与数据间实现交互,帮助人们观察到数据中隐含的问题,为发现和理解有关规律提供有力工具。可视化使竞争情报更加易于理解和运用。采用一定的分析模型将相关的数据组织在一起,直观地表达竞争情报和竞争情报之间的逻辑关系,如进行一些关联分析,以生动形象的方式显示描绘人物、公司和事件之间的联系,探索事件、人、地点、产品和组织间潜在关系并预测可能产生的结果,辅助决策过程。可视化可作为一种基础技术嵌入到企业竞争情报分析工具中,人们总是希望看到研究报告中的生动图像,而不是一大堆枯燥的数据,企业竞争情报研究结果通过可视化方式,采用不同数据维度提供给不同层次的决策者使用,便于理解,支持企业高效运营。因此,可视化技术是大数据时代企业竞争情报研究的有效工具。摘自:毕业论文格式字体www.808so.com

点赞:27614 浏览:122704