大数据
越来越大、越来越快、越来越复杂,数据特性的演变和发展,催生了一个全新的概念——大数据。
在理解大数据是什么之前,首先要了解三个概念:结构化数据,半结构化数据以及非结构化数据。
结构化数据:行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,多年来一直主导着IT应用;(传统商业智能数据来源)
半结构化数据:包括电子邮件、文字处理文件以及大量发布在网络上的新闻等,以内容为基础,这也是谷歌和百度存在的理由;
非结构化数据:广泛存在于社交网络、物联网、电子商务之中。伴随着社交网络、移动计算和传感器等新技术不断产生,有报告称,超过80%的数据属于非结构化数据。(大数据数据来源)
理解了这三种数据的区别,也就明白了大数据和商业智能的主要区别在哪。
简单来说,大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。
IBM将“大数据”理念定义为4个V,即数量(Volume)、多样性(Variety)、速度(Velocity)及数据的准确性(Veracity)。
另外需要强调的是,大数据与商业智能并不对立,在信息化飞速发展的今天,我们需要将大数据和商业智能结合,才能更好地将数据转化为有益的价值。