易思范

电商汇辞典:大数据

知识百科

2017年10月25日

  大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

  对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

  麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

  从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

  随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

  大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

  最小的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

  它们按照进率1024(2的十次方)来计算:

  1 Byte =8 bit

  1 KB = 1,024 Bytes = 8192 bit

  1 MB = 1,024 KB = 1,048,576 Bytes

  1 GB = 1,024 MB = 1,048,576 KB

  1 TB = 1,024 GB = 1,048,576 MB

  1 PB = 1,024 TB = 1,048,576 GB

  1 EB = 1,024 PB = 1,048,576 TB

  1 ZB = 1,024 EB = 1,048,576 PB

  1 YB = 1,024 ZB = 1,048,576 EB

  1 BB = 1,024 YB = 1,048,576 ZB

  1 NB = 1,024 BB = 1,048,576 YB

  1 DB = 1,024 NB = 1,048,576 BB

  全称:

  1 Bit(比特) =Binary Digit

  8Bits = 1 Byte(字节)

  1,000 Bytes = 1 Kilobyte

  1,000Kilobytes = 1 Megabyte

  1,000 Megabytes = 1 Gigabyte

  1,000 Gigabytes = 1Terabyte

  1,000 Terabytes = 1 Petabyte

  1,000 Petabytes = 1 Exabyte

  1,000Exabytes = 1 Zettabyte

  1,000 Zettabytes = 1 Yottabyte

  1,000 Yottabytes = 1Brontobyte

  1,000 Brontobytes = 1 Geopbyte

  意义:

  现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。 阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology数据科技,显示大数据对于阿里巴巴集团来说举足轻重。

  有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是赢得竞争的关键。

  大数据的价值体现在以下几个方面:

  1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销

  2) 做小而美模式的中小微企业可以利用大数据做服务转型

  3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值

  不过,“大数据”在经济发展中的巨大意义并不代表其能取代一切对于社会问题的理性思考,科学发展的逻辑不能被湮没在海量数据中。著名经济学家路德维希·冯·米塞斯曾提醒过:“就今日言,有很多人忙碌于资料之无益累积,以致对问题之说明与解决,丧失了其对特殊的经济意义的了解。”这确实是需要警惕的。

  在这个快速发展的智能硬件时代,困扰应用开发者的一个重要问题就是如何在功率、覆盖范围、传输速率和成本之间找到那个微妙的平衡点。企业组织利用相关数据和分析可以帮助它们降低成本、提高效率、开发新产品、做出更明智的业务决策等等。例如,通过结合大数据和高性能的分析,下面这些对企业有益的情况都可能会发生:

  1)及时解析故障、问题和缺陷的根源,每年可能为企业节省数十亿美元。

  2)为成千上万的快递车辆规划实时交通路线,躲避拥堵。

  3)分析所有SKU,以利润最大化为目标来定价和清理库存。

  4)根据客户的购买习惯,为其推送他可能感兴趣的优惠信息。

  5)从大量客户中快速识别出金牌客户。

  6)使用点击流分析和数据挖掘来规避欺诈行为。

+1

来源:电商汇

推荐文章