科学

什么是大数据?»其定义和含义

Anonim

大型组织每天都在更新便利和更好地适合每个公司的技术,面临着巨大的挑战,这些挑战使他们无法发现和分析日常使用的工具,而是为他们创建的所谓的“大数据”或在西班牙称为海量数据的大型数据存储系统

这种存储现象在新的信息和通信技术中得到了体现。大数据是与存储大量数据的系统有关的所有活动。主要特征之一是,它可以处理大量信息,收集,分类信息然后进行存储。该收集的目的是创建供组织使用的统计报告,以作为对业务计划,广告,间谍活动等的分析。

多年来,存储利润不断增长,自2008年以来,存储级别以PB到ZB为单位进行测量。专家定期寻找新的存储措施,因为在某些区域中必须存储大量数据并且现有程序不是很理想。

创建和管理大数据的工具有成千上万种,但是并不是全部相同,而是有三种数据类型,分别是:

  1. 结构化数据:是指数据具有非常特殊的结构(例如日期,数字等)的数据。电子表格就是一个例子。
  2. 非结构化数据:通常是具有特定格式且不能存储在电子表格中的数据,更不用说操纵信息了,例如PDF文档。
  3. 半结构化数据:这种类型的数据没有特定的格式,因为它具有自己的半结构化元数据,例如HTML代码。