什么是大数据?


简单来说,大数据是指比传统数据更大、更复杂,并且随着时间推移呈指数级增长的数据集。它规模如此庞大,以至于传统的数据库管理软件或工具无法有效地管理、存储或处理它。因此,需要通过不同的方法逐步对其进行处理。

大数据的应用领域包括:

  • 银行和证券
  • 通信、媒体和娱乐
  • 医疗保健提供者
  • 教育
  • 制造业和自然资源
  • 政府
  • 保险
  • 零售和批发贸易
  • 交通运输
  • 能源和公用事业

大数据的用途包括:

  • 位置追踪
  • 精准医疗
  • 欺诈检测与处理
  • 广告
  • 娱乐与媒体

Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.

现实世界中的大数据示例

  • 发现消费者购物习惯。
  • 个性化营销。
  • 运输行业的燃油优化工具。
  • 通过可穿戴设备数据监控健康状况。
  • 自动驾驶汽车的实时道路地图。
  • 简化媒体流。
  • 预测性库存订购

大数据面临的问题

大数据面临三个主要问题,如下所示:

数据质量低和数据不准确

低质量数据或不准确的数据质量可能导致结果或预测不准确,这只会浪费个人时间和精力。

为了解决问题、预测或从数据中发现新的模式,数据必须具有高质量和准确性。

处理大型数据集

由于数据量庞大,传统的数据库管理工具或软件无法直接/轻松地处理,因为这些大型数据集的规模通常以TB为单位,处理起来非常困难。

因此,我们需要经历各个阶段来处理数据,例如去除不必要的低质量数据、根据某些定义的因素对数据进行分区等。

集成来自各种来源的数据

数据来自各种来源,例如社交媒体、不同的网站、捕获的图像/视频、客户日志、个人创建的报告、报纸、电子邮件等。

收集和集成各种不同类型的数据是一项非常具有挑战性的任务。

更新于: 2021年9月16日

5K+ 浏览量

开启您的 职业生涯

通过完成课程获得认证

开始学习
广告