数据分析 - 概述



数据分析是指检查、清理、转换和建模数据以发现有用信息、提出结论和支持决策的过程。

.

数据分析的类型

存在多种数据分析技术,涵盖商业、科学、社会科学等各个领域,并具有各种名称。主要的数据分析方法包括:

  • 数据挖掘
  • 商业智能
  • 统计分析
  • 预测分析
  • 文本分析

数据挖掘

数据挖掘是对大量数据进行分析,以提取以前未知的、有趣的模式、异常数据和依赖关系。请注意,目标是从大量数据中提取模式和知识,而不是提取数据本身。

数据挖掘分析涉及人工智能、机器学习、统计学和数据库系统交叉领域中的计算机科学方法。

从数据挖掘获得的模式可以被视为输入数据的摘要,可用于进一步分析或通过决策支持系统获得更准确的预测结果。

商业智能

商业智能技术和工具用于获取和转换大量非结构化业务数据,以帮助识别、开发和创造新的战略业务机会。

商业智能的目标是允许轻松解释大量数据以识别新的机会。它有助于根据可以为企业提供竞争市场优势和长期稳定性的见解实施有效的策略。

统计分析

统计学是对数据的收集、分析、解释、展示和组织的研究。

在数据分析中,使用两种主要的统计方法:

  • 描述性统计 - 在描述性统计中,使用数值描述符(例如 -)来汇总来自整个人群或样本的数据:

    • 连续数据的平均值、标准差

    • 分类数据的频率、百分比

  • 推论统计 - 它利用样本数据中的模式来推断所代表的人群或考虑随机性。这些推论可以是:

    • 回答有关数据的是/否问题(假设检验)

    • 估计数据的数值特征(估计)

    • 描述数据中的关联(相关性)

    • 对数据中的关系进行建模(例如回归分析)

预测分析

预测分析使用统计模型来分析当前和历史数据,以预测未来或其他未知事件。在商业中,预测分析用于识别有助于决策的风险和机会。

文本分析

文本分析,也称为文本挖掘或文本数据挖掘,是从文本中提取高质量信息的流程。文本挖掘通常涉及构建输入文本、使用统计模式学习等方法在结构化数据中导出模式,以及最终评估和解释输出。

数据分析流程

统计学家 John Tukey 在 1961 年将数据分析定义为“分析数据的程序、解释此类程序结果的技术、规划数据收集以使其分析更容易、更精确或更准确的方法,以及所有适用于分析数据的(数学)统计机器和结果。”

因此,数据分析是一个从各种来源获取大型非结构化数据并将其转换为对以下方面有用的信息的流程:

  • 回答问题
  • 检验假设
  • 决策
  • 证伪理论

使用 Excel 进行数据分析

Microsoft Excel 提供了几种分析和解释数据的方法。数据可以来自各种来源。数据可以以多种方式进行转换和格式化。它可以使用相关的 Excel 命令、函数和工具进行分析 - 包括条件格式、区域、表格、文本函数、日期函数、时间函数、财务函数、小计、快速分析、公式审计、查询工具、假设分析、求解器、数据模型、PowerPivot、PowerView、PowerMap 等。

您将学习这些使用 Excel 的数据分析技术,分为两部分:

  • 使用 Excel 进行数据分析和
  • 使用 Excel 进行高级数据分析
广告