什么是在线分析处理?

联机分析处理(OLAP)是一种软件技术,可用于从不同的角度分析业务数据。组织收集和存储来自多个数据源的数据,例如网站、应用程序、智能电表和内部系统。OLAP 将这些数据合并分为几类,为战略规划提供切实可行的见解。例如,零售商存储有关其销售的所有产品的数据,例如颜色、尺寸、成本和位置。零售商还在不同的系统中收集客户购买数据,例如所订购商品的名称和总销售价值。OLAP 合并数据集以回答诸如哪些颜色产品更受欢迎或产品展示位置如何影响销售等问题。

为什么 OLAP 非常重要?

在线分析处理 (OLAP) 帮助组织处理不断增加的数字信息并从中受益。OLAP 的一些优势包括以下几点。

更快地进行决策

企业使用 OLAP 快速准确地做出决策,从而在快节奏的经济环境中保持竞争力。在多个关系数据库上执行分析查询非常耗时,因为计算机系统会搜索多个数据表。另一方面,OLAP 系统会预先计算和集成数据,以便业务分析师可以在需要时更快地生成报告。

非技术用户支持

OLAP 系统使非技术业务用户更轻松地进行复杂的数据分析。业务用户可以创建复杂的分析计算并生成报告,而非学习如何操作数据库。

集成式数据视图

OLAP 为营销、金融、生产和其他业务部门提供统一的平台。经理和决策者可以看清大局并有效地解决问题。他们可以执行假设分析,以显示一个部门做出的决策对其他业务领域的影响。

什么是 OLAP 架构?

联机分析处理(OLAP)系统通过表示两个以上维度或类别中的信息存储多维数据。二维数据涉及列和行,但多维数据具有多个特征。例如,产品销售的多维数据可能由以下维度组成:

  • 产品类型
  • 地点
  • 时间

数据工程师构建了一个由以下元素组成的多维 OLAP 系统。 

数据仓库

数据仓库从不同的来源(包括应用程序、文件和数据库)收集信息。其使用各种工具处理信息,以便数据可供用于分析目的。例如,数据仓库可能会从关系数据库中收集信息,该数据库将数据存储在行表和列表中。 

ETL 工具

提取、转换、加载 (ETL) 工具是数据库流程,可自动检索、更改数据并将其准备为适合分析目的的格式。在将来自各种来源的信息提供给 OLAP 工具之前,数据仓库会使用 ETL 对这些信息进行转换和标准化。

OLAP 服务器

OLAP 服务器是为 OLAP 系统提供支持的底层计算机。该服务器使用 ETL 工具对关系数据库中的信息进行转换,并准备将这些信息用于 OLAP 操作。 

OLAP 数据库

OLAP 数据库是连接到数据仓库的独立数据库。在某些时候,数据工程师会使用 OLAP 数据库防止数据仓库承受 OLAP 分析带来的压力。他们还使用 OLAP 数据库更轻松地创建 OLAP 数据模型。

OLAP 立方体

数据立方体是一个表示多维信息数组的模型。虽然可轻松将其可视化为三维数据模型,但大多数数据立方体具有三个以上的维度。OLAP 立方体或超级立方体是描述 OLAP 系统中数据立方体的术语。OLAP 立方体是刚性的,因为对其建模后,无法更改维度和底层数据。例如,如果将仓库维度添加到包含产品、位置和时间维度的立方体中,则必须对整个立方体重新建模。 

OLAP 分析工具

业务分析师使用 OLAP 工具与 OLAP 立方体进行交互。他们执行切片、切割和透视等操作,以更深入地了解 OLAP 立方体中的特定信息。 

OLAP 的工作原理是什么?

OLAP 的工作原理是什么?

在线分析处理 (OLAP) 系统的工作原理是使用以下步骤收集、整理、聚合和分析数据: 

  1. OLAP 服务器从多个数据来源(包括关系数据库和数据仓库)收集数据。
  2. 然后,提取、转换、加载 (ETL) 工具根据指定的维度数量清理、聚合、预计算数据并将这些数据存储在 OLAP 立方体中。
  3. 业务分析师使用 OLAP 工具从 OLAP 立方体中的多维数据中查询和生成报告。

OLAP 使用多维表达式 (MDX) 查询 OLAP 立方体。MDX 是一个类似于 SQL 的查询,提供一套操作数据库的说明。

OLAP 有哪些类型?

在线分析处理 (OLAP) 系统主要以三种方式运行。

MOLAP

多维在线分析处理 (MOLAP) 涉及创建一个数据立方体,该立方体表示来自数据仓库的多维数据。MOLAP 系统将预先计算的数据存储在超级立方体中。数据工程师之所以使用 MOLAP,是因为这种类型的 OLAP 技术可提供快速分析。 

ROLAP

通过关系在线分析处理 (ROLAP) 而非使用数据立方体,数据工程师可以在关系数据库上执行多维数据分析。换言之,数据工程师使用 SQL 查询根据所需的维度搜索和检索特定信息。ROLAP 适用于分析广泛而详细的数据。但是,与 MOLAP 相比,ROLAP 的查询性能较慢。 

HOLAP

混合式在线分析处理 (HOLAP) 结合 MOLAP 和 ROLAP,以提供两种架构的最佳性能。HOLAP 使数据工程师能够从数据立方体中快速检索分析结果,并从关系数据库中提取详细信息。 

什么是 OLAP 中的数据建模?

数据建模表示数据仓库或在线分析处理 (OLAP) 数据库中的数据。数据建模在关系在线分析处理 (ROLAP) 中必不可少,因为其可以直接分析关系数据库中的数据。其将多维数据存储为星型或雪花型架构。 

星型架构

星型架构由一个事实表和多个维度表组成。事实表是一个数据表,包含与业务流程相关的数值,维度表包含描述事实表中每个属性的值。事实表指包含外键的维度表,外键是与维度表中相应信息关联的唯一标识符。 

在星型架构中,事实表连接到几个维度表,因此数据模型看起来像星形。以下是产品销售事实表的示例: 

  • 产品 ID
  • 位置 ID
  • 销售人员 ID
  • 销售金额

产品 ID 指示数据库系统从产品维度表中检索信息,该表可能如下所示:

  • 产品 ID
  • 产品名称
  • 产品类型
  • 产品成本

同样,位置 ID 指向位置维度表,该表可能由以下内容组成:

  • 位置 ID
  • 国家/地区
  • 城市

销售人员表可能如下所示:

  • 销售人员 ID
  • 电子邮件

雪花型架构

雪花型架构是星型架构的扩展。某些维度表可能会产生一个或多个二级维度表。当将这些维度表放在一起时,会产生雪花般的形状。 

例如,产品维度表可能包含以下字段:

  • 产品 ID
  • 产品名称
  • 产品类型 ID
  • 产品成本

产品类型 ID 连接到另一个维度表,如下例所示:

  • 产品类型 ID
  • 类型名称
  • 版本
  • 变体 

什么是 OLAP 操作?

业务分析师使用多维在线分析处理 (MOLAP) 立方体执行一些基本分析操作。 

汇总

在汇总中,在线分析处理 (OLAP) 系统总结特定属性的数据。换言之,该系统显示不太详细的数据。例如,您可以根据纽约、加利福尼亚州、伦敦和东京查看产品销售情况。汇总操作将提供基于国家/地区(例如美国、英国和日本)的销售数据视图。 

向下钻取

向下钻取与汇总操作相反。业务分析师在概念层次结构中向下移动,并提取所需的详细信息。例如,他们可以从按年查看销售数据转换为按月进行可视化。

切片

数据工程师使用切片操作从 OLAP 立方体创建二维视图。例如,MOLAP 立方体根据产品、城市和月份对数据进行排序。通过对立方体进行切片,数据工程师可以创建一个类似电子表格的表格,该表格由特定月份的产品和城市组成。 

切割

数据工程师使用切割操作从 OLAP 立方体创建较小的子立方体。他们确定所需维度,并从原始超级立方体中构建一个较小的立方体。

透视

透视操作涉及沿其中一个维度旋转 OLAP 立方体,以获得多维数据模型的不同视角。例如,三维 OLAP 立方体在相应轴上具有以下维度:

  • X 轴—产品 
  • Y 轴—位置
  • Z 轴—时间

透视时,OLAP 立方体具有以下配置:

  • X 轴—位置
  • Y 轴—时间
  • Z 轴—产品

OLAP 与其他数据分析方法相比如何?

数据挖掘

数据挖掘是一种分析技术,用于处理大量历史数据以发现模式和见解。业务分析师使用数据挖掘工具发现数据中的关系,并对未来趋势做出准确预测。

OLAP 和数据挖掘

在线分析处理 (OLAP) 是一种数据库分析技术,涉及对汇总数据的查询、提取和研究。另一方面,数据挖掘涉及深入研究未处理的信息。例如,营销人员可以使用数据挖掘工具从每次访问网站的记录中分析用户行为。然后,他们可能会使用 OLAP 软件从各个角度(例如持续时间、设备、国家/地区、语言和浏览器类型)检查这些行为。 

OLTP

在线事务处理 (OLTP) 是一种数据技术,可将信息快速可靠地存储在数据库中。数据工程师使用 OLTP 工具将事务数据(例如金融记录、服务订阅和客户反馈)存储在关系数据库中。OLTP 系统涉及创建、更新和删除关系表中的记录。 

OLAP 和 OLTP

OLTP 非常适合处理和存储数据库中的多个事务流。但无法从数据库执行复杂查询。因此,业务分析师使用 OLAP 系统来分析多维数据。例如,数据科学家将 OLTP 数据库连接到基于云的 OLAP 立方体,以便在历史数据上执行计算密集型查询。

AWS 如何通过 OLAP 提供帮助?

AWS 数据库提供各种托管云数据库,帮助组织存储和执行在线分析处理 (OLAP) 操作。数据分析师使用 AWS 数据库构建符合其组织要求的安全数据库。由于经济实惠和可扩展性,组织将其业务数据迁移到 AWS 数据库。 

  • Amazon Redshift 是一个专为在线分析处理而设计的云数据仓库。
  • Amazon Relational Database Service(Amazon RDS)是一种具有 OLAP 功能的关系数据库。数据工程师将 Amazon RDS 和 Oracle OLAP 搭配使用以在维度立方体上执行复杂查询。
  • Amazon Aurora 是一个兼容 MySQL 和 PostgreSQL 的云关系数据库。该数据库针对运行复杂 OLAP 工作负载进行了优化。


立即创建 AWS 账户,在 AWS 上开启 OLAP 之旅。

在线分析处理后续步骤

查看其他与产品相关的资源
了解有关分析服务的更多信息 
注册免费账户

立即享受 AWS 免费套餐。 

注册 
开始在控制台中构建

在 AWS 管理控制台中,使用 AWS 开始构建。

登录