概览
使用 Amazon Redshift 时,您可以从小规模开始(每小时 0.25 美元),逐渐扩展到 PB 级数据和数千个并发用户。您可以选择适合您业务需求的方案,并在不过度预置计算或存储的情况下增加存储。通过预置的 Amazon Redshift,您可以选择按需实例并按小时数为数据库付费,而无长期合约或预付费,也可以选择预留实例以获得其他节约。或者,Amazon Redshift 无服务器版让您能够根据应用程序的需求自动启动、关闭和扩缩容量来按实际使用量付费,因此,您只需为处理工作负载时使用的容量付费。
预置的 Amazon Redshift 有哪些好处:
首先详细了解节点类型,以选择最适合您需求的集群配置。您可以通过调用一次 API 或在 Redshift 控制台单击几下鼠标,快速扩展集群、暂停和恢复集群并在节点类型之间进行切换。在进行选择之前,您会看到按需定价,之后您可以购买预留节点以享受大幅折扣。
当您进行选择后,您可能希望使用弹性调整大小在几分钟内轻松调整预置计算容量,以进行稳态处理。使用调整大小计划程序,您可以每日或每周添加和删除节点,以优化成本和获得最佳性能。对于动态工作负载,您可以使用并发扩展在耗尽免费积分后自动预置其他计算容量,且只需按秒为您的使用量付费(请参阅并发扩展定价)。
Amazon Redshift 节点类型
使用具有托管存储的 RA3 节点,您可以通过分别扩展托管存储和计算容量并单独付费来优化数据仓库。使用 RA3,您可以根据性能要求选择节点数量,并只为您使用的托管存储支付费用。您应该根据您每日处理的数据量调整 RA3 集群大小。
Redshift 托管存储 (RMS) 使用每个 RA3 节点中的大型高性能固态硬盘 (SSD) 来获得更快的本地存储,使用 Amazon Simple Storage Service (Amazon S3) 来实现时间更长的持久存储。如果节点中的数据超过大型本地 SSD 的大小,RMS 会自动将数据分流到 Amazon S3。无论数据存储在高性能 SSD 中是 Amazon S3 中,RMS 都采用相同的费率,而且费用较低。对于需要的存储不断增长的工作负载,托管存储使您能够在不增加额外节点和支付费用的情况下,自动扩展数据仓库的存储容量。
DC2 节点可用于创建包含本地 SSD 存储的计算密集型数据仓库。您可以根据数据大小和性能需求选择所需的节点数量。DC2 节点将您的数据存储在本地,以获得高性能,并且随着数据大小增长,您可以添加更多计算节点来提高集群的存储容量。对于 1TB 以下的未压缩数据集,我们建议使用 DC2 节点类型,从而以最低的价格获得最佳的性能。如果您预计数据会增长,我们建议您使用 RA3 节点,以便您可以分别调整存储和计算大小,以实现最佳性价比。
采用随用随付定价模型的 Redshift 功能
- Amazon Redshift 节点类型:选择最适合您需求的集群配置和节点类型,并且可以使用 Amazon Redshift 按需定价按小时支付容量费用。当您选择按需定价时,您可以使用暂停和恢复功能在不使用集群时暂停按需计费。您还可以为稳定状态的工作负载选择预留实例而不是按需实例,从而获得比按需定价低得多的价格。
- Amazon Redshift Spectrum 定价:直接对 Amazon S3 数据湖中的 EB 级数据运行 SQL 查询,只需按扫描的字节数付费。
- 并发扩展定价:每个集群每天最多可获得 1 小时的并发扩展免费积分,这足以满足 97% 的客户的需求。这样,即使有数千个并发查询和用户,您也能提供始终如一的快速性能。您只需以每秒按需费率为超出免费积分的使用量付费。
- RMS 定价:仅为存储在 RA3 集群中的数据付费,而不必考虑预置的计算节点的数量。您只需按小时为托管存储中的数据总量付费。 RMS 还用于 Amazon Redshift 无服务器版。
- Redshift ML:使用 SQL 创建、训练和部署机器学习 (ML) 模型。用尽 Amazon SageMaker 的免费套餐后,您将承担创建模型和存储的费用。 Redshift ML 也可用于 Amazon Redshift Serverless。
Amazon Redshift 免费试用
如果您从未使用过 Amazon Redshift Serverless,则有资格获得 300 美元的计算和存储使用抵扣金(有效期为 90 天)。此抵扣金的使用率取决于实际使用情况和无服务器版端点的计算容量。
在尚未推出 Amazon Redshift Serverless 的地区,客户可以开始免费试用预置集群。您有资格免费试用我们的 DC2 大型节点两个月。如果您的组织每月获得 750 小时的免费试用时间,就能持续运行一个具有 160GB 压缩 SSD 存储的 dc2.large 节点。一旦您的 2 个月试用到期或者您的使用时长超过每月 750 小时的试用时间,您可以关闭集群,从而避免产生任何费用,或者保留集群并按我们的标准按需费率支付费用。请访问 Amazon Redshift 免费试用页面了解更多信息。
按需定价
Amazon Redshift 按需定价让您能够按小时为预置容量付费,而无需订立合约,也无需为您选择运行数据仓库的特定节点类型预付费用。您只需根据所选的节点类型和集群中的节点数量按小时费率付费。只要集群在运行,您就需要支付费用。不满一小时的部分按秒计费,然后提供可计费的状态更改,例如创建、删除、暂停或恢复集群。暂停和恢复功能使您可以在集群暂停期间暂停按需计费。暂停和恢复是对 Redshift 节点类型的手动或计划操作。在集群暂停期间,您只需要为备份存储付费。这样可以避免规划和购买超出需求的数据仓库容量,使您能够针对开发或测试目的经济高效地管理环境。 对于多可用区部署,虽然收费标准不变,不过计算却要翻倍,因为您需要为单个 AZ 部署支付费用。
最新一代
*托管存储中每个 RA3 节点的总可寻址存储容量。
上一代
计算按需实例每年每 TB 的有效价格
对于按需实例,每年每 TB 的有效价格为实例小时价格乘以一年内的小时数,再除以每个实例的 TB 数。对于 RA3,存储在托管存储中的数据将根据存储在 RA3 节点类型中的实际数据单独计费;仅针对计算节点成本计算每年每 TB 的有效价格。
Amazon Redshift Serverless
您可以以低至每小时 3 美元的价格开始使用 Amazon Redshift Serverless,并且只需为您的数据仓库在活动时消耗的计算容量付费。您的数据仓库将自动扩展或缩减容量以满足您的分析工作负载需求,并在不活动时关闭,从而为您节省管理时间和成本。Amazon Redshift 以 Redshift 处理单元 (RPU) 衡量数据仓库的容量。您将按 RPU 小时为运行的工作负载付费(按每秒计费,最少为 60 秒),包括访问 Amazon S3 中开放文件格式数据的查询。数据仓库启动时间不收费。费用包含弹性扩缩和全面的安全功能。您无需单独为并发扩展和 Redshift Spectrum 付费,因为它们都包含在 Amazon Redshift Serverless 中。
您可以选择使用基本、最大 RPU 小时数和 MaxRPU(最大容量)设置来控制数据仓库的性能和成本。
- Base — 此设置使您能够指定 Amazon Redshift 用于提供查询服务的基本数据仓库容量。基本容量以 RPU 为单位。设置更高的基本计算容量可以提高查询性能,尤其是对于处理大量数据并执行转换和扩充的数据处理和 ETL(提取、转换、加载)任务。您可以从 Amazon Redshift 管理控制台或通过调用 Amazon Redshift API 按 8 个单位(8、16、24、32、40、48 等,最多 512 个)将 Base 从 8 个 RPU 调整为 512 个 RPU。
- Max — 此设置使您能够指定使用限制,并定义 Amazon Redshift 在达到这些限制时自动采取的操作,以维持预算的可预测性。Max 以 RPU 小时为单位,并与每日、每周或每月的持续时间关联。设置更高的计算容量最大值可以提高系统的整体吞吐量,这对需要处理高并发同时保持一致的高性能的工作负载尤其有利。您可以从 Amazon Redshift 管理控制台或通过调用 Amazon Redshift API 来调整 Max。
- MaxRPU(最大容量)— 此设置确定 Amazon Redshift Serverless 可以容纳用于扩展目的的最高 RPU 数量。当需要自动计算扩展时,为 MaxRPU 设置较高的值可以提高查询吞吐量。达到 MaxRPU 限制后,工作组计算就不会进一步纵向扩展资源。
主存储容量按 Redshift 托管存储(RMS)计费,用于用户快照的存储按本页中的标准备份费率计费。存储的计费方式与 Amazon Redshift 预置集群相同。借助 Amazon Redshift Serverless,您可以按 30 分钟粒度免费将数据仓库恢复到最近 24 小时内的特定时间点。数据传输和 ML 将单独计费,计费方式与预置集群相同。跨 AWS 区域的快照复制和数据共享将按本页中的传输费率计费。
Amazon Redshift 托管存储定价
您需要按固定的 GB 月费率为存储在您所在区域的托管存储中的数据付费。托管存储专用于 RA3 节点类型,无论数据大小如何,您都要按相同的低费率为 Redshift 托管存储付费。托管存储的使用量根据托管存储中的总数据每小时计算一次(请参阅下面的示例,了解如何将 GB 小时使用量转换为 GB 月费用)。您可以通过 Amazon CloudWatch 或 AWS 管理控制台监控 RA3 集群中的数据量。您无需支付 RA3 节点与托管存储之间的任何数据传输费用。托管存储费用不包括由于自动和手动快照而产生的备份存储费用(请参阅备份存储)。集群终止后,您需要继续为保留手动备份而付费。
托管存储定价示例
将该值转换为 GB 月使用量:36,900,000 GB 小时使用量 / 4 月整月 720 小时 = 51,250 GB 月使用量。
Amazon Redshift Spectrum 定价
使用 Amazon Redshift Spectrum,您可以直接对 Amazon S3 中的数 EB 数据运行 SQL 查询。您需要按 Redshift Spectrum 扫描的字节数(四舍五入至下一个兆字节,每条查询至少 10MB)付费。无需为用于管理分区和失败查询的数据定义语言 (DDL) 语句(如 CREATE/ALTER/DROP TABLE)付费。
Amazon Redshift 无服务器版对 Amazon S3 中外部数据的查询不单独计费,而是包含在 Amazon Redshift 无服务器版的费用中(以 RPU 小时为单位)。
您可以用压缩并分区的列式数据格式存储数据,从而提高查询性能并降低成本。如果您使用 Redshift Spectrum 支持的格式之一来压缩数据,您的费用会降低,因为扫描的数据量较少。同样,如果您使用 Apache Parquet 或优化的行列格式 (ORC) 等列式格式存储数据,您的费用会降低,因为 Redshift Spectrum 只会扫描查询所需的列。
使用 Redshift Spectrum,您需要为扫描的每 TB 数据(四舍五入到下一个兆字节,每条查询至少 10MB)付费。例如,如果您扫描了 10 GB 数据,则需要支付 0.05 美元。如果您扫描了 1TB 数据,则需要支付 5.00 美元。
额外费用
您需要为用于通过 Redshift Spectrum 查询数据的 Amazon Redshift 集群付费。Redshift Spectrum 直接在 Amazon S3 中查询数据。您需要按标准 S3 费率为存储在 S3 存储桶中的对象以及针对 S3 存储桶发出的请求付费。有关详细信息,请参阅 Amazon S3 费率。
如果您将 AWS Glue Data Catalog 与 Amazon Redshift Spectrum 结合使用,则需要按照标准 AWS Glue Data Catalog 费率付费。有关详细信息,请参阅 AWS Glue 定价。
使用 Amazon Redshift Spectrum 在 Amazon S3 中查询 AWS Key Management Service (KMS) 加密数据时,您需要支付标准 AWS KMS 费率。 有关详细信息,请参阅 AWS KMS 定价。
Redshift Spectrum 定价示例,基于美国东部(弗吉尼亚北部)的定价
假设一个表中有 100 个大小相同的列,以未压缩文本文件的格式存储在 Amazon S3 中,总大小为 4TB。如果运行查询以从该表的一个列中获取数据,则 Redshift Spectrum 需要扫描整个文件,因为文本格式无法拆分。该查询将扫描 4TB 数据,费用为 20 美元(5 美元/TB x 4TB = 20 美元)。
如果您使用 GZIP 压缩文件,那么压缩比可能为 4:1。这样,您就会获得一个大小为 1TB 的压缩文件。Redshift Spectrum 必须扫描整个文件,但由于它的大小是原来的四分之一,因此您只需支付四分之一的费用,即 5 美元(5 美元/TB x 1TB = 5 美元)。
如果您压缩文件并将其转换为列式格式(如 Apache Parquet),那么压缩比可能为 4:1,您就会获得一个大小为 1TB 的压缩文件。使用上述查询,Redshift Spectrum 只需扫描 Parquet 文件的其中一列。该查询的费用为 0.05 美元(5 美元/TB x 1TB 文件大小 x 1/100 列,即 10 GB 的总扫描量 = 0.05 美元)
注意:以上定价示例仅用于说明目的。不同文件和列的压缩比可能会有所不同。
并发扩展定价
Amazon Redshift 可自动添加瞬态容量,以始终保持快速性能,即使存在数千个并发用户和查询也不受影响。您无需管理任何资源和预付任何费用,也无需为瞬态集群的启动或关闭时间付费。您可以在主集群运行时每 24 小时累积 1 小时的并发扩展集群积分。您只需在使用并发扩展集群享受查询服务期间,以每秒按需费率为超出免费积分的使用量付费,每次激活并发扩展集群时最低按 1 分钟收费。每秒按需费率基于 Amazon Redshift 集群中的节点类型和数量。
默认情况下,Amazon Redshift Serverless 将根据需要自动扩展和缩减资源,以满足工作负载需求,而且并发扩展不单独计费。
并发扩展积分
Redshift 集群每天最多可获得 1 小时的并发扩展免费积分。您的 AWS 账户中的每个活动集群按小时赚取积分,并且只有赚取积分后才能被同一集群使用。每个活动集群累计最多可获得 30 小时的免费并发扩展积分。只要您的集群不终止,积分就始终有效。
并发扩展定价示例
10 DC2.8XL 节点 Redshift 集群在美国东部的定价为 48 USD/小时。试想,两个瞬态集群均超出免费并发扩展积分使用 5 分钟。并发扩展的每秒按需费率为:48 美元 x 1/3600 = 0.013 美元/秒。在本示例中,并发扩展的额外成本为:0.013 美元/秒 x 300 秒 x 2 个瞬态集群 = 8 美元。因此,在本示例中,Amazon Redshift 集群和两个瞬态集群的总成本为 56 美元。
Redshift ML 定价
如果您以前没有使用过 Amazon SageMaker,当您开始使用 Redshift ML 时,就有资格获得 Amazon SageMaker 免费套餐。这包括每月两个免费 CREATE MODEL 请求,为期两个月,每个请求最多包含 10 万个单元格。您的免费套餐从您使用 Redshift ML 创建第一个模型的第一个月开始。
Amazon S3 费用
CREATE MODEL 请求还会产生少量 Amazon S3 费用。S3 成本应该低于每月 1 美元,因为 CREATE MODEL 生成的 S3 数据量约为数 GB。当垃圾回收打开时,它们会被快速删除。首先使用 Amazon S3 存储由 CREATE MODEL 的 SELECT 查询产生的训练数据。然后,它用于存储预测所需的各种与模型相关的构件。默认的垃圾回收模式将在 CREATE MODEL 的末尾删除训练数据及与模型相关的构件。
成本控制选项
您可以通过设置 MAX_CELLS 来控制训练费用。如果您不这样做,则 MAX_CELLS 的默认值为一百万,在大多数情况下,这将使您的训练费用保持在 20 美元以下。当训练数据集超过一百万时,定价将按如下方式增加:
单元格数 | 价格 |
前 1000 万个单元格 |
每百万个单元格 20 USD |
接下来的 9000 万个单元格 |
每百万个单元格 15 USD |
超过 1 亿个单元格 |
每百万个单元格 7 美元 |
请注意,实际定价通常会低于上述共享的上限。
CREATE MODEL 费用示例:
- 100 万个单元格为 20 USD (= 1 x 20)
- 200 万个单元格为 40 USD (= 2 x 20)
- 2300 万个单元格为 395 USD (= 10 x 20 + 13 x 15)
- 9900 万个单元格为 1535 USD (= 10 x 20 + 89 x 15),以及
- 2.11 亿个单元格为 2,327 美元 (= 10 x 20 + 90 x 15 + 111 x 7)
如果 CREATE MODEL 请求的 SELECT 查询生成的训练数据超过您提供的 MAX_CELLS 限制(如果您没有提供一个限制,则默认为一百万),CREATE MODEL 将从训练数据集中随机选择大约 MAX_CELLS/“列数”记录,并将使用这些随机选择的元组进行训练。随机选择旨在预防减少后的训练数据集存在偏差。因此,通过设置 MAX_CELLS,您可以将成本控制在一定范围内。
预留实例定价
预留实例适合状态稳定的生产工作负载,提供比 Amazon Redshift 节点类型按需定价更大的折扣。运行试验和概念验证对生产配置进行验证后,客户一般会购买预留实例。
通过承诺使用 Amazon Redshift 一年或三年,您节省的费用将比采用按需费率更多。预留实例定价取决于购买的节点类型,在预留期结束之前始终有效。价格包括数据的两个额外副本,一个在群集节点中,另一个在 Amazon S3 中。我们将为您处理备份、持久性、可用性、安全性、监控和维护工作。
有三种预留实例定价可供选择:
无预付费用 – 您无需预付任何费用,只需在一年内支付每月费用。
预付部分费用 – 您预付部分预留实例费用,剩余费用在一或三年期间内支付。
预付全费 – 您通过一次性预付全费支付整个预留实例期限(一年或三年)内的费用。
预留实例是一种计费理念,不能用于创建数据仓库集群。购买时,即使您目前尚未运行集群或现有集群处于暂停状态,也需要支付相关的预付费用和每月费用。要购买预留实例,请访问 Redshift 控制台中的“预留节点”选项卡。
我们可以随时终止预留实例定价计划。除了受预留实例定价约束之外,预留实例还需遵守 AWS 客户协议或与我们就您使用我们的服务达成的其他协议项下适用的所有数据传输和其他费用。
*这是整个预留实例使用期内的平均月付款项。每个月的实际月付款项等于该月的实际小时数乘以小时使用费率,或者等于该月的秒数乘以小时使用费率再除以 3600,具体取决于您运行的 Redshift 实例类型。小时使用费率等于整个预留实例有效期间的月付款项总平均值除以整个预留实例期间的总小时数(基于 365 天一年)。
** 有效小时定价可以帮助您计算预留实例比按需定价节省的成本。当您购买预留实例时,将按照您选择的整个预留实例期间的每个小时向您收费,无论该实例是否在运行。有效小时定价显示分摊的小时实例成本。它计算预留实例在整个有效期间的总成本,包括任何预付款项,然后将该成本分摊到该预留实例期间的每个小时。
***对于预留实例,将小时费率乘以该期限中的小时数,结果与预付费用相加,然后除以该期限中的年份数和每个节点的 TB 数。对于 RA3,存储在托管存储中的数据将根据存储在 RA3 节点类型中的实际数据单独计费;仅针对计算节点成本计算每年每 TB 的有效价格。
零 ETL 集成成本 最新资讯
Amazon Redshift 可与 OLTP 数据库零 ETL 集成,无需构建和管理 ETL 管道。支持的数据库包括 Amazon Aurora、Amazon DynamoDB 和 Amazon Relational Database Service(Amazon RDS)for MySQL。这些集成为您提供了灵活性,让您可以选择数据库中的特定数据表,以自动复制到 Amazon Redshift。这种灵活性使您能够跨多个应用程序和数据来源运行统一的分析。AWS 不对零 ETL 集成收取额外费用。您需要为用于创建和处理在零 ETL 集成过程中创建的变更数据的现有资源付费。这包括用于存储复制数据的额外 Amazon Redshift 存储、用于处理数据复制的计算(或 Amazon Redshift Serverless 上的 RPU)以及将数据从源移动到目标的跨可用区数据传输成本。通过零 ETL 集成对数据变更进行的持续处理无需另行付费。有关更多信息,请访问 Aurora、RDS for MySQL 和 DynamoDB 定价页面。
备份存储
备份存储是与快照(为数据仓库创建)相关的存储。延长备份保留期或增加快照拍摄数量,将增加数据仓库所消耗的备份存储。Amazon Redshift 对您使用控制台、应用程序编程接口(API)或命令行界面(CLI)手动创建的快照收费。Redshift 自动快照是默认设置,通过 Amazon Redshift 的快照计划功能创建,不收费,而且最长可保留 35 天。您无需为不足 24 小时的 Amazon Redshift Serverless 恢复点付费。如果您选择将恢复点保留超过 24 小时,则将产生费用,作为 RMS 费用的一部分。存储在 RA3 集群中的数据是 RMS 的一部分,按 RMS 费率计费,但为 RA3 集群创建的手动快照作为备份存储按标准 Amazon S3 费率计费,已在本页有所概述。
例如,如果您的 RA3 集群有 10TB 数据和 30TB 手动快照,则将向您收取 10TB 的 RMS 费用和 30TB 的备份存储费用。对于密集计算 (DC) 集群和密集存储 (DS) 集群,存储包含在集群中,无需单独付费,但备份存储在外部的 Amazon S3 中。超出密集计算和密集存储集群上预置存储大小的备份存储将作为备份存储按标准 S3 费率计费。快照在到期或删除(包括暂停或删除集群的情况)之前都会计费。
数据传输
您无需为同一 AWS 区域中 Amazon Redshift 和 Amazon S3 之间因备份、还原、加载和卸载操作而进行的数据传输付费。对于进出 Amazon Redshift 的所有其他数据传输,您将按标准 AWS 数据传输费率支付费用。 具体而言,如果您在 Amazon Virtual Private Cloud (VPC) 中运行 Amazon Redshift 集群,AWS 将按照标准 AWS 数据传输费率对通过 JDBC/ODBC 传输到 Amazon Redshift 集群终端节点的数据收费。此外,在您使用增强型 VPC 路由并将数据上传至其他区域中的 Amazon S3 时,将按照标准 AWS 数据传输费率付费。有关 AWS 数据传输费率的更多信息,请参阅 Amazon Elastic Cloud Compute (Amazon EC2) 定价页面。
Amazon Redshift 对跨区域的数据共享和跨区域的快照复制收费。数据共享收费记入访问数据的消费者区域的账单。跨区域的快照复制将按源区域,即创建快照的集群所在区域的费率计费。 数据传输费用适用于所有快照(自动和手动)和恢复点。快照副本的所有数据传输费用仅适用于增量数据。
数据共享数据传输或快照复制数据传输来自
定价示例
您使用四个 ra3.xlarge 节点和 40TB 的 RMS 一个月。在这一个月内,您还使用 Redshift Spectrum 扫描了 20TB 数据。您使用按需定价。
费用将按以下方式计算:
- Redshift RA3 实例成本 = 4 个实例 x 每小时 3.26 USD x 一个月 730 小时 = 9519.20 USD
- RMS 成本 = 40TB x 每 TB 1024 GB x 0.024 USD = 983.04 USD
- Redshift Spectrum 成本 = 20TB x 5.00 USD = 100.00 USD
每月总费用:10602.24 美元
您使用同时部署在 2 个 AZ 中的一个多 AZ 集群。每个 AZ 的集群拥有 4 个 ra3.4xlarge 节点,且每个月使用 40TB RMS。您使用按需定价。
费用将按以下方式计算:
- AZ1 的 Redshift RA3 实例成本 = 4 个实例 x 每小时 3.26 USD x 一个月 730 小时 = 9519.20 USD
- AZ2 的 Redshift RA3 实例成本 = 4 个实例 x 每小时 3.26 USD x 一个月 730 小时 = 9519.20 USD
- RMS 成本 = 40TB x 每 TB 1024 GB x 0.024 USD = 983.04 USD
每月总费用:20,021.44 美元
假设您有一个数据处理作业需要在美国东部(弗吉尼亚北部)区域的 Amazon Redshift 数据仓库中从上午 7 点到晚上 7 点每小时运行一次。为简单起见,假设每次作业所需的运行时间相同,都是10 分 30 秒。假设 Amazon Redshift 使用 128 个 RPU 容量来运行作业。
下表总结了您当天的总体使用情况。
查询期 |
任务在上午 7 点到晚上 7 点之间运行了 13 次,每次耗时 10 分 30 秒 = 136 分 30 秒 = 8190 秒 |
使用的容量 |
128 RPU |
每日费用 |
109.20 美元((8190 x 128 RPU x 每 RPU 小时 0.375 美元)/3600) |
假设您在美国东部(弗吉尼亚北部)区域的 Amazon Redshift 数据仓库中有一个控制面板应用程序。该应用程序的使用者包括组织中的各种用户(例如数据分析师、开发人员和数据科学家),并且在一天中有高峰期和低谷期。具体来说,应用程序的用户活动高峰期是在上午 9 点到 11 点和下午 2 点到 4 点之间,大多数用户在这期间执行分析和访问数据仓库中的数据。假设没有用户活动时,应用程序从上午 11 点到下午 2 点之间有四个 15 分钟的间隔。晚上 10 点到凌晨 5 点之间也没有用户活动。
现在让我们看看 Amazon Redshift 数据仓库的资源使用情况。假设为了更好地控制性价比,您已将 Amazon Redshift 无服务器版的 Base 配置明确设置为 64 RPU。假设在上午和下午的高峰期,Amazon Redshift 自动扩展并分别使用 192 RPU 和 128 RPU 的容量。
下表总结了您当天的总体使用情况。
时间框架 |
总查询执行期 |
上午 5 点 - 9 点 |
4 小时 64 RPU = 64 x 4= 256 RPU 小时 |
上午 9 - 11 点 |
2 小时 192 RPU = 384 RPU 小时 |
上午 11 点 - 下午 2 点 |
除去四次 15 分钟的空闲间隔,活动时间为 2 小时。 2 小时 64 RPU = 64 x 2= 128 RPU 小时 |
下午 2–3 点 |
1 小时 128 RPU = 128 RPU 小时 |
下午 3 点 - 晚上 10 点 |
7 小时 64 RPU = 64 x 7= 448 RPU 小时 |
晚上 10 点 - 凌晨 5 点 |
无活动 |
每日费用 |
504 美元((256+384+128+128+448) x 每 RPU 小时 0.375 美元) |
10 DC2.8XL 节点 Redshift 集群在美国东部的定价为 48 美元/小时。试想,两个瞬态集群均超出免费并发扩展积分使用 5 分钟。并发扩展的每秒按需费率为:48 美元 x 1/3600 = 0.013 美元/秒。在本示例中,并发扩展的额外成本为:0.013 美元/秒 x 300 秒 x 2 个瞬态集群 = 8 美元。因此,Redshift 集群和两个瞬态集群的总成本为 56 美元。
假设一个表中有 100 个大小相同的列,以未压缩文本文件的格式存储在 Amazon S3 中,总大小为 4TB。如果运行查询以从该表的一个列中获取数据,则 Redshift Spectrum 需要扫描整个文件,因为文本格式无法拆分。根据美国东部(弗吉尼亚北部)的 Redshift Spectrum 定价,此查询将扫描 4 TB 数据,费用为 20 美元。(5.00 美元/TB x 4 TB = 20 美元)
如果您使用 GZIP 压缩文件,那么压缩比可能为 4:1。这样,您就会获得一个大小为 1TB 的压缩文件。Redshift Spectrum 必须扫描整个文件,但由于它的大小是原来的四分之一,因此您只需支付四分之一的费用,即 5 美元(5 美元/TB x 1TB = 5 美元)。
如果您压缩文件并将其转换为列式格式(如 Apache Parquet),那么压缩比可能为 4:1,您就会获得一个大小为 1TB 的压缩文件。使用上述查询,Redshift Spectrum 只需扫描 Parquet 文件的其中一列。该查询的费用为 0.05 美元(5 美元/TB x 1 TB 文件大小 x 1/100 列,即 10 GB 的总扫描量 = 0.05 美元)
注意:以上定价示例仅用于说明目的。不同文件和列的压缩比可能会有所不同。