一般性问题
问:什么是 Amazon DevOps Guru?
答:Amazon DevOps Guru 是一种采用机器学习 (ML) 技术的服务,可用于轻松提高应用程序的操作性能和可用性。DevOps Guru 有助于检测偏离正常操作模式的行为,这样您就可以在操作问题影响您的客户之前及早地识别出它们。DevOps Guru 利用经过 Amazon.com 多年经验和 AWS 卓越运营训练的机器学习模型来识别异常应用程序行为(例如延迟、错误率、资源限制增加等)并显示可能导致潜在停机或服务中断的关键问题。当 DevOps Guru 识别出一个关键问题时,它会自动发送提示,并提供相关异常的摘要以及关于问题发生时间和地点的上下文。 在可能的情况下,DevOps Guru 还用于提供如何修复问题的建议。
问:为什么应该使用 Amazon DevOps Guru?
答:Amazon DevOps Guru 能为您节省数小时(如果不是数天的话)用于检测、调试和解决操作问题的时间和精力,并使您能够有效地监控复杂且不断发展的应用程序。它有助于避免监控中常见的导致应用程序停机的疏忽和错误,如缺失告警。当出现操作问题时,DevOps Guru 可以通过从大量数据源中获取相关信息和特定信息来节省调试时间。DevOps Guru 会生成运营洞察以提示您该问题,其中包括相关异常的摘要、关于问题发生原因和时间的上下文信息,以及关于如何修复问题和减少应用程序停机时间的建议。
问:Amazon DevOps Guru 的工作原理是什么?
答:Amazon DevOps Guru 的机器学习 (ML) 模型受益于在为 Amazon.com 构建、扩展和维护普遍可用的应用程序方面超过 20 年的运营经验。DevOps Guru 用于自动摄取并分析所有资源的延迟、错误率和请求率等指标,以建立正常的操作边界。然后,DevOps Guru 使用预先训练的机器学习 (ML) 模型来识别与既定基线的偏差。当它发现异常的应用程序行为,如延迟、错误率增加或可能导致潜在的中断或服务中断的资源约束时,它会向操作人员发出问题详细信息提示,如所涉及的资源、问题时间线和其他相关事件,以帮助他们快速了解问题的潜在影响和可能的原因。它还用于提供修复或减轻选项。然后,开发人员可以使用 DevOps Guru 的建议来在问题发生时减少问题的解决时间,提高应用程序的可用性和可靠性,而无需进行手动配置设置,也不需要机器学习 (ML) 专业知识。DevOps Guru 可以用作独立的服务,也可以与 PagerDuty 和 Atlassian 提供的合作伙伴应用程序以及 AWS System Manager 运营中心集成。
问:如何开始使用 Amazon DevOps Guru?
答:只需单击几下,即可在 AWS 管理控制台中启用 Amazon DevOps Guru。DevOps Guru 为您提供注册向导,帮助您快速配置 AWS 资源的分析覆盖范围。一旦启用,DevOps Guru 就会根据您的选择持续分析 AWS 资源的运营数据,并在检测到持续或紧急运营问题时生成洞察。
问:如何指定 AWS 资源供 DevOps Guru 分析?
答:您可以选择您的分析覆盖界限作为您的整个 AWS 账户,或者可以指定您希望 DevOps Guru 分析的特定 AWS CloudFormation 堆栈,或者使用 AWS 标签创建您希望 DevOps Guru 分析的资源组。DevOps Guru 将根据您的选择,在选定的覆盖界限内为所有支持的 AWS 资源分析操作数据。
当您添加新资源到您的覆盖界限选择时,DevOps Guru 自动开始分析附加资源。同样地,当您将任何资源从账户或 CloudFormation 堆栈中删除时,DevOps Guru 将停止对它们分析和计费。
问:Amazon DevOps Guru 可以检测什么类型的问题?
答:Amazon DevOps Guru 可以自动检测操作问题,如缺失或配置错误告警、资源耗尽提早警告、可能导致中断的代码和配置更改。DevOps Guru 使用机器学习(ML)将指标和日志中的异常与运营事件关联,并为您提供上下文洞察,以帮助您专注于正确的修复步骤。DevOps Guru 还关联并对相关的应用程序和基础设施指标(如 Web 应用程序延迟峰值、磁盘空间耗尽、错误代码部署或内存泄漏)进行分组,以减少假告警和冗余告警,从而使您能够专注于高度严重的问题。
问:Amazon DevOps Guru 可与哪些监控服务结合使用?
答:启动时,Amazon DevOps Guru 可以使用 Amazon CloudWatch、AWS Config、AWS System Manager OpsCenter、AWS CloudFormation 和 AWS X-Ray 中的数据。Amazon DevOps Guru 还与 Atlassian OpsGenie 和 Pager Duty 之类的合作伙伴操作监控和事故管理解决方案集成。
问:Amazon DevOps Guru 如何与其他相关的操作服务结合使用,例如 AWS Systems Manager OpsCenter?
答:如果您使用 AWS Systems Manager OpsCenter,则可以在 OpsCenter 控制面板内将 Amazon DevOps Guru 运营洞察直接显示为 OpsItems。
问:Amazon DevOps Guru 如何保护操作数据?
答:Amazon DevOps Guru 使用动态和静态加密在摄取和数据分析期间保护您的内容。
问:AWS 从何处获取训练数据来构建此服务?
答:我们的训练数据是由内部 AWS 服务和基础设施生成的。
运营洞察
问:什么是 Amazon DevOps Guru 运营洞察?
答:Amazon DevOps Guru 运营洞察在 DevOps Guru 控制台中直接聚合调查和修复操作问题所需的信息。洞察由三个主要部分组成。它突出显示与操作问题相关的异常指标和日志,并使用图表方便地可视化异常系统和应用程序行为。洞察还包括上下文信息,如相关事件、日志代码段,因此您可以很容易地理解范围和问题时间线。运营洞察还包括您可以采取哪些行动来修复问题的建议。
问:我是否能将 Amazon DevOps Guru 集成到我的现有票证/事故管理系统中?
答:您可以配置 Amazon DevOps Guru 来为其生成的每个洞察在 AWS Systems Manager OpsCenter 中创建 OpsItem。您还可以配置 DevOps Guru 来通过 AWS SNS 提供其洞察,对于后者,您可以在 PagerDuty 和 Atlassian 等事故管理工具中使用它。
问:启用服务后,我何时能看到运营洞察?
答:一旦启用,Amazon DevOps 将开始对应用程序设定基线时间,根据所分析的资源数量,基线时间可能从数分钟到一小时不等。设定基线时间后,DevOps Guru 将持续分析您的资源,并在发现异常行为时生成洞察。
DevOps Guru for RDS
问:什么是 Amazon DevOps Guru for RDS?
答:Amazon DevOps Guru for RDS 是 Amazon DevOps Guru 中一款基于机器学习 (ML) 技术的功能,用于自动检测并诊断数据库中的性能和操作问题,使开发人员能够在几分钟而不是几天内解决问题。DevOps Guru for RDS 扩展了 DevOps Guru 的现有功能,用于检测、诊断和解决 Amazon RDS 中的各种数据库相关问题(如资源过度利用和 SQL 查询的不当行为)。当问题发生时,Amazon DevOps Guru for RDS 会立即通知开发人员,并提供诊断信息、问题程度的详细信息和智能补救建议,以帮助客户快速解决数据库相关性能瓶颈和操作问题。
问:为什么应该使用 Amazon DevOps Guru for RDS?
答:Amazon DevOps Guru for RDS 用于消除人工工作,并缩短时间(从数小时、数天到数分钟),以此检测并解决关系数据库工作负载中难以发现的性能瓶颈。您可以为每个 Amazon Aurora 和 RDS for PostgreSQL 数据库启用 DevOps Guru for RDS,它将自动检测工作负载的性能问题,就每个问题向您发送提示,解释发现的结果,并提供解决措施建议。DevOps Guru for RDS 可帮助专家以外的人员更轻松地访问数据库管理,并协助数据库专家管理更多数据库。
问:Amazon DevOps Guru for RDS 的工作原理是什么?
答:Amazon DevOps Guru for RDS 会分析由 Amazon RDS 性能详情 (PI) 收集的遥测数据。DevOps Guru for RDS 在其分析中不使用任何存储在数据库中的数据。DevOps Guru for RDS 将规则和基于 ML 的技术结合使用,以查找 PI 遥测中存在问题的模式,并在检测到此类模式时向客户发出警报。
问:如何开始使用 Amazon DevOps Guru for RDS?
答:要开始使用,请在 Amazon RDS 控制台上打开“Amazon RDS 性能详情”,并导航到 Amazon DevOps Guru 控制台,以便为 Amazon Aurora 资源、其他受支持的资源或整个账户启用该服务。您还可以为 Amazon Aurora 数据库打开 Amazon DevOps Guru for RDS,同时在 Amazon RDS 控制台内创建或修改新数据库。此外,您还可以选择在“性能详情” (PI) 页面或数据库详情页面中启用 Amazon DevOps Guru for RDS。 通过 DevOps Guru,您可以选择分析覆盖范围为您的整个 AWS 账户,或者可以指定您希望 DevOps Guru 分析的特定 AWS CloudFormation 堆栈,或者使用 AWS 标签创建您希望 DevOps Guru 分析的资源组。
问:Amazon DevOps Guru for RDS 可以检测什么类型的问题?
答:Amazon DevOps Guru for RDS 用于识别可能影响应用程序服务质量的各种性能问题,例如锁定堆存、连接风暴、SQL 回归、CPU 和 I/O 争用、内存问题或参数配置错误。
问:Amazon DevOps Guru for RDS 与 Amazon RDS 性能详情有何不同?
答:Amazon RDS 性能详情是一项数据库性能优化和监控功能,可以收集并可视化 Amazon RDS 数据库性能指标,帮助您迅速评测数据库运行状况,并确定在何时、何处采取行动。Amazon DevOps Guru for RDS 可监控这些指标,检测您的数据库何时发生性能问题,分析这些指标,并告诉您发生哪些问题以及可以采取的措施。
DevOps Guru for Serverless
问:什么是 Amazon DevOps Guru for Serverless?
答:Amazon DevOps Guru for Serverless 是 Amazon DevOps Guru 中一个新的 ML 支持的功能,旨在自动检测和诊断使用 AWS 资源构建的无服务器应用程序的性能和操作问题。DevOps Guru for Serverless 扩展了 DevOps Guru 对无服务器应用程序的检测、诊断和建议修复(例如性能延迟降低、资源耗尽等)的能力。它提供了对影响应用程序的持续问题的响应性洞察,使您能够更快地解决它们。此外,它还提供了前瞻性洞察,以便可以及早标记应用程序和基础设施的潜在问题,使您能够更快地响应,减少停机时间并降低运营成本。
问:为什么应该使用 Amazon DevOps Guru for Serverless?
答:Amazon DevOps Guru for Serverless 使您能够监控无服务器应用程序的性能和操作问题。不需要手动设置、ML 专业知识或深度的无服务器专业知识。该服务旨在缩短检测和解决无服务器应用程序难以发现的可靠性、性能和操作问题的时间(从几小时缩短到几分钟)。DevOps Guru for Serverless 还可以尽早检测可能影响应用程序的潜在问题,使您能够在问题影响用户之前缓解问题。
问:适用于无服务器应用的 Amazon DevOps Guru 的工作原理是什么?
答:适用于无服务器应用的 Amazon DevOps Guru 自动摄取和分析无服务器应用程序的所有资源的指标和日志,以建立正常的操作边界,然后检测与已建立基线的偏差。当 DevOps Guru 确定应用程序处于异常状态时,它会向操作人员发出问题提醒,并提供相关的详细信息,如涉及的资源、问题时间线和相关事件,以帮助他们快速了解问题的潜在影响和可能的原因。它还用于提供修复或减轻选项。
问:如何开始使用 Amazon DevOps Guru for Serverless?
答:只需几次点击,您就可以通过在 AWS 账户上为您的无服务器应用程序启用 Amazon DevOps Guru 来开始监控您的无服务器应用程序。您可以将覆盖界限设置为您的整个 AWS 账户,或者可以指定特定 AWS CloudFormation 堆栈,或者使用 AWS 标签创建您希望 DevOps Guru 分析的资源组。
问:适用于无服务器应用的 Amazon DevOps Guru 可以检测什么类型的问题?
答:DevOps Guru for Serverless 使用机器学习(ML)将指标和日志中的异常与运营事件关联,并为您提供上下文洞察,以帮助您专注于正确的修复步骤。此外,DevOps Guru for Serverless 会及早发现潜在问题,以便您可以在它们影响您的应用程序之前患者它们。有三种类型的前瞻性洞察:
- 资源设置:Amazon DevOps Guru for Serverless 检测到应用程序具有未遵循 AWS 最佳实践的资源设置。例如,考虑一个带有 API 网关终端节点的基于 Lambda 的应用程序。Lambda 函数具有超出当前预置的函数并发的调用。这将导致请求的持续溢出,从而导致冷启动,进而导致延迟降低,成本可能更高。DevOps Guru 检测到此问题并主动建议提高 Lambda 函数预置的并发性。
- 资源耗尽:Amazon DevOps Guru for Serverless 根据应用程序使用趋势检测到某些资源有达到其极限的风险。例如,Elastic Search 节点发生较慢的内存泄漏,并且一直在稳步增长。DevOps Guru 检测到这一点,并预测内存将很快达到最大容量限制,因此它创建了一个前瞻性洞察,建议修复内存累积。
- 资源利用:Amazon DevOps Guru for Serverless 检测到应用程序有未充分利用的资源。例如,应用程序的 DynamoDB 预置的写容量单位大大超过实际消耗的容量。DevOps Guru 检测到此情况并建议扩展回 DynamoDB 的预置写容量。
问:前瞻性洞察与反应性洞察有何不同?
答:Amazon DevOps Guru for Serverless 对影响应用程序的持续问题——延迟降低、5xx 错误等——提供反应性洞察,使您能够快速解决它们。Amazon DevOps Guru for Serverless 提供前瞻性洞察,以便可以及早标记应用程序和基础设施的潜在问题,使您能快速响应并帮助减少昂贵的停机时间或运营成本。
定价与计费
问:Amazon DevOps Guru 的成本是多少?
答:使用 Amazon DevOps Guru,您只需按实际使用量付费。无需预先承诺,没有最低消费限制。您启用 DevOps Guru 并指定要监控的应用程序后,DevOps Guru 即开始分析这些应用程序所用的资源的操作数据。决定您账单的组成部分有两个:AWS 资源分析的费用和 DevOps Guru API 调用的费用。有关更多详细信息,请参阅我们的定价页面。
问:如何针对不同的资源类型对 AWS 资源分析小时定价?
答:DevOps Guru 分析的 AWS 资源类型( Amazon S3 存储桶、Amazon EC2 实例)将分类到两个定价组中。特定 AWS 资源类型的收费费率取决于价格组:A 或 B。
问:我是否要为我删除或不使用的资源付费?
答:否,您需要针对每个活动资源为所分析的 AWS 资源小时数付费。资源只有在一小时内产生指标、事件或日志条目才会变为活动状态。
问:DevOps Guru 分析支持哪些 AWS 资源?
答:DevOps Guru 分析超过 25 个不同的 AWS 资源类型(Amazon S3 存储桶、Amazon EC2 实例),对其他资源类型的支持即将推出。
问:我如何指定 Amazon DevOps Guru 应分析哪些 AWS 资源?
答:您要指定资源分析覆盖界限,而不是选择特定的 AWS 资源进行分析。DevOps Guru 将根据您的选择,在覆盖界限内为所有支持的 AWS 资源分析操作数据。您可以选择整个账户、特定 AWS CloudFormation 堆栈,或使用 AWS 标签创建您希望 DevOps Guru 分析的资源组,作为您的覆盖界限。当您添加新资源到您的覆盖界限(账户或 CloudFormation 堆栈)时,DevOps Guru 将自动开始分析附加资源。同样地,对于您从 DevOps Guru 正在分析的账户或 CloudFormation 堆栈中删除的任何资源,DevOps Guru 将停止对它们分析和计费。
问:我是否需要为 Amazon DevOps Guru for RDS 支付额外费用?
答:Amazon DevOps Guru for RDS 向客户免费提供,这是 DevOps Guru 向客户收取 RDS 资源现有价格的一部分。 DevOps Guru 将其评估的资源类型分为两组。组 A 包括 AWS Lambda 和 Amazon S3,组 B 包括 Amazon RDS、Amazon EC2、Amazon Redshift 集群和 25 个其他 AWS 资源类型。组 A 的定价为每种资源每小时 0.0028 USD (相当于 30 天内每种资源约 2 USD)。组 B 的定价为每种资源每小时 0.0042 USD (相当于 30 天内每种资源约 3 USD)。有关更多详细信息,请参阅我们的定价页面。
问:如何估算 DevOps Guru 的资源分析费用?
答:您可以使用 DevOps Guru 成本估算器工具确定资源分析费用。扫描您选择的资源以创建月度成本估计。成本估算器的默认设置假设分析的活动资源得到了 100% 的利用。您可以基于估计的使用量更改分析的每项服务的此百分比,以创建更新的月度成本估计。
问:除了 Amazon DevOps Guru 费用之外,我的 Amazon DevOps Guru 使用是否还存在任何其他费用?
答:如果您将 Amazon Simple Notification Service(SNS)配置为接收有关 DevOps Guru 事件的通知,您将按照标准的 Amazon SNS 定价支付额外的费用。同样地,如果您配置以接收 DevOps Guru 见解的 OpsItem,您将按标准的 AWS Systems Manager 定价支付额外的费用。
问:AWS Free Tier 是否提供 Amazon DevOps Guru?
答:是 AWS Free Tier 包括 DevOps Guru 每个月对资源组 A 和 B 各 7200 个 AWS 资源小时和 1 万次 DevOps Guru API 调用的使用量进行分析,持续 3 个月。
问:哪些 AWS 区域已推出 Amazon DevOps Guru?
答:Amazon DevOps Guru 现已在下列 AWS 区域推出:美国东部(弗吉尼亚州北部)、美国东部(俄亥俄州)、美国西部(北加利福尼亚)、美国西部(俄勒冈州)、加拿大(中部)、欧洲地区(法兰克福)、欧洲地区(爱尔兰)、欧洲地区(斯德哥尔摩)、欧洲地区(伦敦)、欧洲地区(巴黎)、亚太地区(孟买)、亚太地区(首尔)、南美洲(圣保罗)、亚太地区(新加坡)、亚太地区(悉尼)和亚太地区(东京)。其他区域即将推出。您还可以参阅 AWS 区域性服务列表。