AWS Systems Manager 功能

为什么选择 AWS Systems Manager?

借助 AWS Systems Manager,您可以跨多个账户和 AWS 区域安全地自动执行常见的重复性 IT 操作任务和管理任务。借助 Systems Manager Automation,您可以使用低代码可视化设计器编写自定义运行手册,也可以从 AWS 提供的 370 多份预定义运行手册中进行选择。您可以将 Python 或 PowerShell 脚本作为运行手册的一部分与其他自动化操作(例如批准、AWS API 调用或在您的 EC2 实例上运行命令)一起运行。这些运行手册可以安排到维护时段内,可以根据 AWS 以及多云和混合环境中的资源更改通过 Amazon CloudWatch Events 触发,也可以通过 AWS 管理控制台CLI软件开发工具包直接执行。自动化可以跟踪运行手册中每个步骤的执行情况,要求批准,以增量方式推出更改,并在出现错误的情况下自动停止推出。

Page Topics

一般性问题

一般性问题

AWS Systems Manager Explorer 是可自定义的控制面板,提供对 AWS 环境的运行状况和性能的关键见解和分析。Explorer 汇总来自各个 AWS 账户和 AWS 区域的运营数据,以帮助您确定优先级并确定可能需要采取的措施。

IT 服务管理(ITSM)工具(例如 Jira Service Desk),可与 AWS Systems Manager 连接,使 ITSM 平台用户能够更轻松地管理 AWS 资源。这些 AWS Service Management Connector 可让 Jira Service Desk 管理员管理和监控 AWS 产品。

OpsCenter 提供了一个中央站点,运维工程师和 IT 专业人员可以在该站点中查看、调查和解决与 AWS 以及多云和混合环境中的资源相关的运营问题。 OpsCenter 会将运营问题(称为 OpsItems)进行汇总和标准化,从而提供有助于诊断和修复的上下文相关数据。从事 OpsItem 工作的工程师可以访问以下信息:

  • 事件、资源和账户详细信息
  • 过去具有相似特征的 OpsItems
  • 相关的 AWS Config 更改
  • AWS CloudTrail 日志
  • Amazon CloudWatch 警报
  • 堆栈信息
  • 访问日志和指标的快速链接
  • Runbook 和推荐的 Runbook 列表
  • 通过 AWS 服务传递给 OpsCenter 的其他信息

此信息可帮助工程师更快地调查和修复运营问题。工程师可以通过 Systems Manager 控制台或 Systems Manager OpsCenter API 使用 OpsCenter 查看和解决问题。

AWS Systems Manager Incident Manager 能够让您更快地解决关键的应用程序可用性和性能问题。它可以通过自动响应计划将正确的人员和信息汇集在一起,从而帮助您为事件做好准备。借助 Incident Manager,当 Amazon CloudWatch 警报或 Amazon EventBridge 事件检测到严重问题时,您可以自动采取措施。Incident Manager 执行预先配置的响应计划,通过短信和电话与响应人员互动,使用 AWS Chatbot 关联指定的聊天渠道,并执行 AWS Systems Manager Automation Runbook。Incident Manager 根据 Amazon 的事件后分析模板通过建议事件发生后的操作项,诸如自动化 Runbook 步骤或添加新的警报,来帮助您提高服务的可靠性。要了解更多信息,请访问 Incident Manager 功能页面,要开始使用,请访问 Systems Manager 控制台

AWS Systems Manager Application Manager 可帮助您在应用程序上下文中调查和修复 AWS 以及多云和混合环境中的资源问题。借助 Application Manager,您可以发现和/或定义应用程序组件、在应用程序上下文中查看操作数据(例如,部署状态、Amazon CloudWatch 警报、资源配置和操作问题),并执行诸如修补和运行自动化运行手册之类的修复措施。这简化了应用程序的运维工作流程,无需使用不同的控制台来调查和修复操作问题。Application Manager 将显示数据和告警,并对 Amazon Elastic container Service(ECS)和 Amazon Elastic Kubernetes Service(EKS)环境中的现有容器集群执行操作。 此外,您还可以从 Application Manager 控制台内管理 AWS CloudFormation 模板和堆栈的整个生命周期。

AWS AppConfig 可帮您以托管和受监控的方式(与部署代码类似)部署应用程序配置,但无需在配置值更改时部署代码。AWS AppConfig 可根据您的基础设施进行扩展,因此您可以将配置部署到任意数量的 Amazon Elastic Compute Cloud (EC2) 实例、容器、AWS Lambda 函数、移动应用程序、IoT 设备或本地部署的实例中。AWS AppConfig 让您可以通过 API 或 AWS 管理控制台输入更改来更新配置。借助 AWS AppConfig,您可以在语义和语法上验证这些更改,确保配置符合其各自应用程序的预期,从而帮助您预防潜在的服务中断。您可以使用与代码部署类似的最佳实践来部署应用程序配置,包括分段交付、监控告警,以及在发生错误时回滚更改。 要了解更多信息,请访问 AWS AppConfig 功能页面

AWS Systems Manager 提供一个集中式存储来管理配置数据,支持数据库字符串等纯文本数据或密码等保密数据。这让您能够将保密数据和配置数据与代码分开。您可以标记参数并将其整理成不同的层级,这有助于您更轻松地管理参数。例如,您可以将同一参数名称 (“db-string”) 与不同的层级路径 (“dev/db-string”或“prod/db-string”) 结合使用,用于存储不同的值。Systems Manager 与 AWS Key Management Service(KMS)集成,让您可以自动加密存储的数据。此外,您还可以使用 AWS Identity and Access Management(IAM)控制用户和资源对参数的访问权限。 可以通过 Amazon ECSAWS LambdaAWS CloudFormation 等其他 AWS 服务引用参数。

AWS Systems Manager Change Manager 简化了请求、批准、实现和报告对 AWS 和本地部署的应用程序配置和基础设施的操作更改的方式。凭借 Change Manager,您可以使用预先批准的变更工作流,以免在进行操作更改时出现意外结果。Change Manager 可以帮助您检测与重要业务事件的计划冲突,并自动通知受影响的审批人,从而帮助您安全实施更改。您可以使用 Change Manager 的变更报告来监控进展,并审计整个组织内的操作变更,从而提高可见性和问责能力。

借助 AWS Systems Manager,您可以跨多个账户和 AWS 区域安全地自动执行常见的重复性 IT 操作任务和管理任务。借助 Systems Manager Automation,您可以使用低代码可视化设计器编写自定义运行手册,也可以从 AWS 提供的 370 多份预定义运行手册中进行选择。您可以将 Python 或 PowerShell 脚本作为运行手册的一部分与其他自动化操作(例如批准、AWS API 调用或在您的 EC2 实例上运行命令)一起运行。这些运行手册可以安排到维护时段内,可以根据 AWS 以及多云和混合环境中的资源更改通过 Amazon CloudWatch Events 触发,也可以通过 AWS 管理控制台CLI软件开发工具包直接执行。自动化可以跟踪运行手册中每个步骤的执行情况,要求批准,以增量方式推出更改,并在出现错误的情况下自动停止推出。

借助 AWS Systems Manager,您可以计划跨实例运行管理任务和维护任务的时间段。这可以确保您选择一个方便而安全的时间来安装补丁和更新或进行其他配置更改,从而提高服务和应用程序的可用性和可靠性。

AWS Systems Manager Fleet Manager 简化了服务器和边缘设备的远程管理流程。使用 Fleet Manager,您可以在云端或本地管理和排除在云端运行的机群故障,从而节省时间和金钱,而无需远程连接它们。您可以从控制台深入到各个节点(服务、设备或其他资源),执行常见的系统管理任务,如磁盘和文件浏览、日志管理、Windows 注册表操作和用户管理。 在紧急情况下,您可以从控制台快速获得对实例的安全外壳、CLI 和基于控制台的远程桌面协议(RDP)访问,以更快地响应问题。

AWS Systems Manager 可以通过控制面板自动汇总并显示每个资源组的操作数据。借助 Systems Manager,您无需在多个 AWS 控制台之间跳转就可以查看操作数据。借助 Systems Manager,您可以通过 AWS CloudTrail 查看 API 调用日志,可以通过 AWS Config 查看资源配置更改,还可以按资源组查看软件清单和补丁合规性状态。还可以将 AWS CloudWatch 控制面板、AWS Trusted Advisor 通知、AWS Personal Health Dashboard 性能和可用性提醒集成到 Systems Manager 控制面板中。Systems Manager 可以集中所有相关运营数据,让您清楚了解基础设施的合规性和性能。

AWS Systems Manager 可以收集有关实例及实例上安装的软件的信息,从而帮助您了解自己的系统配置和安装的应用程序。您可以收集应用程序、文件、网络配置、Windows 服务、注册表、服务器角色、更新和任何其他系统属性的相关数据。利用收集的数据,您可以管理应用程序资产、跟踪许可证、监控文件完整性、发现不是由传统安装程序安装的应用程序等。

AWS Systems Manager 提供基于浏览器的交互式外壳、CLI 和基于浏览器的远程桌面访问来管理云端,或本地部署和边缘设备上的实例,而无需打开入站端口、管理 Secure Shell (SSH) 密钥或使用防御主机。管理员可以使用 AWS Identity and Access Management(IAM)策略,在一个集中位置授予和撤销对实例的访问权限。这让您可以控制哪些用户可以访问每个实例,包括为指定用户提供非根访问权限的选项。提供访问权限后,您可以使用 AWS CloudTrail 审计哪个用户访问了实例,并将每个命令记录到 Amazon Simple Storage Service(S3)或 Amazon CloudWatch Logs 中。

借助 AWS Systems Manager,您能够以安全可靠的方式大规模远程管理实例,无需登录服务器,也无需使用堡垒主机、SSH 或远程 PowerShell。通过它,您可以跨实例组轻松自动执行常见管理任务,例如注册表编辑、用户管理以及软件和补丁安装。通过与 AWS Identity and Access Management(IAM)集成,您可以应用精细权限来控制用户可以对实例执行的操作。AWS CloudTrail 会记录 Systems Manager 执行的所有操作,便于您审计自己环境中出现的更改。

AWS Systems Manager 提供配置管理功能,可以帮助您保持 Amazon EC2 或本地实例的配置一致性。借助 Systems Manager,您可以控制服务器配置、防病毒定义、防火墙设置等配置详细信息。您可以通过 AWS 管理控制台、现有脚本、PowerShell 模块或者直接来自 GitHub 或 Amazon S3 存储桶的 Ansible 运行手册为服务器定义配置策略。Systems Manager 可以按照您定义的时间和频率自动跨实例应用配置。您可以随时查询 Systems Manager 以便查看实例配置的状态,从而根据需要了解合规性状态。

AWS Systems Manager 可以帮助您在大量云端或本地部署的实例中自动选择并部署操作系统和软件补丁。通过补丁基准,您可以设置规则以便自动批准安装选定类别的补丁(例如操作系统补丁或高严重性补丁),指定哪些补丁可以忽略这些规则并自动批准或拒绝。此外,您还可以为补丁安排维护时段,让补丁只在预设的时段内应用。Systems Manager 有助于确保您的软件处于最新状态并符合合规性策略。

AWS Systems Manager 可帮助您安全地分发和安装软件包,例如软件代理。利用 Systems Manager Distributor,您可以在掌握版本控制的同时集中存储并系统地分发软件包。您可以使用 Distributor 创建和分发软件包,然后使用 Systems Manager Run Command 和 State Manager 安装这些软件包。Distributor 还可使用 IAM 策略来控制可以在您的账户中创建或更新软件包的人员。您可以对 Systems Manager Run Command 和 State Manager 使用现有 IAM 策略支持,来确定可以在您的主机上安装软件包的人员。