免费试用 Amazon CloudSearch

开始免费试用 CloudSearch
了解更多

获取 30 天免费试用全功能搜索实例 750 小时的使用时间。要开始试用,请执行以下操作:

登录您的 AWS 账户并启动 CloudSearch 控制台

只需单击几次便可创建和配置一个搜索域

通过控制台、AWS 开发工具包或 CLI 上传数据并发送搜索/更新请求


问:什么是 Amazon CloudSearch?

在 AWS 云中,Amazon CloudSearch 是一款完全托管的服务,可让您轻松地为网站或应用程序设置、管理或扩展搜索解决方案。

问:比起在 EC2 上运行自己的搜索服务,运行 Amazon CloudSearch 之类的托管搜索服务有什么优势?

 

与运行您的自管搜索服务相比,Amazon CloudSearch 提供了多个优势,包括配置简单、根据数据和流量进行自动扩展、自恢复集群、高可用性(通过多可用区实现)。您只需在 AWS 管理控制台中单击几下,即可创建一个搜索域,并上传您希望能搜索的数据,Amazon CloudSearch 会自动预配置所需的资源,并部署一个高度优化的搜索索引。

问:什么是搜索引擎?

通过搜索引擎,用户可以搜索主要采用文本形式的数据项目(称为文档)的大型集合,以快速查找最匹配结果。搜索请求通常是由非结构化文本组成的几个词,例如“马特达蒙电影”。返回的结果通常是按序排列的,最匹配或最相关的结果列在最前面(它们与搜索词的关系最密切)。

文档可以是完全非结构化的,也可以包含能够单独搜索的多个字段。例如,电影搜索服务的文档可能包含片名、导演、演员、介绍和评论等字段。搜索引擎返回的结果通常是底层文档的代理,例如引用特定网页的 URL。但是,搜索服务也可以返回各个字段的实际内容。

问:Amazon CloudSearch 可带来哪些好处?

Amazon CloudSearch 是一种完全托管的搜索服务,可根据数据容量和搜索请求复杂性而自动扩展,以交付快速、准确的结果。Amazon CloudSearch 让客户能够增加搜索功能,而无需管理主机、流量和数据扩展、冗余或软件包。用户只需为消耗的资源支付较低的小时费率。与运行和管理您自己的搜索环境相比,Amazon CloudSearch 的总拥有成本显著降低。

问:Amazon CloudSearch 是否可与存储服务结合使用?

搜索服务和存储服务互为补充。搜索服务要求您的文档已经存储在某个位置,无论它是在文件系统的文件中,还是在 Amazon S3 的数据中,亦或是在 Amazon DynamoDB 或 Amazon RDS 实例的记录中。搜索服务是一个快速检索系统,通过名为索引的过程,让用户能够搜索这些项目,而只产生次秒级的延迟。

问:Amazon CloudSearch 是否可与数据库结合使用?

搜索引擎和数据库并不是相互排斥的 – 事实上,它们通常结合使用。如果您已经有了一个包含结构化数据的数据库,则您可能希望借助搜索引擎,利用搜索关键字作为相关性标准,通过智能化方式对数据库内容进行筛选和排名。

搜索服务可用于索引和搜索结构化数据和非结构化数据。搜索内容可以来自多个来源,还可以包括数据库字段,以及各种格式的文件、网页等。搜索服务能够支持可自定义的结果排名,还支持在数据库中不可用的特殊搜索功能,例如使用分面进行筛选。

问:Amazon CloudSearch 在哪些区域提供?

Amazon CloudSearch 目前在以下 AWS 区域提供:美国东部(弗吉尼亚北部)、美国西部(俄勒冈)、美国西部(加利福尼亚北部)、欧洲(爱尔兰)、欧洲(法兰克福)、南美洲(圣保罗)和亚太地区(新加坡、东京、悉尼和首尔)。


问:最新的 CloudSearch 实例类型是什么?

2021 年 1 月,我们推出了新的 CloudSearch 实例类型来替换旧的实例。最新的 CloudSearch 实例为 search.small、search.medium、search.large、search.xlarge 和 search.2xlarge,它们是现有实例的一对一替换产品;例如,search.small 替换 search.m1.small。新实例利用下面的最新一代 EC2 实例类型,因此以相同的价格提供了更好的可用性和性能。

问:如何将域更新为新实例?

我们将自动将您的域无缝过渡到新实例。您无需执行任何操作。我们将在接下来的几周内逐步进行此迁移,从 2013 版 CloudSearch 上的域开始。您的域更新为新的实例类型后,您将在控制台上看到通知。您新创建的任何域都将自动开始使用新实例。如果您对迁移有任何疑问,请联系 AWS Support。

问:新实例会产生额外费用吗?

不会。这些实例的价格与您先前或当前使用的实例相同,并具有更好的可用性和性能。

问:我的域正在运行上一代 CloudSearch 实例,例如 search.m2.2xlarge。我的域会迁移吗?

会,您的域将在迁移的后续阶段中迁移到等效的新实例。例如,search.m2.2xlarge 将更新为 search.previousgeneration.2xlarge。这些实例的价格与现有实例相同,并可为您的域提供更好的稳定性。


问:Amazon CloudSearch 支持哪些新功能?

通过此最新发布版本,Amazon CloudSearch 支持多项新的搜索和管理功能。主要新功能包括:

  • 语言支持:
    • 34 种语言,另外还有可处理混合语言字段的“多语言”选项
    • 各字段语言配置
    • 特定语言文本分析
    • 多级算法词干提取,可用于多种语言,包括“无”
  • 增强的搜索功能:
    • 建议
    • 突出显示
    • 地理空间搜索
    • 新的数据类型:date 型、double 型、64 位带符号 int 型以及 latlon 型
    • 模糊的短语搜索
    • 增加术语相关度
    • 增强范围搜索(所有字段类型)
    • 多查询解析支持:简单、结构化的、lucene、dismax
    • 查询解析配置选项
  • 管理功能:
    • 高可用性选项
    • IAM 集成
    • 用户可配置扩展
  • 在其他 AWS 区域提供:亚太地区(东京)、亚太地区(新加坡)、亚太地区(悉尼)、亚太地区(首尔)和南美洲(圣保罗)

问:Amazon CloudSearch 是否仍然可以支持字典词干提取?

是。除了算法词干提取外,新版的 Amazon CloudSearch 还支持字典词干提取。

问:新版 Amazon CloudSearch 是否使用 Apache Solr?

是。最新版 Amazon CloudSearch 已进行修改,以便能将 Apache Solr 用作基础的文本搜索引擎。除了能够让设置、操作和扩展搜索域变得简单的托管搜索服务体验外,Amazon CloudSearch 现在还提供可通过 Apache Solr 使用的几个热门搜索引擎功能。

问:我是否可以通过控制台访问新版 Amazon CloudSearch?

可以。您可以通过控制台访问新版 Amazon CloudSearch。如果您当前是 Amazon CloudSearch 客户并且拥有搜索域,那么当您创建新的搜索域时,可以选择使用哪个版本的 Amazon CloudSearch。默认情况下,新客户将使用新版 Amazon CloudSearch 且不能访问 2011-01-01 版本。

问:新版 Amazon CloudSearch 支持哪些数据类型?

Amazon CloudSearch 支持两种类型的文本字段:text 和 literal。text 字段根据为该字段配置的语言进行处理,从而确定可用作查询匹配的单个单词。literal 字段不要处理,且必须准确匹配,包括大小写。CloudSearch 还支持四种数值类型:int、double、date 和 latlon。int 字段容纳 64 位带符号的整数值。double 字段容纳双宽度浮点值。date 字段具有根据 IETF RFC3339: yyyy-mm-ddT00:00:00Z 指定的 UTC(协调通用时间)日期。LatLon 字段包含存储为经纬度值对的位置。

问:我的现有搜索域是使用 2011-02-01 版 Amazon CloudSearch 创建的,能否继续使用?

能。使用 2011-02-01 版 Amazon CloudSearch 创建的现有搜索域可以继续使用。

问:我能否在使用 2011-01-01 版 Amazon CloudSearch 创建的现有搜索域上使用新功能?

不能。使用 2011-01-01 版 Amazon CloudSearch 创建的现有搜索域不能访问新版本提供的功能。如需使用新功能,您必须使用 2013-01-01 版 Amazon CloudSearch 创建新搜索域。

问:如何将使用 2011-01-01 版 Amazon CloudSearch 构建的应用程序迁移到新版 Amazon CloudSearch 中?

如需使用新版 Amazon CloudSearch,您需要使用新版 Amazon CloudSearch 重新创建现有域并重新上传数据。有关更多信息,请参阅 Amazon CloudSearch 开发人员指南中的迁移到 2013-01-01 API

 

 

问:AWS 是否继续支持 2011-02-01 版 Amazon CloudSearch?

是。AWS 会继续支持 2011-02-01 版 Amazon CloudSearch。

 

问:我是否可以使用 2011-02-01 版 Amazon CloudSearch 创建新的搜索域?

当前拥有现有 2011-02-01 域的 Amazon CloudSearch 客户可以选择他们的新域是使用 2011-02-01 API 还是新的 2013-01-01 API。新客户创建的搜索域将自动使用 2013-01-01 API。

问:是否可以获得包含新版 Amazon CloudSearch 的免费试用优惠?

新客户仍然可以获得 Amazon CloudSearch 的免费试用优惠。要了解详细信息,请参阅 Amazon CloudSearch 免费试用页面。


问:如何开始使用 Amazon CloudSearch?

要注册 Amazon CloudSearch,请单击 Amazon CloudSearch 详细信息页面上的 Create Free Account(创建免费账户)按钮并完成注册过程。您必须拥有 Amazon Web Services 账户。如果还没有账户,在您开始 Amazon CloudSearch 注册过程时,系统将会提示您创建 AWS 账户。

注册后,请从 AWS 管理控制台选择 Amazon CloudSearch。使用 Amazon CloudSearch 控制台,您可以快速创建搜索域、配置搜索字段、上传示例数据,并将搜索查询发送至搜索域。您还可以使用 AWS 开发工具包和 CLI 来执行这些操作。

有关更多信息,请参阅 Amazon CloudSearch 开发人员指南中的入门教程。

问:AWS 开发工具包是否支持 Amazon CloudSearch?

是,适用于 Java、Ruby、Python、.Net、PHP 和 Node.js 的 AWS 开发工具包都支持 CloudSearch。使用 AWS 开发工具包,您可以快速创建搜索域、配置搜索字段、上传数据,并将搜索查询发送至搜索域。

问:AWS CLI 是否支持 Amazon CloudSearch?

是,AWS CLI 支持 CloudSearch。使用 Amazon CLI,您可以快速创建搜索域、配置搜索字段、上传数据,并将搜索查询发送至搜索域。

问:我可以继续使用 Amazon CloudSearch CLT 吗?

可以,Amazon CloudSearch CLT 依然有效。


问:什么是搜索域?如何创建搜索域?

搜索域是一个数据容器和一系列服务,可将数据变成可搜索数据。这些服务包括:

  • 文档服务,让您能够将数据上传至搜索域以便进行索引。
  • 搜索服务,让您能够针对您索引的数据来执行搜索请求。
  • 配置服务,用于控制搜索域的行为(包括相关性排名)。

您可以使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI 来创建、管理和删除搜索域。

问:如何将文档上传到搜索域?

通过使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI 可以将文档上传到域中。

问:我的文档必须是特定格式的吗?

为使您的数据可以被搜索到,您需要将数据转换为 JSON 或 XML 格式。  您希望能够作为搜索结果收到的每个项目都表示为一个文档。每个文档具有唯一文档 ID 以及一个或多个字段,其中包含您希望搜索并在结果中返回的数据。Amazon CloudSearch 会根据为该域配置的索引字段,从您的文档数据生成搜索索引。随着您的数据更改,您需要提交更新,以便将文档添加到索引中或从索引中删除。

问:我如何创建格式适用于 Amazon CloudSearch 的文档批处理?

要创建描述您的数据的文档批处理,您可以创建指定以下信息的 JSON 或 XML 文本文件:

  • 操作类型:添加或删除
  • 唯一标识符
  • 实际字段及其数据

以下示例显示了一个 JSON 格式的文档批处理:

[
    {
       "fields" : {
         "directors" : [
             "Francis Lawrence"
          ],
          "release_date" : "2013-11-11T00:00:00Z",
          "genres" : [
             "Action",
             "Adventure",
             "Sci-Fi",
             "Thriller"
          ],
          "image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
          "plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
          "title" : "The Hunger Games: Catching Fire",
          "rank" : 4,
          "running_time_secs" : 8760,
          "actors" : [
             "Jennifer Lawrence",
             "Josh Hutcherson",
             "Liam Hemsworth"
           ],
          "year" : 2013
       },
       "id" : "tt1951264",
       "type" : "add"
    }
]

 

请注意,数值(例如年份)没有括在引号中,多值字段(例如类型)中的值在 JSON 数组中列出。

要让数据在 Amazon CloudSearch 中可用,您可以将其保存为文件,然后使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI 进行上传。

问:如何为我的文档建立索引?

当您将文档上传到搜索域时,将会自动建立索引。当您进行配置更改时,您也可以通过发送 IndexDocuments 请求,显式地为文档重新建立索引。

问:何时需要为我的域重新建立索引?

在为域重新建立索引之前,某些配置选项(例如添加新索引字段或更新词干提取或非索引字字典)是不可用的。如果您所做的更改需要索引,则域的状态将指示需要为其建立索引。您可以从 AWS 管理控制台、AWS 开发工具包或 AWS CLI 开始进行索引。

问:如何向搜索域发送搜索请求?

每个搜索域都提供基于 REST 的搜索服务,该服务具有一个唯一的 URL(搜索终端节点),接受对其文档集的搜索请求。您可以从 AWS 管理控制台、AWS 开发工具包或 AWS CLI 发送搜索请求。

问:搜索域可以横跨多个可用区吗?

可以。如果您启用了多可用区选项,则 Amazon CloudSearch 可在同一区域中的第二个可用区内部署额外实例。有关更多信息,请参阅 Amazon CloudSearch 开发人员指南中的配置可用性选项部分。

问:是否可以将搜索域从一个区域转移到另一个区域?

当前,无法自动将搜索域从一个区域迁移到另一个区域。您需要在目标区域创建一个新域、配置此域并上传数据,然后删除原始域。

问:如何删除搜索域?

要删除一个搜索域,请单击 Amazon CloudSearch 控制台中的“Delete Domain”(删除域)按钮。您还可以通过 AWS 开发工具包或 AWS CLI 删除域。

问:如何将文档从搜索域中删除?

要删除文档,可以在包含要删除文档的 ID 的批量上传中指定一个删除操作。

您可以通过 AWS 管理控制台、AWS 开发工具包或 AWS CLI 提交数据更新。

问:如何清空搜索域?

如果希望保持域的终端节点,可以针对域中每个文档发送删除请求。

问:为什么我的域处在“Processing”状态?

域可能有三种不同状态:“processing”、“active”或“reindexing”。 正常情况下域应该为“active”状态,该状态表示目前没有做出任何变更,该域可以查询和更新,所有之前所做的变更现在可以在搜索结果中看到。

当域需要重新索引时,Amazon CloudSearch 需要彻底重建索引。但是,在您开始重新索引前,域不会进入“processing”状态。在此阶段中,仍可以对域进行查询和更新,但是配置变更在索引结束前不会显示在搜索结果中,域的状态会变回“active”。

您还可以继续将成批文档上传到您的域。但是,如果您在域为“processing”状态时提交了大量更新,则将更新应用到搜索索引的时间将会增加。如果这对您造成了困扰,请将更新率调低,直至域返回到“active”状态。


问:将数据引导启动到 CloudSearch 中的最佳实践是什么?

将域启动后,下一步操作是将数据加载到 Amazon CloudSearch 中。您可能需要上传一个大型单一数据集,然后当新数据进来时进行小规模的更新或添加。下面的指南将帮助您将第一批数据快速轻松地引导启动到 CloudSearch 中。

1.准备脚本时请使用 curl-v 命令行工具

在数据集上传的过程中,您编写的脚本会读取您的数据并将其用于创建 JSON 或 XML 文档。我们建议您提前将这个脚本准备好,并使用 curl 或其他简单的命令行工具进行查看,确认您是否可以上传脚本创建的文档。curl 中的“-v”选项通常可以提供比 AWS 开发工具包或 Boto(这两种工具都会出于生产目的抑制错误)更为详尽的语法问题相关信息。curl 能够显示更加详细的错误消息,有助于发现问题的源头。

2.使用 UTF-8 字符代码

确保所有数据都采用 UTF-8 字符代码格式进行过格式化,任何错误的 Unicode 字符会在上传到 CloudSearch 之前被删除。非法字符将导致文档上传失败。

3.批量处理文档

批量处理文档大概是数据引导启动中最重要的环节了。将文档逐一提交到 CloudSearch 效率不佳,还可能引起本可避免的错误。

文档批处理只是一系列添加和删除操作,这些操作代表了您希望在您的域中添加、更新或删除的文档。批处理用 JSON 或 XML 表示,当您将其上传到域时,数据会根据域的索引选项自动进行索引。因为计费的标准是上传到搜索域的文档批处理的总数,因此将数据以 5MB 大小(上传允许的最大值)的批次进行上传比较符合成本效益。您也可以并行上传多个批处理,以减少上传数据所花费的时间。

4.预扩展

将数据上传到 CloudSearch 之前对其进行预扩展也是一项重要的工作。预扩展包括针对需要上传的数据量选择合适的实例类型。

选择一种容量够用的实例来处理上传数据的大小,可以避免出现错误和较高的复制计数。虽然复制可以帮助减少搜索响应时间,但是并不能增加数据管道的大小,也无法解决数据上传中出现的核心问题。

当您发送的数据变多时,CloudSearch 可以自动调整规模,使用更大的实例。但是预先选择合适的实例类型仍能够在后续的引导启动流程中节省时间,因为从一个实例扩展到另一个通常是比较缓慢的过程。下方是一个示例脚本,对域进行预扩展以用于引导启动,并在数据加载后还原实例类型。

在引导启动前进行预扩展:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge

 

aws cloudsearch index-documents --domain-name foo

在数据加载后进行还原:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small

 

aws cloudsearch index-documents --domain-name foo

问:哪些方法可以避免 504 错误的出现?

如果您看到 504 错误或者较高的复制计数,可以尝试使用更大型的实例类型。例如,要是使用 m3.large 有问题,就去使用 m3.xlarge。如果您在预扩展之后还是存在 504 错误,可以批量处理数据并延长每次重试之后的延迟时间。

问:加快域配置和重建索引速度的最佳实践有哪些?

当您改变搜索域的配置选项后,必须重建搜索索引,以便让所做的改变在搜索结果中生效。重建索引可能需要 30 到 60 分钟,不论您一次做出几项配置更改,时间不会有太大出入。即使您的域只有数量不多的文档,重建索引也要花差不多一样的时间,因为需要进行必要的处理和调配才能构建索引并对其进行分配。因此,您应该提前对配置变更进行计划,一次完成所有的变更内容,然后对域进行索引重建。这样的方法同样适用于新域的建立,建立新域前先对配置进行计划,这样就只需要进行一次索引,以最短的时间准备就绪开始运行。

有些域的变更还需要重建索引,而有些则只需要重新部署现有的索引即可。重新部署域需要 10 到 15 分钟时间,而重建索引需要 30 到 60 分钟时间。重新部署过程中,CloudSearch 会创建新的节点,在这些节点上面部署索引,并关闭旧的节点。重新部署进行过程中,域的状态会变成“Processing”。如果需要重建索引,域的状态会变成“Needs Indexing”,然后在索引开始编制后再变成“Processing”。新的索引创建完成后,域就重新部署完成了。下表总结了哪些变更需要先重建索引再重新部署,哪些只需要重新部署。了解这一点可以帮助您更好地计划配置的变更。

变更                                         
需要重建索引
需要重新部署
多可用区

索引字段



索引字段选项


实例类型


分区计数


复制计数


建议索引


表达式


分析计划


问:Amazon CloudSearch 提供哪些搜索功能?

Amazon CloudSearch 提供用于索引和搜索结构化数据和纯文本的多种功能,包括分面搜索、自由文本搜索、布尔搜索表达式、可自定义相关性排名、查询时间排名表达式、字段权重、使用任何字段对结果进行搜索和排序,以及文本处理选项,包括词汇切分、非索引字、词干提取和同义词。它还提供针对文档更新的近乎实时的索引。新功能包括:

  • 自动完成建议
  • 突出显示
  • 地理空间搜索
  • 新的数据类型:date 型、double 型、64 位带符号 int 型以及 latlon 型
  • 动态字段
  • 索引字段统计
  • 模糊的短语搜索
  • 增加术语相关度
  • 增强范围搜索(所有字段类型)
  • 不影响相关性的搜索筛选条件
  • 多查询解析支持:简单、结构化的、lucene、dismax
  • 查询解析配置选项

问:什么是分面?

通过分面,您可将搜索结果分类为细化结果,让用户基于该结果执行进一步搜索。例如,用户可能搜索“伞”,通过分面,您可以按价格对搜索结果进行分组,例如 0-10 USD、10 USD-20 USD、20 USD-40 USD 等。Amazon CloudSearch 还允许在分面中包括一个结果计数,因而每个细化结果具有本组中的文档数量计数。例如:0-10 USD(4 个项目)、10 USD-20 USD(123 个项目)、20 USD-40 USD(57 个项目)等。

问:Amazon CloudSearch 支持哪些语言?

Amazon CloudSearch 目前支持 34 种语言:阿拉伯语 (ar)、亚美尼亚语 (hy)、巴斯克语 (eu)、保加利亚语 (bg)、加泰罗尼亚语 (ca)、简体中文 (zh-Simp)、繁体中文 (zh-Trad)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、芬兰语 (fi)、法语 (fr)、加里西亚语 (gl)、德语 (de)、希腊语 (el)、希伯来语 (he)、北印度语 (hi)、匈牙利语 (hu)、印度尼西亚语 (id)、爱尔兰语 (ga)、意大利语 (it)、日语 (ja)、韩语 (ko)、拉脱维亚语 (la)、挪威语 (no)、波斯语 (fa)、葡萄牙语 (pt)、罗马尼亚语 (ro)、俄语 (ru)、西班牙语 (es)、瑞典语 (sv)、泰语 (th) 和土耳其语 (tr)。此外,Amazon CloudSearch 还支持多语言 (mul) 选项,用于含有混合语言的字段。

问:Amazon CloudSearch 是否支持地理空间搜索?

是,Amazon CloudSearch 有一种支持纬度和经度 (latlon) 的原生类型,以便您可以轻松执行基于地理空间的搜索和排序。有关更多信息,请参阅 Amazon CloudSearch 开发人员指南中的按地理位置搜索结果并进行排名部分。


问:我上传的文档需要多长时间变成可搜索文档?

上传到搜索域的文档通常可在几秒钟至几分钟之内变成可搜索文档。

问:我可以向搜索域发出多少个搜索请求?

对于可以向搜索域发出的搜索请求数量,并不存在固有限制。

问:哪些因素会影响搜索请求的延迟?

您的搜索请求通常可在几百毫秒之内得到处理,而且速度通常更快。延迟受到诸多因素的影响,包括请求和响应在您自己的应用程序和搜索域之间传输花费的时间、搜索请求的复杂性以及您对搜索域的使用程度。

问:哪些因素导致某些搜索请求比其他请求更加复杂?

Amazon CloudSearch 可以非常快速地高效处理大量搜索请求。各个搜索请求的复杂性都不相同,取决于确定哪些文档匹配的表达式和确定各个文档的匹配程度的其他标准。匹配大量文档的搜索请求所需的处理时间,长于匹配少量文档的搜索请求。计算复杂表达式的搜索请求所需的处理时间,长于使用简单标准(例如单个字段)进行排名的搜索请求。为了帮助您了解搜索请求之间的复杂性差异,系统会在响应中返回处理每个请求所花费的时间。

问:我应该在哪里运行我的搜索应用程序,以最大程度缩短与搜索域的通信时间?

将应用程序托管在搜索域所在的 AWS 区域将让您体验到最快的通信速度、最短的通信时间。


问:什么是搜索实例?

一个搜索实例是中的单个搜索引擎,可以索引文档并响应搜索请求。它拥有有限的 RAM 和 CPU 资源,用于索引数据和处理请求。

问:什么是搜索分区?

搜索分区是由单个搜索实例处理的一部分数据。一个搜索域可能有一个或多个搜索分区,当您索引文档时,搜索分区的数量可能会发生变化。

问:我的搜索域如何扩展以满足我的应用程序需求?

搜索域可在两个方面进行扩展:数据和流量。随着您的数据容量增长,您需要更多(或更大)的搜索实例以包含您的索引数据,而且您的索引将在多个搜索实例中分区。随着您的请求量或请求复杂性增加,每个搜索分区必须进行复制,以便为该搜索分区提供更多 CPU 容量。例如,如果您的数据需要三个搜索分区,则在您的搜索域中将有 3 个搜索实例。随着您的流量超出单个搜索实例的容量,每个分区将进行复制,以提供更多 CPU 容量,为您的搜索域添加另外三个搜索实例。流量进一步增加将导致更多复制,每个搜索分区最多可以复制 5 个。

问:我可以将多少数据上传到搜索域?

您需要的分区数量取决于您的数据和配置,因此您可以上传的最大数据量是在您应用搜索配置时会导致产生 10 个搜索分区的数据集。当您超出数据分区限制时,您的搜索域将停止接收上传,直至您删除文档或重新索引您的搜索域。如果您需要 10 个以上的搜索分区,请联系我们

问:我需要为搜索域选择搜索实例的数量和类型吗?

CloudSearch 是一种完全托管的搜索服务,可自动扩展您的搜索域,并选择搜索实例的数量和类型。特定搜索域中的所有搜索实例都属于同一种类型,随着您的数据或流量增加,此类型可能变化。

您还可以配置 Amazon CloudSearch 域的扩展选项,从而:

  • 提升上传容量
  • 加速搜索请求
  • 提升搜索容量
  • 改进容错能力

问:Amazon CloudSearch 支持哪些实例类型?

Amazon CloudSearch 支持以下实例类型:

  • 小型搜索实例
  • 大型搜索实例
  • 超大型搜索实例
  • 双倍超大型搜索实例

问:我可以怎样了解到我搜索域中搜索实例的数量和类型?

通过使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI,可以了解搜索域中搜索实例的数量和类型。搜索实例的数量和类型随着时间推移而变化,根据您的可索引数据和搜索流量而自动扩展。

问:我的搜索域能够以多快速度进行扩展,以适应数据和流量的变化?

搜索域通常在几分钟之内对流量增加做出反应。数据量变化或流量减小可能需要更长时间,但您可以通过调用 IndexDocuments 操作来加速这一过程。如果您正要上传大量数据或者预计查询流量将有一次猛增,可以通过设置所需的实例类型和复制计数预扩展您的域。有关更多信息,请参阅 Amazon CloudSearch 开发人员指南中的配置扩展选项部分。

问:Amazon CloudSearch 支持多可用区部署吗?

支持。Amazon CloudSearch 支持多可用区部署。启用了多可用区选项后,Amazon CloudSearch 在第二个可用区内为您的搜索域预置和维护额外实例,以确保高可用性。更新会自动应用到两个可用区中的实例。搜索流量在所有实例间分配,并且,在出现故障时,各区域中的实例都能够处理所有负载。

问:新的多可用区功能如何发挥作用? 我的系统是否会在发生故障时发生任何停机?

启用了多可用区选项后,万一发生故障,各区域中的 Amazon CloudSearch 实例都能处理全部负载。如果服务中断或者一个区域中的实例降级,Amazon CloudSearch 会将所有流量路由到另一可用区。冗余实例存储在单独的可用区中,无需任何管理员干预或中断服务。

有些正在传送中的查询可能会失败,需要重试。发送至搜索域的更新会持久存储,并且不会在发生故障时丢失。

问:是否可以在 2 个以上可用区中部署一个搜索域?

不可以。一个域最多可以部署在 2 个可用区中。

问:我是否可以在我的搜索域上修改多可用区配置?

可以。您可以打开/关闭您的搜索域的多可用区配置。设置改变时,服务不会中断。

问:我是否可以选择在哪个可用区部署我的搜索域?

不可以。目前 Amazon CloudSearch 自动选择同一区域中的备用可用区。

问:我是否可以选择我的域使用的实例类型?

可以。在最新发布的版本中,Amazon CloudSearch 允许您为域指定所需的实例类型。如果必要,Amazon CloudSearch 会将您的域扩展至更大的实例类型,但是绝不会收缩回较小的实例类型。

问:将数据放入 CloudSearch 的最快速的方法是什么?

默认情况下,所有域都是从小型搜索实例开始。如果您需要上传大量数据,则应预先将域扩展到较大实例类型。有关更多信息,请参阅 Amazon CloudSearch 开发人员指南中的批量上传

问:我如何知道应为我的初始设置选择哪个实例类型?

如果数据集包含小于 1GB 的数据或者少于 100 万个的 1KB 文档,初始默认设置是一个小型搜索实例。对于较大的数据集,则考虑通过设置所需实例类型来预热域。对于大至 8GB 的数据集,一开始就使用大型搜索实例。对于 8GB 到 16GB 的数据集,一开始就使用超大型搜索实例。对于 16GB 到 32GB 的数据集,一开始就使用双倍超大型搜索实例。如果您需要更多上传容量或有 500GB 以上的数据要进行索引,请联系我们


问:新版 Amazon CloudSearch 提供哪些额外的安全功能?

在发布了最新版本后,Amazon CloudSearch 现为配置服务和所有搜索域服务提供 IAM 集成。您可以控制对特定 Amazon CloudSearch 操作的访问权限,也可以要求所有请求均需要通过身份验证。使用 Signature Version 4 签名对请求进行身份验证。

问:如何将数据安全上传至 Amazon CloudSearch?

在连接到 Amazon CloudSearch 时,您可以使用 HTTPS 取代 HTTP,从而使用安全和加密的 SSL 连接上传您的数据。

问:我的数据已加密。我可以只将加密数据和加密密钥发送给你们吗?

我们不支持用户生成的加密密钥。您必须解密数据,然后使用 HTTPS 上传数据。

问:你们支持加密搜索结果吗?

支持。我们支持对所有 Amazon CloudSearch 请求使用 HTTPS。

问:如何防止特定用户访问我的搜索域?

Amazon CloudSearch 支持用于配置服务和所有搜索域服务的 IAM 集成。您可以授予用户对 Amazon CloudSearch 的完全访问权限、限制访问特定域,并允许或拒绝访问特定操作。


问:Amazon CloudSearch 的使用如何收费和记账?

开始使用服务时,没有设置费用,用户也无需给予承诺。每个月底之后将自动从您的信用卡扣除当月使用费。您可以随时在 AWS 网站上查看当前账单期的费用,只需登录您的 Amazon Web Services 账户,并单击“Your Web Services Account”(您的 Web Services 账户)下的 Account Activity(账户活动)。

问:使用 Amazon CloudSearch 如何收费?

目前,Amazon CloudSearch 的定价结构没有变化。有关详细定价信息,请参阅 Amazon CloudSearch 定价

问:Amazon CloudSearch 是否有免费试用版?

有,免费试用版可供新的 CloudSearch 客户试用。有关更多信息,请参阅 Amazon CloudSearch 30 天免费试用

问:使用新版 Amazon CloudSearch 的费用是多少?

目前,Amazon CloudSearch 的定价结构没有变化。请参阅定价页面了解更多信息。

 

问:使用新版 Amazon CloudSearch 会产生任何成本节省吗?

新版 Amazon CloudSearch 具有高级索引压缩的功能特点,并支持为每种实例类型执行较大索引。这使新版 Amazon CloudSearch 比起之前版本更高效,因而,可以节省大量资金。

问:价格是否含税?

除非另行说明,否则我们的价格不包含适用的税费和关税(包括增值税和适用的销售税)。 使用日本账单地址的客户若要使用 AWS,则需缴纳日本消费税。了解更多