Amazon Kendra 功能

Amazon Kendra 是一种由机器学习(ML)提供支持的智能搜索服务。Amazon Kendra 重新构想您的网站和应用程序的企业搜索,这样您的员工和客户就可以找到他们要查找的内容,即使这些内容分散在您组织内的多个位置和内容存储库中。

生成式人工智能

在企业内容的基础上,为用户创建安全的、由生成式人工智能驱动的对话体验。Amazon Kendra 提供经过优化的 Kendra Retriever API,允许您使用 Amazon Kendra 的高精度语义排名器作为检索增强生成(RAG)工作流程的企业检索器。Kendra Retriever API 可以从您的企业内容中查找和检索与用户问题语义最相关且具有经过优化的粒度的段落,可以最大限度地提高 RAG 有效负载的质量,而无需您具备精确语义检索方面的专业知识。然后,可以将这些经过优化的段落与用户的问题一起发送给 LLM,以获得生成式响应。Kendra Retriever API 还包括 Kendra 功能,例如基于 ACL 的筛选、相关性调整、基于元数据的筛选等。

使用 Amazon Kendra 和新的 Retriever API 可以为构建生成式人工智能体验提供以下好处:

  • 智能分块文档:仅将内容中最相关的段落发送给 LLM。
  • 针对 RAG 进行了优化:Kendra Retriever API 会返回最相关的段落,这些段落具有获得准确的 LLM 答案所需的最佳粒度。
  • 用户 ACL 筛选:仅返回最终用户有权从您的企业内容中查看的段落。
  • 相关性提升:根据日期、源存储库或任何元数据提升特定内容,从而改进 LLM 答案。
  • 加快生成式人工智能应用程序的开发:利用上述功能快速启动并运行,而不是从头开始构建自己的企业检索器。

要开始使用 Kendra Retriever API,请参阅此处的文档以及这篇博客文章,获取入门技巧、最佳实践和代码模板。

增量学习

Amazon Kendra 将使用机器学习来根据最终用户的搜索模式和反馈不断优化搜索结果。例如,当用户搜索“如何更改我的健康福利?”时,会有多个人力资源(HR)福利文档争抢榜首的位置。为了确定与此问题最相关的文档,Amazon Kendra 将从用户交互和反馈中学习,以将首选文档提升到列表的顶部。它无需机器学习专业知识即可自动应用增量学习技术。

调整和准确度

您还可以根据特定的业务目标调整搜索结果,并在结果中增加特定的答案和文档。例如,相关性调整可以帮助您根据更多权威数据来源、作者或文档的新鲜度来提高结果。在我们的相关性调整博客文章中了解更多信息。

要扩展 Amazon Kendra 对您的特定业务词汇的理解,您可以提供您的自定义同义词。Amazon Kendra 使用这些来自动扩展查询以包括与扩展词汇表匹配的内容和答案。例如,当最终用户问“什么是 HSA?”时 Amazon Kendra 将返回引用“健康储蓄账户”或“HSA”的文件。

连接器

在 Amazon Kendra 中使用连接器更快速更轻松,只需将数据来源添加到 Amazon Kendra 索引,然后选择连接器类型。可将连接器安排为自动同步索引和数据来源,因此,您始终可以安全地搜索最新内容。Amazon Kendra 为流行数据源(例如 Amazon Simple Storage Service (S3)、Microsoft SharePoint、Salesforce、ServiceNow、Google Drive、Confluence 等)提供了本机连接器。如果没有本机连接器,Amazon Kendra 将提供自定义数据源连接器以及许多合作伙伴支持的连接器。关于 Amazon Kendra 连接器可用性的更多信息,请访问 Amazon Kendra 连接器库

域优化

Amazon Kendra 使用深度学习模型来理解自然语言查询,并能理解为各种内部使用案例(包括人力资源、运营、支持和研发)提供的文档内容和结构。经过优化的 Amazon Kendra 还可以理解 IT、金融服务、保险、制药、工业制造、石油和天然气、法律、媒体和娱乐、旅游和酒店、卫生健康、新闻、电信、采矿、食品和饮料以及汽车等领域的复杂语言。例如,搜索人力资源答案的用户可以输入“提交 HSA 表单的截止日期”,Amazon Kendra 还将搜索“提交健康储蓄账户表单的截止日期”以获得更广泛的覆盖范围,进而获得最准确的答案。

Experience Builder

现在,您通过 Amazon Kendra 只需几步,就可以部署功能齐全、可定制的搜索体验,而无需任何编码或机器学习体验。Experience Builder 提供了直观的可视化工作流,以快速构建、自定义和安全地在云上启动您的搜索应用程序。您可以从构建器中的现成搜索体验模板开始,可以通过拖放您想要的组件(如筛选条件或排序)来定制该模板。您可以邀请其他人合作或测试您的搜索应用程序以获得反馈,然后在准备部署体验时将项目与所有用户共享。Amazon Kendra Experience Builder 与 AWS IAM Identity Center(AWS Single Sign-On 的后继者)集成,支持 Azure AD 和 Okta 等流行身份验证提供商,在访问搜索体验时提供安全的终端用户单点登录认证。有关 Amazon Kendra Experience Builder 的更多信息,请访问文档

搜索分析控制面板

Amazon Kendra Search Analytics Dashboard 可帮助您更好地了解跨您的搜索应用程序的质量和可用性指标。控制面板可帮助管理员和内容创建者了解终端用户查找相关搜索结果的容易程度、搜索结果的质量和内容中的缺口。它提供了一个快照,显示您的用户如何与您的搜索应用程序互动以及搜索结果有多有效。分析数据可以在控制台的可视化控制面板中查看,也可以通过 API 访问数据来构建自己的控制面板。它可以使您能够深入研究搜索趋势和用户行为,以确定洞察,也有助于使潜在的改进领域变得清晰。有关 Amazon Kendra Search Analytics 控制面板的更多信息,请访问文档

自定义文档丰富

通过 Amazon Kendra Custom Document Enrichment 功能,您可以构建一个自定义摄取管道,在文档被索引到 Amazon Kendra 之前可以对文档进行预处理。例如,在使用连接器从 SharePoint 这样的存储库中摄取内容时,您可以使用额外的元数据来丰富文档,将扫描的文档转换为文本,对文档进行分类,提取实体,并使用自定义 ETL 过程进一步转换文档。丰富操作是通过规则执行的,这些规则可以在控制台中配置,也可以通过从 AWS Lambda 调用函数来实现。这些函数可以选择调用其他 AWS AI 服务,如 Amazon Comprehend、Amazon Transcribe 或 Amazon Textract。有关 Amazon Kendra Custom Document Enrichment 的更多信息,请访问文档

查询自动填充

Amazon Kendra 包含自动填充最终用户搜索查询的功能。查询自动填充不仅可以帮助您减少 25% 的输入,还可以帮助引导您回答更精确的常见问题。此类问题通常会获得更相关、更有用的答案。例如,假设您开始在搜索框中输入“哪里有”,Amazon Kendra 可以推荐如“哪里有 IT 桌?”或“哪里有自助餐厅?”之类的选项和其他相关的常见问题,来帮助完成查询。