什么是认知搜索?
认知搜索是一种搜索引擎技术,该技术使用人工智能(AI)快速找到各种类型查询的相关且准确的搜索结果。现代企业在手册、常见问题、研究报告、客户服务指南和人力资源文档等各种系统中存储大量信息。认知搜索技术扫描包含不同信息的大型数据库,并关联数据,以发现用户问题的答案。例如,您可以问一个问题,比如“去年在机械维修上花了多少钱?” 然后,认知搜索将问题映射到相关文档并返回特定的答案。
认知搜索有哪些优点?
认知搜索具有诸多优点,这使其成为一种有用的搜索引擎技术。以下是认知搜索的一些主要优点。
理解自然语言
认知搜索服务无需用户提供太多规范即可产生更精确的结果。该服务可以通过考虑多种来源并从结构化和非结构化数据中爬取来生成精确的搜索结果。认知搜索引擎技术在返回结果时还可理解上下文。该技术使用自然语言处理(NLP)来确定人类语言的上下文、模式和含义。
提高生产效率
认知搜索结合多个数据来源的信息,并且产生全面的响应作为输出。在传统的关键字搜索中,您必须在多个页面中定位所有必需的信息。然后,您自己阅读、分析和总结信息。
相比之下,可以使用综合搜索功能同时从多个文档中获取答案。可以更快地访问所需的数据。这就可以提高工作效率,简化整个组织中与数据相关的业务流程。
个性化搜索结果
认知搜索使用机器学习(ML),其可以随时间推移为用户提供个性化的结果。机器学习不会持续输出相同的信息,而是收集所使用的数据和搜索模式。通过记录用户在初始查询后可能点击的结果,该技术可以改进并更快地产生高度相关的结果。 该技术会不断变得更智能、更精确、更有用。
认知搜索有哪些使用案例?
认知搜索使用自然语言处理和其他人工智能技术来提供精确的搜索。以下是认知搜索使用的一些步骤。
数据摄取
认知搜索首先需要信息才能在其中进行搜索。该技术可以从文档、网站、电子邮件、内部存储库、手册以及您要使用的任何其他信息中摄取数据。它使用光学字符识别(OCR)、实体识别和 NLP 技术等提取技术从资源中提取信息。
提取过程旨在使认知搜索能够理解信息,类似于人类随后对内容进行分类。
数据索引
摄取数据后,认知搜索会针对您提供的所有已提取信息创建可搜索的索引。除了使用关键字标记数据外,该技术还使用元数据、数据之间的关系和补充信息来有效地对所有信息进行分类。
当用户搜索内容时,认知搜索会参考这些索引,以更快地找到相关信息。
用户输入
当用户将查询写入认知搜索时,后者会使用自然语言处理来分解和理解他们提出的问题。在传统的关键字搜索中,搜索引擎可以识别关键字并产生与该关键字一致的数据。
相比之下,认知搜索尝试了解查询的完整上下文,以及个人用户因素,例如他们的首选项。该技术结合了令牌分析和语义分析等 NLP 技术,以了解用户想要从搜索中获得的结果。
搜索和检索
然后,认知搜索使用用户的查询,扫描其数据索引,并在其存储库中查找相关信息。该技术在索引中移动,寻找最近的邻居,然后逐层筛选出结果。每个相关结果都被分配一个相关性分数。认知搜索通过根据分数对结果进行排序来显示最相关的信息。
持续改进
用户在使用认知搜索时可以添加其他筛选条件或规范,以帮助产生更具体的结果。认知搜索根据以前的交互完善其查询方法。
例如,认知搜索会记录用户搜索的内容及其搜索查询的顺序。如果用户通常在查询后立即提出某个问题,认知搜索也会主动包含有关后续问题的信息。
认知搜索还会随时间推移更多地了解用户搜索查询背后的情绪和意义。这可改进其对查询的直接响应。
例如,当有人提出特定的问题时,认知搜索会给出具体的答案。或者,用户更笼统的问题会得到更长的答案。通过不断记录交互并从中学习,认知搜索会变得更加精确,并且不断提供更相关的信息。
认知搜索如何运作?
以下是一些使用认知搜索可带来益处的机会。
统一的搜索体验
可以使用认知搜索打造统一的搜索体验。由于认知搜索使用自然语言处理,因此可以通过从多个非结构化和结构化数据存储库中提取信息来获得高度详细和准确的响应。通过利用多种来源和数据类型,可以更轻松地做出以数据为依据的决策。
例如,生物技术公司 Gilead Sciences, Inc. 使用 AWS 进行认知搜索。公司使用该技术来组织结构化和非结构化数据。这些信息来源于多达九个企业系统,而文档来源于知识库。
认知搜索大幅度减少了 Gilead 的手动数据管理任务。搜索信息所需的时间约为原来的 50%。这推动了极具价值的研究、实验和药物突破。
自助式机器人
可以在自助式机器人中使用认知搜索解决方案,这有助于改善现场客户支持。想要知道如何执行某个任务或函数的用户可以输入人类语言并获得自定义的响应。认知搜索通过从各种手册、支持文档和资源中提取信息来支持知识发现。
例如,Citibot 使用 AWS 为公民及其地方和州政府提供通信工具。将聊天机器人技术与认知搜索相结合,以提高与选民互动的可扩展性和有效性。公民可以通过与聊天机器人互动快速找到所需的答案,将等待时间缩短多达 90%。
数据存档搜索
许多组织都拥有历史数据存储,其中包含数百万个文档、图像和转录的文本文件。认知搜索可以解锁数据存储中的信息,并对其进行汇总以供分析和研究。
例如,The Wall Street Journal 使用 AWS 进行认知搜索。认知搜索帮助加速了 Talk2020 的发展。Talk2020 是一款智能搜索工具,可帮助该出版物的读者快速搜索和分析 30 年来总统候选人发表的公开声明。该技术通过探索语音模式和进行文本分析,随着时间的推移更轻松地深入调查问题。
员工入职
认知搜索可以帮助员工完成任何需要执行的自助任务,例如入职或学习新技能。它充当面向员工的交叉参考。员工不必联系经理解释如何做某事,而是可以询问认知搜索。这种用法有助于简化自助服务任务并提高工作效率。
例如,Workgrid Software 使用 AWS 在员工体验平台上提供软件解决方案。这使员工的工作更加互联互通、高效和富有成效。通过认知搜索,员工可以查询组织数据库中的数字内容。这样,他们就可以找到工作中出现的任何问题的答案。
生成式人工智能如何改善认知搜索?
生成式人工智能(生成式 AI)是一种可用于创建新的内容和想法(包括对话、故事、图像、视频和音乐)的人工智能。生成式人工智能有助于简化认知搜索,更妥善地了解用户意图并改进整体响应。下面提供一些示例。
上下文分析
许多生成式人工智能工具都使用基于转换器的机器学习模型。这些模型具有用于分析文本数据以理解其含义的神经网络。
基于转换器的人工智能模型对于自然语言处理和理解非常有用。通过考虑用户、数据上下文和用户意图,这些模型可以更充分地理解查询背后的真正目的。借助改进的查询理解,认知搜索可以找到更精确的信息以返回给用户。
结果摘要
生成式人工智能可以将较大的文本汇总成较小的内容段。认知搜索可以找到不同文档中语义上最相关的部分。然后,该技术可以使用生成式人工智能将这些部分组合起来,并准确返回用户想要看到的内容。生成式人工智能还可以通过理解返回的文本并消除任何冗余内容来最大限度地提高结果的质量。
内容筛选
生成式人工智能可以按不同的参数筛选认知搜索结果,包括用户授权、查询相关性和用户首选项。生成结果文本时,它可以确保仅使用用户有权访问的资源。在不影响安全性的前提下,结果仍然具有相关性和有用性。
AWS 如何改善认知型企业搜索解决方案?
Amazon Web Services(AWS)提供 Amazon Kendra 作为认知搜索解决方案。
Amazon Kendra 是一项由机器学习提供支持的认知搜索服务,其完全托管、高度准确且易于使用。开发人员可以使用该服务为应用程序添加搜索功能。这意味着最终用户可以发现存储在公司内大量内容中的相关信息。
以下是您可以通过 Amazon Kendra 获益的方式:
- 在结构化和非结构化的内容存储库中获得统一的搜索体验
- 使用机器学习支持的工具提供查询响应
- 采用完全托管的答案排序功能,这些功能有助于提高答案的准确性
- 根据自己的特定标准以及其他属性(例如用户行为和内容新鲜度)微调响应
立即创建账户,开始在 AWS 上使用认知搜索。