什么是 NLP?
自然语言处理 (NLP) 是一种机器学习技术,使计算机能够解读、处理和理解人类语言。如今,组织具有来自各种通信渠道(例如电子邮件、短信、社交媒体新闻源、视频、音频)的大量语音和文本数据。他们使用 NLP 软件自动处理这些数据,分析消息中的意图或情绪,并实时响应人际沟通。
为什么 NLP 非常重要?
自然语言处理(NLP)对于全面高效分析文本和语音数据至关重要。其可以处理日常对话中的方言、俚语和典型语法异常方面的差异。
公司将其用于一些自动化任务,例如:
• 处理、分析和存档大型文档
• 分析客户反馈或呼叫中心录音
• 运行聊天机器人实现自动化客户服务
• 回答“人员-事件-时间-地点”问题
• 分类和提取文本
您还可以在面向客户的应用程序中集成 NLP,从而更有效地与客户沟通。例如,聊天机器人会分析和排序客户查询的问题,自动回复常见问题,并将复杂的查询转至客户支持。这种自动化流程有助于降低成本,节省座席在冗余查询上花费的时间,并提高客户满意度。
有哪些适用于企业的 NLP 使用案例?
企业使用自然语言处理(NLP)软件和工具高效和准确地简化、自动化和梳理运营。我们在下面给出一些使用案例示例。
敏感数据消减
保险、法律和医疗保健领域的企业对大量敏感文档(如病历、金融数据和私人数据)进行处理、排序和检索。公司使用 NLP 技术删节个人身份信息并保护敏感数据,而非通过手动审核。例如,Chisel AI 通过 Amazon Comprehend 帮助保险公司从非结构化文档中提取保单编号、到期日期和其他个人客户属性。
客户参与
NLP 技术使聊天机器人和语音机器人在与客户交谈时更像人类。企业使用聊天机器人扩展客户服务功能和质量,同时将运营成本降至最低。 PubNub 构建聊天机器人软件,使用 Amazon Comprehend 向其全球客户推出本地化聊天功能。 T-Mobile 使用 NLP 识别客户短信中的特定关键字并提供个性化推荐。 俄克拉荷马州立大学使用机器学习技术部署问答聊天机器人解决方案,解决学生问题。
业务分析
营销人员使用 Amazon Comprehend 和 Amazon Lex 等 NLP 工具了解客户对公司产品或服务的感受。通过扫描特定的短语,他们可以衡量客户书面反馈中的情绪和情感。例如,Success KPI 提供自然语言处理解决方案,帮助企业专注于情绪分析中的目标领域,同时帮助联系中心从呼叫分析中获得切实可行的见解。
NLP 如何工作?
自然语言处理(NLP)结合计算语言学、机器学习和深度学习模型处理人类语言。
计算语言学
计算语言学是使用计算机和软件工具理解和构建人类语言模型的科学。研究人员使用计算语言学方法(例如语法和语义分析)创建框架,从而帮助机器理解对话式人类语言。语言翻译器、文字转语音合成器和语音识别软件等工具都基于计算语言学。
机器学习
机器学习是一种技术,使用样本数据训练计算机以提高其效率。人类语言有一些特征,例如讽刺、隐喻、句子结构变化,以及人类需要数年才能学习的语法和特殊用法。程序员使用机器学习方法教授 NLP 应用程序从一开始就识别和准确理解这些特征。
深度学习
深度学习是机器学习的一个特定领域,教授计算机像人类一样学习和思考。此领域涉及神经网络,该网络由结构类似人脑的数据处理节点组成。计算机借助深度学习可以识别、分类和关联输入数据中的复杂模式。
NLP 实施步骤
一般来说,NLP 实现首先从来源(例如云数据仓库、调查、电子邮件或内部业务流程应用程序)收集和准备非结构化文本或语音数据。
预处理
NLP 软件使用预处理技术(例如分词、词干、词形还原和停用词删除)为各种应用程序准备数据。
下面介绍这些技术:
- 分词将句子分解为单个单元的字词或短语。
- 词干和词形还原将字词简化为词根形式。例如,这些流程将“starting(正在开始)”转换为“start(开始)”。
- 删除停用词可确保删除对句子没有重要含义的字词,例如“为”和“与”。
培训
研究人员使用预处理的数据和机器学习训练 NLP 模型,以便根据提供的文本信息执行特定应用程序。训练 NLP 算法需要向软件提供大量数据样本,以提高算法的准确性。
部署和推理
然后,机器学习专家将部署模型或将其集成到现有的生产环境中。NLP 模型接收输入并预测其为特定使用案例设计的输出。可以在实时数据上运行 NLP 应用程序,并获得所需的输出。
什么是 NLP 任务?
自然语言处理(NLP)技术或 NLP 任务将人类文本或语音分解为计算机程序可以轻松理解的较小部分。以下提供 NLP 中常见的文本处理和分析功能。
词性标记
在此流程中,NLP 软件根据上下文用法(例如名词、动词、形容词或副词)标记句子中的单个字词。其帮助计算机理解字词如何相互形成有含义的关系。
词义消歧
一些字词用于不同场景时可能具有不同的含义。例如,字词 "bat" 在这些句子中的含义不同:
- bat(蝙蝠)是一种夜间活动的生物。
- 棒球运动员使用 bat(棒球拍)击球。
借助词义消歧,NLP 软件通过训练语言模型或参考字典定义来识别字词的预期含义。
语音识别
语音识别将语音数据转换为文本。该流程涉及将字词分解为较小的部分,并且理解日常对话中的口音、辱骂、语调和语法使用不当。 语音识别的一个关键应用是转录,可使用 Amazon Transcribe 等语音转文本服务完成转录。
机器翻译
机器翻译软件使用自然语言处理将文本或语音从一种语言转换为另一种语言,同时保留上下文的准确性。 支持机器翻译的 AWS 服务是 Amazon Translate。
命名实体识别
此流程可识别人物、地点、活动、公司等的唯一名称。NLP 软件使用命名实体识别确定句子中不同实体之间的关系。
考虑如下示例:“Jane 前往法国度假,她沉迷于品尝当地的美食。”
NLP 软件将挑选 "Jane" 和“法国”作为句子中的特殊实体。这可以通过共同引用解决方案进一步扩展,确定是否使用不同的字词描述同一个实体。在以上示例中,"Jane" 和“她”指向同一个人。
情绪分析
情绪分析是一种基于人工智能的方法,用于解释文本数据传达的情感。NLP 软件会分析文本中是否存在表现不满、快乐、怀疑、遗憾和其他隐藏情感的字词或短语。
自然语言处理有哪些方法?
以下提供一些常用的自然语言处理(NLP)方法。
监督 NLP
监督 NLP 方法使用一套已标记或已知的输入和输出来训练软件。该程序首先处理大量已知数据,并学习如何从任何未知输入生成正确输出。例如,公司训练 NLP 工具根据特定标签对文档进行分类。
非监督 NLP
非监督 NLP 使用统计语言模型预测在提供非标签输入时出现的模式。例如,文本消息收发中的自动完成功能通过监控用户的回复来建议对句子有含义的相关字词。
自然语言理解
自然语言理解 (NLU) 是 NLP 的一个子集,专注于分析句子背后的含义。NLU 使该软件能够在不同的句子中找到类似含义或处理具有不同含义的字词。
自然语言生成
自然语言生成 (NLG) 专注于根据特定的关键字或主题生成像人类对话一样的对话文本。例如,具有 NLG 功能的智能聊天机器人能够以类似于客户支持人员行为的方式与客户交谈。
AWS 如何帮助您完成 NLP 任务?
AWS 为具备各种专业知识水平的客户提供了最广泛、最齐全的一套人工智能和机器学习 (AI/ML) 服务。这些服务与一整套数据来源连接。
对于缺乏 ML 技能、需要缩短上市时间或者希望为现有流程或应用程序增添智能的客户,AWS 提供了一系列基于 ML 的语言服务。借助这些服务,公司能够通过语音、转录、翻译、文本分析和聊天机器人功能的预先训练 API 轻松地为其 AI 应用程序融入智能。
以下是基于 AWS ML 的语言服务列表:
- Amazon Comprehend 可帮助发现文本中的见解和关系
- Amazon Transcribe 可执行自动语音识别
- Amazon Translate 可流利地翻译文本
- Amazon Polly 将文本转变为听起来自然的语音
- Amazon Lex 帮助构建聊天机器人以与客户互动
- Amazon Kendra 对企业系统进行智能搜索,以快速找到所需的内容
对于想要在整个企业中创建标准自然语言处理(NLP)解决方案的客户,可以考虑使用 Amazon SageMaker。 Amazon SageMaker 可通过完全托管的基础设施、工具和工作流程(包括面向业务分析师的无代码产品)轻松为任何使用案例准备数据并构建、训练和部署机器学习模型。
借助 Amazon SageMaker 上的 Hugging Face,可以部署和微调来自 NLP 模型开源提供商 Hugging Face 的预训练模型(称为转换器)。这可以将设置和使用这些 NLP 模型所需的时间从几周缩短到几分钟。
立即创建 AWS 账户,开始使用 NLP。