什么是深度学习?

深度学习是一种人工智能(AI)方法,用于教计算机以受人脑启发的方式处理数据。深度学习模型可以识别图片、文本、声音和其他数据中的复杂模式,从而生成准确的见解和预测。您可以使用深度学习方法自动执行通常需要人工智能完成的任务,例如描述图像或将声音文件转录为文本。 

为什么深度学习很重要?

人工智能(AI)试图训练计算机像人类一样思考和学习。深度学习技术推动了日常产品中使用的许多 AI 应用程序的发展,例如:

  • 数字助理
  • 声控电视遥控器
  • 欺诈检测
  • 自动面部识别

它也是自动驾驶汽车、虚拟现实等新兴技术的重要组成部分。 

深度学习模型是一些计算机文件,数据科学家训练这些文件,以使用算法或一组预定义步骤来执行任务。企业使用深度学习模型在各种应用程序中分析数据并做出预测。

深度学习的作用

深度学习在汽车、航空航天、制造、电子、医学研究和其他领域有很多使用场景。以下是深度学习的一些示例:

  • 自动驾驶汽车使用深度学习模型自动检测路标和行人。
  • 国防系统使用深度学习在卫星图像中自动标记感兴趣的区域。
  • 医学图像分析使用深度学习自动检测癌细胞以进行医学诊断。
  • 工厂使用深度学习应用程序自动检测人员或物体何时位于机器的不安全距离内。

您可以将这些不同的深度学习使用场景分为四大类:计算机视觉、语音识别、自然语言处理(NLP)和推荐引擎。

计算机视觉

计算机视觉是指计算机从图像和视频中提取信息及见解的能力。计算机可以使用深度学习技术来理解图像,就像人类一样。计算机视觉具有多种应用,如下所示:

  • 内容审核,用于从图像和视频归档中自动删除不安全或不适当的内容
  • 面部识别,用于识别面部和多项属性,如睁开的眼睛、眼镜以及面部毛发
  • 图像分类,用于识别品牌徽标、服装、安全装备和其他图像细节

语音识别

深度学习模型可以分析人类语音,尽管说话模式、音调、语气、语言和口音不尽相同。虚拟助手(如 Amazon Alexa)和自动转录软件使用语音识别执行以下任务:

  • 帮助呼叫中心座席并对呼叫进行自动分类。
  • 将临床对话实时转换为文档。
  • 为视频和会议记录添加准确的字幕以实现更广泛的内容覆盖范围。

自然语言处理

计算机使用深度学习算法从文本数据和文档中收集见解和意义。这种处理自然的、人工创建的文本的能力有几个使用场景,包括在以下功能中:

  • 自动虚拟座席和聊天机器人
  • 自动总结文件或新闻文章
  • 长格式文档(如电子邮件和表格)的业务情报分析
  • 用于表示情绪(如社交媒体上的正面和负面评论)的关键短语索引

推荐引擎

应用程序可以使用深度学习方法来跟踪用户活动并开发个性化推荐。它们可以分析各种用户的行为,并帮助他们发现新产品或服务。例如,许多媒体和娱乐公司,例如 Netflix、Fox 和 Peacock,都使用深度学习来提供个性化的视频推荐。

深度学习的工作原理

深度学习算法是仿照人脑建模的神经网络。例如,人脑包含数百万个相互关联的神经元,它们协同工作以学习和处理信息。同样,深度学习神经网络(或人工神经网络)是由在计算机内部协同工作的多层人工神经元组成的。

人工神经元是称为节点的软件模块,它使用数学计算来处理数据。人工神经网络是使用这些节点来解决复杂问题的深度学习算法。

深度学习网络有哪些组成部分?

深度神经网络的组成部分如下:

输入层

人工神经网络有几个向其输入数据的节点。这些节点构成了系统的输入层。

隐藏层

输入层处理数据并将其传递到神经网络中更远的层。这些隐藏层在不同层级处理信息,在接收新信息时调整其行为。深度学习网络有数百个隐藏层,可用于从多个不同角度分析问题。

例如,如果您得到了一张必须分类的未知动物的图像,则可以将其与您已经认识的动物进行比较。例如,您可以查看其眼睛和耳朵的形状、大小、腿的数量和毛皮花色。您可以尝试识别图样,如下所示:

  • 动物有蹄,所以它可能是牛或鹿。
  • 动物有猫眼,所以它可能是某种类型的野猫。

深度神经网络中的隐藏层以相同的方式工作。如果深度学习算法试图对动物图像进行分类,则其每个隐藏层都会处理动物的不同特征并尝试对其进行准确的分类。

输出层

输出层由输出数据的节点组成。输出 “是” 或 “否” 答案的深度学习模型在输出层中只有两个节点。那些输出更广泛答案的模型则有更多的节点。 

机器学习背景下的深度学习是什么?

深度学习是机器学习的子集。深度学习算法的出现是为了提高传统的机器学习技术的效率。传统的机器学习方法需要大量的人力来训练软件。例如,在动物图像识别中,您需要执行以下操作:

  • 手动标记数十万张动物图像。
  • 让机器学习算法处理这些图像。
  • 在一组未知图像上测试这些算法。
  • 找出某些结果不准确的原因。
  • 通过标注新图像来改进数据集,以提高结果准确性。

这个过程称为有监督学习。在有监督学习中,只有当您拥有广泛且充分多样化的数据集时,结果准确性才会提高。例如,该算法可能可以准确识别黑猫,但不能准确识别白猫,因为训练数据集包含更多黑猫图像。在这种情况下,您需要标记更多的白猫图像并再次训练机器学习模型。

深度学习相对于机器学习有什么好处?

与传统的机器学习相比,深度学习网络具有以下优势: 

高效处理非结构化数据 

机器学习方法发现非结构化数据(如文本文档)难以处理,因为训练数据集可能有无限种变化。另一方面,深度学习模型可以理解非结构化数据并进行一般观察,而无需手动提取特征。例如,神经网络可以识别出这两个不同的输入句子具有相同的含义:

  • 您能否告诉我如何付款?
  • 我如何转账? 

隐藏的关系和模式发现

深度学习应用程序可以更深入地分析大量数据,并揭示可能尚未对其进行过训练的新见解。例如,考虑一个经过训练以分析消费者购买的深度学习模型。该模型仅包含您已购买的商品的数据。但是,通过将您的购买模式与其他类似客户的购买模式进行比较,人工神经网络可以向您推荐您尚未购买的新物品。

无监督学习

深度学习可以根据用户行为进行学习,并随时间推移进行改进。它们不需要大量不同版本的标注数据集。例如,考虑通过分析您的键入行为自动更正或推荐词汇的神经网络。假设该模型是使用英语训练的,因此可对英语词汇进行拼写检查。但是,如果您经常键入非英语词汇,如 danke,神经网络也可以自动学习和更正这些词汇。

易失性数据处理

易失性数据集具有各种不同的版本。银行的贷款还款额就是其中的一个例子。深度学习神经网络也可以对这些数据进行分类和排序,例如通过分析金融交易并标记其中一些交易以进行欺诈检测。

深度学习面临哪些挑战?

由于深度学习是一项相对较新的技术,因此其实际实施会带来某些挑战。

大量高质量的数据

在大量高质量数据上训练深度学习算法时,可以获得更好的效果。输入数据集中的异常值或错误会显著影响深度学习过程。例如,在我们的动物图像示例中,如果数据集中意外引入了非动物图像,深度学习模型可能会将飞机归类为海龟。

为避免此类错误,必须先清理和处理大量数据,然后再训练深度学习模型。输入数据预处理需要大量的数据存储容量。

处理能力强 

深度学习算法是计算密集型的,需要具有足够计算能力的基础设施才能正常运行。否则,它们需要很长的时间来处理结果。 

云端深度学习有哪些好处?

在云基础架构上运行深度学习算法可以克服其中的许多挑战。您可以使用云中的深度学习更快地设计、开发和训练深度学习应用程序。 

速度

您可以使用 GPU 和 CPU 集群来执行神经网络所需的复杂数学运算,从而更快地训练深度学习模型。然后,您可以部署这些模型来处理海量数据,并生成相关性越来越高的结果。

可扩展性

使用通过云提供的广泛的按需资源,您可以访问几乎无限的硬件资源来处理任何规模的深度学习模型。您的神经网络可以利用多个处理器,在不同类型和数量的处理器之间无缝、高效地分配工作负载。

什么是 AWS 上的深度学习?

AWS 深度学习服务可以利用云计算的强大能力,使您能以较低的成本扩展您的深度学习神经网络,并优化它们的速度。您还可以使用 AWS 服务(如下所示)来全面管理特定的深度学习应用程序:

  • Amazon Rekognition 可为您的应用程序添加预训练或可自定义的计算机视觉特征
  • Amazon Transcribe 可以自动识别和准确转录语音
  • Amazon Lex 可以构建智能聊天机器人,它们能够理解意图、维护对话上下文,并跨多种语言自动执行简单任务

通过 Amazon SageMaker 开始在 AWS 上使用深度学习,并快捷轻松地构建、训练和大规模部署神经网络。您还可以使用 AWS Deep Learning AMI 来构建自定义的深度学习环境和工作流。请立即创建一个免费 AWS 账户以开始使用!

AWS 上的深度学习后续步骤

查看其他与产品相关的资源
了解有关深度学习服务的更多信息 
注册免费账户

立即享受 AWS 免费套餐。 

注册 
开始在控制台中构建

在 AWS 管理控制台中开始构建。

登录