AWS 云
AWS 云

使用 AWS 和合作伙伴解决方案快速构建、测试和部署数据湖。

传统的数据存储和分析工具无法再提供实现相关业务见解所需的敏捷性和灵活性。因此,很多组织正在转为使用数据湖架构。通过数据湖快速入门客户就绪解决方案,AWS 和能力合作伙伴可以更快、更轻松地构建您的数据湖。数据湖是一种架构方法,让您可以将大量数据存储在一个集中位置,以便组织内的各个团队随时对其进行分类、处理、分析和使用。因为数据可以按原样存储,所以您无需将其转换为预定义架构,也不再需要预先了解您要询问的数据相关问题。

了解 AWS 和 APN 能力合作伙伴如何帮助组织将大量异构数据迁移到 AWS 上的数据湖,让他们可以迅速轻松地使用数据获取关键业务见解。

下载电子书
  • 以低成本收集并存储任何规模的所有类型数据
  • 保护数据并防止其受到未经授权的访问
  • 在一个集中式存储库内对相关数据进行编目、搜索和查找
  • 快速轻松地执行新类型的数据分析
  • 使用一系列分析引擎,用于临时分析、实时流式处理、预测性分析、人工智能 (AI) 和机器学习

数据湖还可以补充和扩展现有数据仓库。如果您已经在使用或者想要构建一个数据仓库,可以将数据湖用作结构化数据和非结构化数据的来源。

通过 AWS 上的数据湖,您可以使用适用于大数据的最完整的平台。AWS 可以为您提供安全的基础设施和一系列可扩展并且经济高效的服务,用于对数据进行收集、存储、分类和分析,从而获取有价值的见解。AWS 让您能够根据自己的具体数据分析要求轻松构建和定制数据湖。您可以按照快速入门来开始构建,也可以利用 APN 合作伙伴的技能和专业知识,让他们为您构建一个数据湖。数据湖可以用作结构化数据和非结构化数据的来源。

以各种方式轻松提取数据,包括利用 Amazon Kinesis、AWS Import/Export Snowball、AWS Direct Connect 等。无论数据的数量或格式如何,都可以使用 Amazon Simple Storage Service (Amazon S3) 来存储您的所有数据。

100x100_benefit_performance.png

您几乎可以立即部署需要的基础设施。这意味着,您团队的工作效率将提高,更容易尝试新事物,项目的推出速度也会加快。

AWS 提供的功能横跨设施、网络、软件和业务流程等领域,可满足最严格的要求。我们的环境针对各种认证(如 ISO 27001、FedRAMP、DoD SRG 和 PCI DSS)持续接受审核。 

构建几乎任何大数据应用程序并支持任何工作负载,不受数据数量、速度和类型的影响。凭借每年新增的 50 多项服务和数百种功能,AWS 可提供您所需的一切,帮助您在云中对大数据进行收集、存储、处理、分析和可视化。


Fanatics 是一个受欢迎的运动服装网站和体育爱好者装备零售商,需要使用 Amazon S3 上的数据湖接收来自多个历史和流式源(交易、电子商务和后台系统)的 TB 级数据。接收数据后,将对其进行分析以更好地识别、预测和满足 Fanatics 在 300 多个线上和线下商店中提供的产品相关的客户需求。

为实现这一目标,Fanatics 选择了 Attunity Replicate,这是一种软件解决方案,具有连续数据采集 (CDC) 和并行线程,可实时将数据从多个源流式传输到 Amazon S3 上的数据湖中。然后,可以在 Apache Kafka 中使用这些数据进行实时分析。Attunity 可帮助 Fanatics 避免手动从不同来源提取数据的繁重工作,并使组织能够实时查看结果。

网络研讨会标题:Fanatics 使用 AWS 上的数据湖接收流式数据

客户演讲嘉宾:Alan Chang,Fanatics 高级产品经理
Attunity 演讲嘉宾:Jordan Martz,技术总监
AWS 演讲嘉宾:Paul Sears,解决方案架构师

查看按需网络研讨会

对来自不同来源(数据湖、数据仓库、流媒体等)的数据执行数据科学工作负载,为需要使用其数据来推动运营和产品改进的组织带来了挑战。教科书出版商 McGraw-Hill 需要删除此类数据孤岛,以便转换其业务模式,以适应日益增长的数字学习需求。具体而言,该公司希望能够快速执行复杂的分析操作,并实现业务分析师、数据工程师和数据科学家之间的协作。

McGraw-Hill 部署了 Databricks,这是一个统一的分析平台,可以高效地处理流式数据以及存储在 Amazon S3 和多个数据仓库中的数据湖中的历史数据。在此网络研讨会中,您将了解由 Apache Spark™ 的原始创建者开发的 Databricks 如何使 McGraw-Hill 能够以他们之前的解决方案无法实现的规模和速度分析流式数据和历史数据。过去需要数周的数据科学工作负载现在需要数小时。

网络研讨会标题:McGraw-Hill 使用 Databricks 优化分析负载
客户演讲嘉宾:Matthew Ashbourne,McGraw-Hill Education 的软件总工程师
Databricks 演讲嘉宾:Brian Dirking,合作营销高级总监
AWS 演讲嘉宾:Pratap Ramamurthy,解决方案架构师

查看按需网络研讨会

大数据技术既复杂又需要耗时的手动过程。组织以智能方式实现大数据操作的自动化,以降低成本、提高团队的工作效率、更高效地扩展并降低出现故障的风险。

在我们的网络研讨会中,来自电视内容数字录制平台的创建者 TiVo 的代表将解释他们如何实现一个新的大数据分析平台,该平台可根据不断变化的需求进行动态扩展。您将了解该解决方案如何使 TiVo 能够使用 Amazon Elastic Cloud Compute (Amazon EC2) 和从 Amazon Simple Storage Service (Amazon S3) 上的数据湖读取数据的 Amazon EC2 Spot 实例轻松协调大数据集群,以及如何减少支持其网络和广告商用户所需的开发成本和工作量。TiVo 将分享相关经验教训和最佳实践,以便快速、经济地提取、处理和提供来自数百万家庭的 TB 级流式数据和批量收视率数据的分析。

网络研讨会标题:Tivo:如何使用 AWS 和 Qubole 上的数据湖来扩展新产品

客户演讲嘉宾:Ashish Mrig,TiVo 的大数据分析高级经理
Qubole 演讲嘉宾:Harsh Jetly,解决方案架构师
AWS 演讲嘉宾:Paul Sears,解决方案架构师

查看按需网络研讨会

了解如何在 AWS 上缩短开发时间并实现创新。在此网络研讨会中,Beachbody(健身、减肥和塑形居家锻炼视频课程的销售商)会讲述他们使用 Talend 迁移到 AWS 上的数据湖架构方面的经验。Beachbody 将介绍他们如何创建一个开放式企业数据平台,让其员工能够访问处于有效管理下的安全数据,并提高整个公司的开发运营效率。

参加我们的网络研讨会,了解 Talend 和 AWS 如何帮助 Beachbody 将各种非结构化和结构化数据源迁移到数据湖、缩短开发和测试周期,并解决实时数据方面常见的复杂部署难题。

网络研讨会名称:为企业构建开放式数据湖
Talend 演讲嘉宾:Ashwin Viswanath,云产品营销总监
客户演讲嘉宾:Eric Anderson,Beachbody 的数据执行总监
AWS 演讲嘉宾:Pratap Ramamurthy,解决方案架构师

查看按需网络研讨会

借助 Informatica Intelligent Data Lake Management 解决方案,您可以在 AWS 上受信任的数据湖中接收、清理、处理、监管和保护大量原始数据。Informatica 可以提供元数据驱动型 AI 和企业编目功能,让分析师等业务利益相关者能够快速发现、描述、准备和保护数据,以便及时获取相关业务见解。简而言之,Informatica 让企业能够利用 AWS 上数据湖的功能,并获得可以促进创新和销售的大数据见解。

了解更多 »


现在的企业依靠大数据运营,而数据产生的指标需要集中定义并完全可以访问,这样才能实现真正的优势。现在使用的解决方案是 Looker,一种现代化的数据平台,让公司中的每个人都能够查找和分析其决策所需的数据。Looker 专为 Amazon Web Services (AWS) 等云平台构建,让您能够直接查询数据湖等现代化云数据库。客户使用 Looker 进行内部分析,并向客户、合作伙伴和供应商提供数据。

了解更多 »


将数据湖的优势与 47Lining 在 AWS 上提供的数据湖持续管理服务相结合。

了解更多 »

使用 AWS 和 Talend 简化基于云的数据湖的部署。

阅读解决方案摘要 »

查看咨询优惠 »

放心使用 Cloudwick 成熟的三步式流程在 AWS 上设计和管理数据湖。

了解更多 »

利用 NorthBay 的经验以及与 AWS 的高度一致性来构建自定义数据湖解决方案。

了解更多 »