什么是数据共享?

数据共享是使相同的数据资源可用于多个应用程序、用户或组织的过程。这个过程包含技术、实践、法律框架和文化元素,这些元素可在不损害数据完整性的情况下促进多个实体的安全数据访问。数据共享提高了组织内的效率,并促进了与供应商和合作伙伴的合作。了解共享数据的风险和机遇是该过程不可或缺的一部分。

为何数据共享对企业如此重要?

自互联网出现之前,各组织就一直在共享数据。然而,数字素养、技术和云采用方面的进步极大提高了数据共享规模。以下是促进数据共享增长的三个关键因素:

  • 数据存储、处理和传输技术的可用性不断提高,价格也越来越实惠
  • 新的行业思维方式将数据视为一种资源和资产
  • 政策和法规已经改变,旨在降低数据共享的风险

现代企业明白,数据共享对于改善社区关系和获得新商机至关重要。下面概述了一些好处。

为客户创造更高的价值

组合来自不同数据来源的信息可能会提升服务的价值和性能。这种方法有助于产品研究和开发。例如,WB Games 是 Warner Bros. 的电子游戏部门,使用数据共享来帮助指导游戏开发的创作流程。该部门捕捉、摄取、分析见解并采取相应行动,以帮助开发人员在呈现故事的过程中伺机而行且更加敏捷灵活。

了解 WB Games 如何使用 AWS »

数据驱动型决策

通过透明地共享信息,团队可以打破数据孤岛并有助于改进分析。商业智能得到改善,利益相关者能做出有影响力的长期决策。例如,GE Renewable Energy 在全球已安装超过 4.9 万台风力发电涡轮机。GE 涡轮机配备了传感器并连接到先进的网络,该网络会收集有关温度、风速、电力的数据以及与涡轮机性能相关的其他数据。GE 数据分析系统有助于制定有关涡轮机维护和生产力的决策。

了解 GE 如何使用 AWS »

积极的社会影响

公共当局和组织可以以安全、合法和恭敬的方式共享更多数据。这能创造新的合作机会,从而有利于更多社区。例如,卫生部门的数据共享工作为医学研究做出了积极贡献,导致基因组研究领域取得巨大进步。

了解基因组学行业如何使用 AWS »

数据共享有哪些风险?

数据披露具有潜在的监管、竞争、财务和安全风险。下面概述了一些严重威胁。

隐私披露

每个组织都有保护自己客户的数据隐私的法律和道德义务。组织必须采取适当的措施共享数据,避免侵犯隐私。加密和修订等隐私保护技术可实现安全的数据共享。

数据误解

数据生产者和使用者之间缺乏沟通会导致分析误解。分析师在解释报告和结果时可能会做出错误假设。例如,特定月份客户订单减少可能是因为营销预算较低,尽管真正原因可能是产品可用性延迟。

数据质量低

数据使用者对数据的质量和可用性控制可能有限。他们可能不得不处理数据丢失或重复、数据有效性、缺少数据文档等类似问题。数据集中也可能存在针对特定性别、种族、宗教或民族的隐藏偏见。

数据共享技术有哪些?

有许多技术可以减少生产者和使用者之间的摩擦、降低风险并提高数据共享的价值。下面提供了一些示例。

数据仓库

数据仓库是一个中央存储库,可存储多个业务部门的数据。数据仓库的架构包含多个层。顶层是通过报告、分析和数据挖掘工具呈现结果的前端客户端。中间层包括用于访问和分析数据的分析引擎。架构的底层是加载和存储数据的数据库服务器。顶层和中间层应用程序可以共享存储在底层的常用数据集。

数据仓库对内部数据共享很有用。可以将访问共享数据的工作负载彼此隔离。

API

API 是允许两个软件组件使用一组定义和协议相互通信的机制。接口可以看作是两个应用程序之间的服务合约。该合约定义了两者如何使用请求和响应相互通信。数据共享 API 支持细粒度访问控制,并准确指定数据使用者可以请求的内容。

了解 API»

联合学习

联合学习 是一种机器学习(ML)技术,允许人工智能系统在分布式数据集上进行训练。数据生产者在为协作技术进步做出贡献的同时保留控制权。例如,检测癌症的 ML 算法基于各医疗机构的癌症组织图像进行训练。

了解机器学习 »

区块链技术

区块链技术是一种高级数据库机制,允许在企业网络中透明地共享信息。区块链数据库将数据存储在数据块中,而这些区块则一起链接到一个链条中。数据在时间上是一致的,因为在没有网络共识的情况下,您不能删除或修改链条。因此,您可以使用区块链技术创建不可改变的分类账,以便跟踪订单、付款、账户和其他交易。此外,系统内置的机制可以阻止未经授权的交易条目并在这些交易的共享视图中创建一致性。

了解区块链 »

数据交换平台

开放数据平台允许不同实体注册数据集以供公众使用;您只需准备和提交数据。该平台提供存储和访问的基础设施。任何人都可以访问您的数据。

AWS 如何支持您的数据共享工作?

在 AWS 上共享数据时,任何人都可以利用众多计算和数据分析产品分析这些数据,并在此基础上构建服务。这些产品包括 Amazon Cloud Compute(Amazon EC2Amazon AthenaAWS LambdaAmazon EMR。云数据共享让您的用户可将更多时间用在数据分析而非数据获取上。我们在下面给出了一些技术示例。

  • Amazon Redshift 是一种数据仓库技术,允许用户进行即时、精细和快速的数据访问,而无需复制或移动数据。您的用户能够始终看到最新并且一致的信息,因为数据是在数据仓库中进行更新的。
  • Amazon Managed Blockchain 是一种完全托管的服务,可让您轻松创建和管理可扩展的区块链网络和分布式分类账技术。
  • AWS Data Exchange 可帮您轻松找到 AWS 服务公开提供的数据集。

立即创建免费账户,开始在 AWS 上使用云数据共享。

数据共享后续步骤

查看其他与产品相关的资源
查看分析服务 
注册免费账户

立即享受 AWS 免费套餐。

注册 
开始在控制台中构建

在 AWS 管理控制台中开始构建。

登录