什么是数据存储?
数据存储是存储计算机系统中信息并保护信息安全的数字存储库。数据存储可以是连接到网络的存储、分布式云存储、物理硬盘驱动器或虚拟存储。它可以存储结构化数据(例如信息表)和非结构化数据(例如电子邮件、图像和视频)。组织可以使用数据存储跨业务部门保留、共享和管理信息。
为什么数据存储非常重要?
您可以使用数据存储在计算机系统中可靠保存信息并防止数据丢失。计算机系统将信息存储在持久性存储设备上。持久性存储是非易失性的,这意味着设备电源关闭后也能保留数据。这样可以保证计算机系统再次打开电源后能访问相同数据。
企业使用数据存储来管理、分类和简化数据,以便用于操作、分析、报告和数据留存,这对于法规合规性很重要。数据存储有多个使用案例,例如应用程序创建和使用的数据、数据归档、数据分析和灾难恢复。
由于数据需求的复杂性,公司使用不同类型的数据存储基础设施来提供可访问性、冗余、治理和透明度。例如,组织使用 Amazon Elastic File System(Amazon EFS)作为无服务器文件系统,使用 Amazon Simple Storage Service(Amazon S3)作为对象存储。
与数据存储相关的术语有哪些?
在数据存储的上下文中,有几个术语经常互换使用,但含义略有不同。下面提供了一些示例。
数据库
数据库是一个有组织的存储系统。大多数数据库都基于关系数据库体系结构。关系数据库管理系统(RDBMS)允许用户将数据存储在与特定数据点关联的表中。组织使用数据库来存储交易数据,例如核算、销售和管理日志。
数据存储与数据库的比较
关于数据存储的讨论涉及存储和检索信息的不同方法。数据库是一种允许应用程序轻松存储、共享和检索数据的方法。与文件系统不同,关于如何在数据库中组织、格式化和存储数据这方面,数据库会遵循特定规则。
数据仓库
数据仓库广泛集合了从各种来源获取的业务相关信息。公司使用数据仓库来支持商业智能和分析。业务分析师和数据科学家从数据仓库中获得可操作的见解。
数据存储与数据仓库的比较
数据存储是一种统称,包括用于存储和检索信息的不同硬件、技术、格式和架构。数据仓库是一种特定类型的数据存储,用于整合企业的分析数据。例如,GE Renewable Energy 使用 AWS Redshift 来获取对所收集数据的新见解。
数据存储的工作原理是什么?
物理数据存储设备是数据存储背后的底层技术。您可以以文件、表格或区块等特定格式从设备读取信息以及向设备写入信息。该设备可以是本地设备、远程设备或在云设备。大型数据存储通常分布在不同地理位置的多个物理设备上。软件系统和服务抽象了数据存储的基础操作。
下面是一些物理设备示例。不同类型的数据存储设备提供不同程度的安全性和冗余。
闪存和 SSD 驱动器
固态硬盘(SSD)是一种半导体技术,可以在闪存芯片中写入和读取数据。在成为普通硬盘(HDD)的替代品之前,闪存技术已可商用于笔式驱动器。与 HDD 相比,物理 SSD 没有移动部件,这意味着其性能更佳且使用寿命更长。
混合存储阵列
混合存储阵列是一种物理存储设置,由 SSD 和 HDD 组成。虽然 SSD 提供低延迟操作,但其单位存储成本比 HDD 高得多。因此,组织使用混合存储阵列来平衡性能、容量和成本。
RAID
RAID 代表独立磁盘的冗余阵列。这是一种将相同数据保存在 SSD 上多个位置的技术。
有哪些不同的数据存储格式?
数据存储旨在处理和组织不同格式的数据。
文件存储
文件存储以自上而下的层次结构将存储的信息整理到文件和文件夹中。计算机使用文件存储让用户可以轻松地存储、搜索和检索信息。您可以使用文件存储系统来存储和组织几乎任何类型的数据。虽然文件存储易于使用,但由于其紧密连接的架构,很难横向扩展。
数据块存储
数据块存储将数据分成多个大小均匀的片段,这些片段称为数据块。数据块存储系统将不同的数据块存储在不同的物理设备上。当用户请求特定数据时,系统会检索并重新组合这些片段。该系统使用映射系统根据基块元数据定位请求的数据。元数据是帮助用户或应用程序在存储中查找特定信息的附加信息。
对象存储
对象存储将非结构化数据存储在可扩展、独立的存储库中,该存储库可以托管在不同的服务器上。属于某个对象的每个数据块都在其元数据中进行了描述。例如,对象可以存储社交媒体内容、视频、电子邮件和音频文件。应用程序通过使用视频分辨率、持续时间和位置等特定的元数据属性在对象存储中搜索信息。
有哪些不同类型的数据存储?
数据存储的类型较多,每种都具有独特的设置和特征。
直接附属存储
直接附属存储(DAS)由以物理方式连接到计算机的存储设备组成。例如,DAS 设置将硬盘驱动器、光盘或闪存驱动器连接到计算机。在 DAS 上创建备份副本相当简单,但与其他计算机共享数据很困难。
网络附属存储
网络附属存储(NAS)是一种文件专用的存储设备,可让应用程序和用户持续访问数据,以便通过网络有效协作。NAS 设备是专门用于处理数据存储和文件共享请求的服务器。这些设备为私有网络提供快速、安全且可靠的存储服务。
存储区域网络
存储区域网络(SAN)是一种使用不同类型的存储介质和协议的高速数据存储基础设施。企业使用 SAN 可轻松扩展数据块存储,且经济实惠。SAN 使用存储虚拟化向多个设备隐藏基础设施的复杂性。
云储存
云存储是由云提供商托管和管理的分布式存储基础设施。与本地存储相比,云存储的可扩展性和灵活性更高,且更易于远程访问。例如,用户只要有可用的互联网连接和访问数据的权限,就可以连接到 AWS 云存储服务。云存储还具有成本效益,因为用户只需为使用的容量付费。
混合云存储
混合云存储允许公司隔离本地和云存储服务之间的数据。混合云存储可帮助公司从旧式架构迁移到成本更低、更安全的云环境。
AWS 如何帮助您满足数据存储需求?
AWS 提供几十种云存储服务以满足您的数据存储需求。此外,您可以选择在 Amazon Elastic Compute Cloud(Amazon EC2)实例上托管任何所需的内容。要选择最符合您需求的 AWS 云存储服务,您需要执行以下操作:
- 将您的系统划分到各个工作负载。
- 确定最适合特定工作负载的数据存储机制,而不是适合整个系统的单个数据存储。
- 通过进一步优化成本和性能,找到最适合您的数据存储服务。
例如,Amazon Relational Database Service(Amazon RDS)对于希望建立和扩展关系数据库的组织而言是一种热门选择。该服务为应用程序提供具有高可用性的云数据存储,用于存储持久性运营数据。Amazon RDS 提供了一种自我管理的数据库预置解决方案,可将开发人员从繁琐的存储基础设施设置中解放出来。
立即注册 AWS 账户,在 AWS 上开启数据存储之旅。