Netflix 徽标

AWS 上的 Netflix

Netflix 是世界领先的娱乐服务公司之一,在 190 多个国家/地区拥有超过 2.6 亿的付费会员。 Netflix 使用 AWS 来满足几乎所有计算和存储需求,包括数据库、分析、建议引擎、视频转码等数百种功能,总共使用 AWS 上 100000 多个服务器实例。

执行摘要

Netflix 为这个世界带来了无限欢乐,全球各地数以亿计的观众能够在 Netflix 看到各种电视连续剧、电影和游戏,覆盖的语言范围超过 30 种。Netflix 在工作的方方面面都融入了多元化、包容性、平等和全球化视野。通过打造富有勇气、同情心和好奇心的文化氛围,Netflix 得以实现快速发展,从而更好地与世界各地的会员们分享新奇的故事。Netflix 依靠亚马逊云科技来实现快速创新,并持续提供一流的娱乐项目。亚马逊云科技为 Netflix 提供了计算、存储和基础设施,让公司能够快速扩张、安全运营,从而满足世界任何一个角落的功能需求。此外,作为一家领先的内容制作商,Netflix 借助亚马逊云科技的服务打造了云中的工作室。这个虚拟工作室让 Netflix 得以接触到顶尖的艺术人才,无需受到地理位置的影响。与此同时,Netflix 的艺术家和合作伙伴们能够在其中自有合作,不用担心技术或地理所带来的阻碍。

客户案例

AWS Fix This 播客上的“激发创造力并与 Netflix 合作”

2022 年

了解 Netflix 如何使用 AWS 构建灵活的远程工作站,以吸引和留住现在几乎可在任何地方进行协作的创意人才。

收听此集内容

Netflix 以采用 AWS Local Zones 的低延迟工作站助力远程艺术创作

2022 年

Netflix 通过远程工作站以及提供更贴近艺术家的无缝内容创作体验,致力于在全球范围内促进艺术家和内容创作者之间的合作。了解 Netflix 如何利用 AWS Local Zones 部署更贴近艺术家的视觉效果工作室,帮助实现单位数毫秒级延迟并保持远程工作站顺畅运行,从而达成上述目标。

阅读案例研究

全球生产,ft.Netflix

2021 年

在 SIGGRAPH 2021 的这个主题演讲中,Netflix 产品和动画总监 Laura Teclamariam 和 Netflix 工作室工程总监 Rahul Dani 讨论了今天的内容生产是如何真正全球化的,以及这对故事讲述者意味着什么。 

观看视频
创新勇气:对 Netflix 的包容性策略副总裁 Vernā Myers 的访谈

创新勇气:对 Netflix 的包容性策略副总裁 Vernā Myers 的访谈

2021 年

Netflix 是一家信奉发明和再创造的公司。Netflix 的包容性策略副总裁 Vernā Myers 分享了 Netflix 文化背后的一些秘密,阐述了勇于创新的重要性,公司是如何实现多元化、包容性和公平性的,以及好奇心为什么是创建包容性文化的最重要特征之一。

观看视频

polygon background, polygon abstract vector

借助新的 Amazon EC2 G5 实例,我们可以预置更高端的图形工作站,与配备 EC2 G4dn 实例的工作站相比,这些工作站提供高达 3 倍的性能。借助 G5 实例,内容创作者可以自由地为观众创建更复杂、更逼真的内容。” 

Stephen Kowalski
Netflix 数字制作基础设施工程总监


在云中制作“王冠”

2021 年

Netflix 的剧集《王冠》第四季的制作面临着意想不到的挑战,因为新冠肺炎疫情,世界进入了封锁状态,而当时正值后期特效工作开始的时候。通过在 AWS 上采用基于云的工作流程,Netflix 内部视觉特效团队的 10 名艺术家在短短 8 个月内就完成了该季 10 集剧集的 600 多个视觉特效镜头,这些工作全部都在远程完成。 

阅读博客
阅读“王冠”案例研究

通过在 AWS 上采用基于云的工作流,“王冠”的内部 VFX 团队能够在短短 8 个月内以远程办公的形式完成超过 600 组镜头拍摄。

Netflix 采用 AWS 的 NICE DCV 来为世界各地的艺术家打造云中的 VFX 工作室

2021 年

Netflix 在 2012 年扩展业务,进入内容生产领域,现如今已成为世界首屈一指的工作室。该公司致力于打造持续创新的文化,希望能够在云中打造视觉效果 (VFX) 工作室,以吸引世界顶级的 VFX 及动画艺术家,并与全世界的团队实现无缝合作。 借助 NICE DCV 和 Amazon EC2 G4 实例,Netflix 在同时兼顾响应能力和图像质量的前提下打造出了远程工作站。了解 Netflix 如何在 1 年内完成从测试到发布的整个流程,为艺术家消除技术和地理壁垒的同时优化成本。 

阅读案例研究
Netflix 如何看待网络安全

Netflix 如何看待网络安全

2020 年

AWS 首席信息安全官 Steve Schmidt 与 Netflix 信息安全副总裁 Jason Chan 在一起就安全战略、构建安全程序、零信任和猫作为一种独特的威胁模型进行了讨论。

观看视频

polygon background, polygon abstract vector

和其他家庭娱乐服务一样,Netflix 在这一前所未有的时期获得了暂时性的观看量增加和更多的会员增长。为了满足这一需求,我们的控制平面服务需要快速扩展。就是在这里,AWS 的价值和我们强大的合作关系体现得淋漓尽致,无论是在满足计算和存储的容量需求,还是提供必要的基础设施(如 AWS Auto Scaling)方面,这在 Netflix 的运营模式中已经根深蒂固。”

Nils Pommerien
Netflix 云基础设施工程总监


Netflix 使用 Amazon Simple Email Service 与 190 个国家/地区的 1 亿客户建立联系

2020 年

在迁移到 Amazon Simple Email Service (Amazon SES) 之前,Netflix 维护并使用内部解决方案发送电子邮件。该解决方案有自己的运维开销,包括运行带有电子邮件传送软件的专用服务器,并为每个 Internet 服务提供商优化电子邮件发送实践。Netflix 需要一个灵活、经济实惠、高度可扩展且可覆盖全球的电子邮件解决方案。了解 Netflix 如何利用 Amazon SES 克服这些挑战以及公司通过使用这项服务所实现的利益。

阅读案例研究

polygon background, polygon abstract vector

在迁移到 Amazon Simple Email Service,Netflix 不得不维护并使用内部解决方案来发送电子邮件。该内部解决方案有自己的运维开销,包括运行带有电子邮件传送软件的专用服务器,并为每个 Internet 服务提供商优化电子邮件发送实践。我们评估了多个电子邮件传送解决方案,然后决定选择 Amazon SES,因为它灵活、经济实惠、高度可扩展,覆盖全球,并承诺确保出色的送达率。”

Devika Chawla
Netflix 消息收发和联络工程总监


架构

Netflix 借助 Amazon Route 53 实现多区域弹性

当您需要将 8900 万观众移动至不同 AWS 区域时会发生什么? Netflix 在 AWS 上构建的基础设施使超强弹性成为可能,即使是同时在多个 AWS 区域中运行服务时也是如此。在《这就是我的架构》这一集中,Netflix 性能和可靠性策划总监 Coburn Watson 介绍了其公司的 DNS 架构,该架构建立在 Amazon Route 53 之上,并通过 Netflix 的 Zuul 进行了增强,从而使团队能够在不到 40 分钟的时间内清空整个区域。

观看视频 

了解 AWS for M&E 如何通过任何云端专用程度最高的功能变革媒体工作负载。

其他资源

RE:INVENT

2020 年
使用 ConsoleMe 理清多账户管理
在 Netflix,云基础设施安全团队管理着数百个账户的权限。在本节课中,我们将了解 Netflix 创建的一个名为 ConsoleMe 的工具,该工具旨在安全解决这个问题,减少终端用户体验到的不一致和延迟,并降低多账户管理负担。ConsoleMe 通过将 Netflix 云资源显示在一个界面中简化权限管理。它提供一个多步骤的、动态的自助式工具,用于确定权限,自动生成资源策略,并使用 Zelkova 智能地应用低风险权限请求。
观看视频 
RE:INVENT

2020 年
设计更好的机器学习系统:来自 Netflix 的经验
Netflix 的数据科学远超同名推荐系统,触及了业务的方方面面,从优化内容交付到打击欺诈不一而足。Netflix 独特的文化为其数据科学家在工具选择上提供了非凡的自由,从而形成了一组不断扩展的机器学习方法和系统。2019 年,Netflix 对其以人为中心的 ML 平台 Metaflow 进行了开源。在本节课中,Netflix 分享了其多年来在 Metaflow 中构建 ML 系统的经验。
观看视频 
RE:INVENT

2020 年
Netflix 如何使用 Spinnaker 和 Kubernetes 简化交付即代码服务
软件交付起初看起来可能很简单。第 1 步:构建代码。第 2 步:部署应用程序。第 3 步:结束。复杂性通常不请自来地潜入我们的过程,伪装成扩展、测试、审计和共享。在本节课中,Netflix 和 AWS 将讨论一个开源持续交付工具 Spinnaker,该工具有助于从强制性的管道和阶段混合过渡到对最终目标的更具声明性的描述,并恢复“愉快的”“交付”过程。
观看视频 
RE:INVENT

2019 年
Netflix 工程师的一天
Netflix 是一个庞大的、不断变化的生态系统,通过基于云的系统和全球分布的 CDN 为全球数百万客户提供服务。这个通过技术堆栈讲述的有趣影片介绍了我们如何思考和设计系统、Netflix 如何应对运营挑战,以及其他组织如何应用我们的思维过程和技术。在本节课中,我们将讨论运营一家全球流媒体公司所使用的技术、规模增长、数十亿指标、生产混乱带来的好处,以及文化如何影响速度和正常运行时间。
观看视频 
RE:INVENT

2019 年
Netflix 的 ML 基础设施:更多的数据科学、更少的工程
Netflix 以其独特的文化而闻名,它给每个工程师和数据科学家提供了极大的自由。我们的数据科学家有望自主开发和运维大型机器学习工作流,而不需要在系统或数据工程方面拥有丰富的经验。取而代之的是,我们为他们提供了令人愉快的可用 ML 基础设施,他们可以使用这些基础设施来管理项目的生命周期。我们的端到端 ML 基础设施 Metaflow 专为利用 AWS 的优势而设计的:弹性计算;高吞吐量存储;以及动态的、可扩展的笔记本。在本节课中,我们将介绍以人为中心的设计原则,它们使我们的工程师享有自主权。
观看视频 
客户视频

2018 年
Netflix 在迁移到云方面的经验
在本视频中,AWS 云架构战略副总裁、前 Netflix 云架构师 Adrian Cockcroft 分享了 Netflix 是如何开始其云之旅的。一次为期两天的中断揭示了 Netflix 迫在眉睫的容量危机,促使它探索云服务提供商,最终选择了 AWS。首先,Netflix 采用了 Amazon EC2 和 Amazon S3 作为基础计算和存储服务。然后,该公司稳步扩大了向 AWS 的迁移,从前端应用程序开始,然后从 Oracle 迁移其数据库,以及其他后端基础设施。现在,Netflix 完全依靠 AWS,用完全基于云的架构为其 1 亿多用户提供支持,不再管理自己的数据中心。
观看视频 
RE:INVENT

2017 年
Netflix 如何优化 Amazon EC2 实例实现高性能
Netflix 使用 Amazon EC2 实例类型和功能来创建高性能云,从而使其工作负载能够以接近在裸机上运行的速度运行。本会议总结了实现高速 Amazon EC2 实例的配置、调整和活动。Netflix 性能和 OS 工程团队的成员 Brendan Gregg 展示了如何选择 Amazon EC2 实例类型、如何选择 Xen 模式(HVM、PV 或 PVHVM),以及帮助实现近乎裸机性能的 Amazon EC2 功能(如 SR-IOV)的重要性。他还介绍了基础和进阶的内核优化和监控知识,包括 Java 和 Node.js 火焰图和性能计数器的使用。
观看视频 
RE:INVENT

2017 年
Netflix 如何进行大规模编码
在本次会议中,Netflix 探讨了编码服务采用的各种策略,以自动管理 Amazon EC2 预留实例的异构集合、解决计算争用以及根据优先级和工作负载分配实例。Netflix 编码团队负责将不同类型的媒体源转码为多种媒体格式,以支持所有 Netflix 设备。对这些媒体源进行转码(包括运行计算密集的视频编码、大量图像和文本的低延迟处理等)需要计算资源。编码服务可能需要一瞬间将数十万个计算小时数分发到最需要的地方。
观看视频 

来自 AWS 外部

HPC Tech 短片

Netflix 如何使用来自 AWS 的 NICE DCV 来支持分布式创意人力资源
Netflix 有一个雄心勃勃的目标,即创造比任何其他工作室都多的内容,并为多元化的全球故事讲述者社群提供支持。这意味着要通过解决方案支持艺术家、编辑和其他创意人员,让他们在世界任何地方都能轻松使用强大的计算能力:这是 NICE DCV 的理想状态,也是 AWS 提供的全球分布式基础设施。
观看视频 
Netflix

Netflix 的工程师们如何支持内容创建
听听 Netflix 存储和数据集成工程经理 Ionnis Papapanagiotou 的演讲,他将介绍 Netflix 平台工程如何支持工作室和内容运营,以及 Netflix 如何使用 Amazon S3 处理媒体存储基础设施和资产管理。
观看视频 
Netflix

Netflix 技术博客:使用 Metaflow 和 AWS Step Functions 拆分数据科学工作流
了解 Netflix 如何利用 AWS Step Functions 作为其第一开源生产调度器,在保持高可用性的同时减少运营负担。
参阅博客 
Netflix

Netflix 技术博客:ConsoleMe:AWS 权限和访问的中央控制面板
云技术已迎来了爆炸式增长——这使得动态创建基础设施已变得比以往任何时候都更容易——但这意味着需要不断增加的支持负担来确保正确的安全身份验证和授权、云卫生和可扩展的流程。了解 Netflix Cloud Infrastructure Security 如何通过开源两个用于管理多账户 AWS 权限和访问的新工具,来帮助解决这一挑战:ConsoleMe 及其 CLI 实用程序 Weep。
阅读博客