為
後代保存 BBC 檔案內容
25 PB 資料
在 10 個月內完成遷移 (每日 120 TB);淘汰實體基礎設施
使用
Amazon S3 Glacier Instant Retrieval 和 S3 Intelligent-Tiering 降低整體基礎設施成本
優化
資料可用性並增強資料和內容的可存取性
具備
標準化儲存的資料湖基礎,為未來的擴充機會做好準備
概觀
英國廣播公司 (BBC) 檔案技術與服務團隊需要現代化的解決方案,用以集中化、數位化和遷移其歷經 100 年歷史、最為重要的檔案。該團隊希望合併其檔案,增強媒體的可保存性和可存取性以供將來使用。
由於 BBC 擁有使用 Amazon Web Services (AWS) 的經驗,因此該公司開始使用 Amazon Simple Storage Service (Amazon S3) Glacier Instant Retrieval,這是一種封存儲存類別,能以最低成本,儲存不常存取且需要在幾毫秒內擷取的長效期資料。透過將其檔案遷移到 AWS,BBC 優化了資料可存取性、創造了成本效益、釋放了實體基礎設施占用的空間,並支援了邁向未來檔案保存的轉型。
商機 | 使用 AWS 來保存資料並改善 BBC 的資料可存取性
BBC 檔案技術與服務部門負責保管 BBC 100 年來的檔案,擁有 1,600 萬筆資產,這些資產由該廣播公司自成立以來蒐集而得,包含遍佈不同時期的各種資料,從歷史影片到現代數位媒體。該團隊專注於三個目標:統一所有檔案的交付內容、透過數位化讓檔案更容易存取,以及使用現代解決方案來保存媒體。「我們希望擁有前瞻性的策略,利用彈性儲存和運算等工具來促進機器學習的應用。」BBC 檔案技術與服務部的產品和服務主管 Brendan Mallon 表示,「我們的目標是保護檔案中的內容,以便在未來的 100 年裡都能夠存取這些內容。」
這家廣播公司之前將其資料劃分為新聞、體育、廣播和節目等不同類型,並分開儲存。該公司希望將其供應鏈和工作流程標準化,以制定永續且集中式的檔案計畫。其以往在使用內部部署基礎設施方面非常順利,但於 2017 年,該公司意識到需要降低其系統的複雜性。而現有的、分散的資料集為公司增添了繁重且不必要的內容彙總工作。因此,該團隊展開了一項為期 5 年的任務,旨在整合各種儲存應用程式層,使其變得更具永續性。
由於 BBC 多年來一直在 AWS 上執行其媒體資產處理系統,因此公司的下一步,就是順理成章地遷移到可以為長期保存策略出一份力的 AWS 解決方案。「我們希望有一套一致的方法,用以從不一致的資料集中擷取價值、建立一個與媒體相符且可靠可信的目錄,並為我們的觀眾創造價值。」Mallon 表示,「藉助 AWS,我們可以將所有內容的儲存標準化。」
使用 Amazon S3 Glacier Instant Retrieval,我們可受益於加速的檔案擷取,同時享有成本靈活性。」
Mark Glanville
BBC 檔案技術與服務資深技術架構師
解決方案 | 每日遷移 120 TB 並藉由優化儲存降低成本
由於檔案資料規模龐大,網路遷移是最實際的自動化選項。為了完成內容遷移,BBC 使用了由 AWS Direct Connect 支援的既有基礎設施,這項雲端服務可協助使用者建立用於 AWS 的專用網路連線,以大規模、順暢且可靠的方式傳輸資料,並進行近乎即時的分析、快速資料備份或廣播媒體處理。在經過約 12 個月的規劃並諮詢 AWS 合作夥伴 Cloudfirst.io (Cloudfirst) 後,遷移作業於 2022 年 11 月展開。
團隊使用 AWS Direct Connect 將大量內容傳輸到 AWS,在效率最高的時候,甚至每天遷移了 120 TB 的資料。在 10 個月內,該團隊已將 25 PB 的資料傳輸到雲端。如此一來,BBC 得以淘汰公司其中一個舊有磁帶式媒體儲存庫,並在媒體資產管理系統和公有雲儲存之間開發下一代的抽象化工作。「我們能夠淘汰半數檔案的實體基礎設施。」BBC 檔案技術與服務部門的資深技術架構師 Mark Glanville 表示,「這在倫敦市中心一些寸土寸金的地段釋放了大量技術空間,同時達到節能效果。」
BBC 將其大部分資料遷移到 Amazon S3 Glacier Instant Retrieval。該解決方案為 BBC 檔案中儲存的各類資料提供了理想的彈性儲存類型。由於該團隊一直在 AWS 上執行其媒體資產處理系統 (該系統儲存了約 3 PB 的媒體),因此他們具有使用 Amazon S3 解決方案的經驗。「我們與 AWS 團隊合作,為我們的大部分內容選擇了最合適的儲存類別,」Glanville 表示,「使用 Amazon S3 Glacier Instant Retrieval,我們可受益於加速的檔案擷取,同時享有成本靈活性。」
該團隊將 Amazon S3 Glacier Instant Retrieval 和 Amazon S3 Intelligent-Tiering 結合使用,後者是一種雲端儲存類別,可自動節省儲存成本,而不會影響效能或產生營運負擔。BBC 可以根據其預期的存取頻率,在這兩個儲存類別之間選擇,而無需犧牲效能。
「使用 Amazon S3 Glacier Instant Retrieval 和 Amazon S3 Intelligent-Tiering,我們可以針對先前儲存在相對熱儲存中的內容,獲得類似封存儲存的定價模式。」BBC 執行產品經理 Tom Cartwright 表示,「這對我們來説有著莫大的價值,因為我們可以在專案初期就決定資料的儲存位置。」
成果 | 建立資料湖以創造機器學習機會
將 100 年以來搜集到的內容存檔後,BBC 如今可以專注於資料標準化和保存的未來發展。BBC 計劃透過藉由實體和數位資產的下一代資料湖來應對這項挑戰。BBC 希望藉助機器學習技術,利用語音轉文字和人臉辨識等工具來改善資料的搜尋。使用機器學習工具大幅增強了檔案的可搜尋性,讓搜尋任何內容都變得更加容易。其目標是實現保存性、可用性和創新性的提升,以便在未來 100 年持續為觀眾提供價值。
「我們的共同願景是為企業的永續發展做好準備。」Mallon 表示,「我們希望盡可能讓使用者更容易搜尋和存取我們的內容。」
關於 BBC
英國廣播公司 (BBC) 是一家擁有百年歷史的公共廣播機構,為英國和全球數百萬觀眾提供服務。該公司擁有龐大的多媒體資產組合,包括電視頻道、廣播電台網路、數位服務和新聞服務。
使用的 AWS 服務
Amazon S3
Amazon Simple Storage Service (Amazon S3) 是一種物件儲存服務,提供領先業界的可擴展性、資料可用性、安全性及效能。
Amazon S3 Glacier Instant Retrieval
Amazon S3 Glacier Instant Retrieval 是一種封存儲存類別,能以最低成本,儲存不常存取且需要在幾毫秒內擷取的長效期資料。
進一步了解 »
Amazon S3 Intelligent-Tiering
Amazon S3 Intelligent-Tiering 是唯一在資料存取模式變更時,可自動節省儲存成本的雲端儲存類別,且不會影響效能或增加營運開銷。
進一步了解 »
AWS Direct Connect
AWS Direct Connect 雲端服務是您獲取 AWS 資源的最短路徑。在傳輸過程中,您的網路流量保留在 AWS 全球網路上,永遠不會接觸公共網際網路。
進一步了解 »
更多媒體和娛樂客戶案例
開始使用
各行各業各種規模的組織每天都在使用 AWS 來變革其業務和履行其使命。聯絡我們的專家,立即開始您的專屬 AWS 雲端之旅。