正確的數據、正確的地點、正確的時間
08 12月, 2025
規模化之後,分層設計能帶來多重優勢。
人工智慧正在改變建構高效數據系統的意義。
三分之二的企業預計 GenAI 將增加儲存的資料量。但只有大約 三分之一 的人表示他們的基礎設施「完全針對 GenAI 進行了最佳化」。設計能夠支援人工智慧工作負載及其所需不斷增長的資料量的資料中心架構至關重要。
每個訓練的模型、每個分析的影片和每個改進的模擬都會產生大量數據,這些數據必須儲存和重複使用。架構和商業模式能否跟上資料創建的步伐?是的,這要歸功於分級定價。
資料分層確保資訊在正確的時間出現在正確的位置。這就是基礎設施如何在無需不斷手動調整的情況下平衡效能、規模和成本的方式。
分層不是為了等級制度,而是為了和諧。每一層都發揮著獨特的作用,它們共同使系統更快、更有效率、更具可擴展性和可持續性。
人工智慧驅動的應用程式產生的數據不會走直線——它會經過多個層級,被捕獲、處理、訓練、提煉和重新訓練,以釋放其真正的價值。分層儲存可以將無限的資料流轉化為優勢:它可以讓你更多的資料保持高效利用,而不是閒置。它能確保有價值的研究成果不會被埋沒。團隊透過策略部署、生命週期標籤和遙測技術對資料進行編碼。目標:保持工作集靠近計算,並保持深層集價格合理、經久耐用,且隨時可用。
只有當GPU能夠快速接收大量資料並保持高效運作時,它們才能真正發揮作用。現代硬碟系統可提供毫秒的反應速度-足以保證人工智慧訓練和推理的順利進行。記憶體和快閃記憶體負責緩存,而硬碟提供深度資料。這就是為什麼大約 85% 的雲端資料仍然儲存在硬碟上1:規模取決於容量,而容量又必須高且價格合理。
分層技術使得 PB 級的輸出資料能夠避免佔用高成本的基礎設施,或在訓練下一個模型之前遺失。它使重用成為可能:同一個資料庫今天可以用於訓練,明天可以用於微調,將來還可以用於治理審計。產能規劃不再是限制因素,而成為一種槓桿。
分層架構有助於企業優化利用現有基礎架構。它可以防止過度配置,減少空閒功耗,延長資產壽命。從系統層面來看,基於硬碟的分層架構具有顯著的整體擁有成本優勢。
更高的面密度——專為數據密集型應用而設計的硬碟——意味著每個主軸可儲存更多TB的數據,需要供電和冷卻的機架數量更少,每TB的能耗更低。其結果是在不犧牲速度或韌性的前提下,實現了更高的效率。
從規模來看,效率往往等同於永續性。將不常用的資料遷移到節能、高容量的儲存層,可以減少營運排放。
最近的系統級建模證實了這一點:與同等容量的固態硬碟機架相比,硬碟機架的功耗大約低四倍,隱含碳排放量大約低十倍。 2
循環利用實踐——例如翻新和重新部署驅動器或將稀土元素重新部署到供應鏈中——可以減少隱含碳排放並延長使用壽命。
更少的驅動器、更長的使用壽命和更少的浪費:這些都是分層儲存帶來的實際收益3。
人工智慧的數據足跡只會不斷擴大。分層架構是企業保持領先的方式,在需要的地方提供速度,在需要的地方提供規模,並在整個過程中保持永續性。
從大規模應用的角度來看,硬碟仍然是這種平衡的支柱:它能夠同時實現效能、價格和效率。
這就是分層如何實現規模化優勢的原則。它能在正確的時間將正確的資料儲存在正確的位置。
人工智慧的全部潛力需要資料——以及儲存這些資料的儲存系統。
雲端行銷資深副總裁
Big data analytics enable organizations to make informed, data-driven decisions.