保護資料安全:從信任根到溯源追蹤
人工智慧 (AI)、機器學習 (ML) 和雲端運算從根本上改變了 IT 的風險模型。企業資料歷來儲存在集中式架構上,處於公司企業實體的控制範圍內,但如今資料儲存的地點經常轉向邊緣或雲端等其他位置。分散式和組合式的架構,徹底改變了威脅模型。因此資料協調架構必須納入其他安全措施,例如硬體式信任根和開放式安全解決方案,才能提供超越實體資料中心能力範圍的安全性。
Seagate 資料安全性研究人員 Manuel Offenberg 表示:「以邊緣為例,威脅模型也包括未經授權以實體方式接觸設備,甚至可能沒人目擊到發生過程。」
現今的企業資料儲存在公共和混合式雲端上。資料在遠端裝置上產生,從遠端裝置上傳輸。一家企業無法完全透過實體方式妥善保護使用的所有裝置、網路設備和其他分散式架構。
因此更需重視如何保護分散式架構上存在的資料。許多普遍使用的安全控管措施都很適合用於保護機密性。強力的加密措施能保護處於傳輸狀態和存放狀態的資料。像訊息摘要這類加密工具,有助於保護資料的完整性。
但隨著 AI 和 ML 的重要性逐漸上升,也更加需要確保資料的真實性。
長久以來,可利用系統和軟體漏洞的工具陣容不斷擴大,如今攻擊者還能透過全新方式入侵我們的系統,也就是攻擊 ML/AI 系統。只要駭入饋送到這類系統中的資料,攻擊者就能惡意利用 ML/AI 技術中的弱點。
但 ML/AI 也能協助對抗駭客。在許多案例中,都會使用 ML 演算法來偵測惡意行為。以信用卡產業為例,ML 技術便應用在分析大量的合法和詐欺交易上。用於訓練演算法的資料範本可能是由許多屬性組成,例如購買的產品類型、交易位置、付費金額,以及與客戶和商家有關的特定屬性。ML 演算法會辨識資料模式,而能區別合法交易和詐欺交易。
此外,如 Offenberg 所述,訓練 ML 模型時會使用到「人工或對抗式的機器學習,這種全新方式可用來訓練其他機器學習系統,學習辨識人類意想不到的潛在攻擊方式。」
假設有個攻擊者取得了信用卡交易的歷史資料,然後修改或插入新資料,導致演算法發生誤判,將某些詐欺交易視為合法交易。這種對訓練資料下毒的手法,相當難以偵測。這種手段與應用程式原始碼的後門不同。我們能透過檢查程式碼或其他方式來找出後門,但 ML 模型的呈現形式,人類幾乎不可能一看就能理解。深度學習方面尤其如此。深度學習模型可能會由許多層大量參數組成,藉此推動複雜的運算陣列,再做出某項交易是否合法的判斷。
透過建立資料溯源並結合安全信任根的方式,可建立起框架,在資料受到使用前先偵測出資料篡改行為,在此例中的資料便是用來訓練模型。Offenberg 表示:「從這類對 ML/AI 資料的攻擊,可看出全新一代安全性隱憂的存在,而我們對其尚未全盤理解。」
透過信任根來改善硬體安全性,有助於緩解這類對 ML/AI 資料的新型攻擊,保護資料的運算作業,並在資料生命週期內全程持續進行資料溯源。信任根指的是任何受到無條件信任的連線裝置基本安全組件。其可提供隱含式的信任功能,讓其餘系統能藉此確保安全性。
信任根是能夠提供各種安全服務的安全要件,包括系統啟動完整性和強力加密功能,以供作業系統和系統上運作的應用程式使用。使用信任根可提高系統安全性,該系統所儲存和處理的資料,其信任度也會隨之提升。因為資料會在分散式系統中各處移動,受信任的元件可用來保護資料,而資料溯源服務則會從資料生成之時開始,持續記錄對資料所做的操作。
如今,系統採用分散式架構,加上資料用途日益複雜,資料溯源更顯重要。Offenberg 表示:「如果能知道資料在何時何地以何種方式建立,又是由何者所建立,我們就能持續追蹤資料,並確定『資料未受人為操縱且來源清楚』。若建立架構時是以安全資料溯源的概念為本,我們所四處挪動且最終會耗用的資料,便能達到更高的信任層級。」
任何資料協調策略都必須納入資料溯源,並且以受信任的運算平台為基底。以安全方式追蹤資料建立的時間、資料所有者的身分,以及建立資料的裝置,就有可能偵測到資料的變更。如此便形成了資料可信度的基礎。
開放式安全解決方案也是這類解決方案的一環,像 OpenTitan 專案便在建立參考設計,並輔以矽晶片信任根 (RoT) 的整合方針。像 OpenSSL 等其他的開放原始碼工具,則已受到廣泛使用。分散式架構的缺點之一,在於若未妥當完成整合作業,可能會暴露其他弱點。同樣道理,光是依靠開放原始碼解決方案的安全性,而未多加理解也未按照整合指導方針進行,也可能會產生弱點。針對 OpenSSL 的心血漏洞攻擊便是明顯的開放原始碼程式庫漏洞範例,導致許多系統一夕之間毫無招架之力。整合開放原始碼專案時,公司組織務必要審慎對待並掌握所有資訊,尤其要特別注意安全性以及應用程式整合途中可能會一併產生的漏洞。
AI 和 ML 工作負載均需仰賴大量的多元資料。除了保護資料完整性之外,ML 從業人員需要能從大型資料存放區中辨識並擷取特定資料。因此反過來促進了進階中繼資料擷取與管理上的需求,包括標記或標示資料資源的能力。
分散式的系統終究無法依靠用於孤立資料中心的安全防護措施。在複雜的服務陣容之中,信任根和資料溯源的全方位安全協定也是其中之一,這些服務可協調資料生命週期、保護資料完整性,並依需求提供資料。
歡迎深入瞭解如何保護資料,並且透過 Seagate 的備份與復原解決方案達到最佳的資料實用性。
有資料才有 AI,而有大容量硬碟機才有資料。研究公司 Recon Analytics 的 2025 年的調查,讓這些深度分析資訊躍然紙上。