24 10月, 2025
Bloomberg 和 CNBC 評論員 Bob O'Donnell 探討民主化資料分析和儲存影響
持續關注科技業趨勢的人一定都會記得「大數據」的概念。這個概念是企業匯集所有可用的資料來源,包括傳統文件、電子郵件、業務流程資料、銷售成果、客戶資料庫、影片、聊天紀錄等,接著利用這些資料來挖掘有意義的見解,以強化組織能力。
理論上,這個概念是合理的,所以大家期望都很高。當各種的資料來源組合在一起,形成支持者假設的強大、有意義的混合體時,勢必會有許多隱藏的有用資訊和大量意想不到的見解。可惜在實踐中,結果卻大相逕庭。
首先,事實證明,要將公司的資料整理成某種結構,以有意義的方式組合或比較不同來源的資料,這件事相當不容易。不僅整合結構化與非結構化資料方面出現問題,重新格式化、匯入、連結及進行其他資料整理作業時也遇到一些困難。
然而,事實證明更不容易的是,嘗試分析他們可以確實存取的資料儲存。事實證明,在進階資料分析工具方面受過高度專業訓練的人 (即 SQL 專家) 才能組合出能活用這個龐大資料寶庫所需的極複雜指令可惜,許多人不知道該提出哪些類型的查詢,才能產生大數據所承諾的意想不到見解。而對問題方向有些概念的一般商業人士卻無法輕易產生查詢,導致雙方溝通出現落差,許多努力最終都付諸流水。
隨著生成式 AI 的應用日漸廣泛 (這項技術擅長從龐大的資料中發掘模式並產生創新想法),情況開始有了轉變。透過將組織的資料輸入到 AI 模型中 (無論是訓練自訂模型或自訂現有大型語言模型 (LLM)),組織現在終於能建立起原本就屬於大數據核心的龐大資料庫。更重要的是,利用這些模型的簡單聊天機器人式介面,現在已開放給組織內任何員工輕鬆使用。最終,大數據最初的承諾終將成真。從挖掘在第一線觀察趨勢的初級銷售人員,到研究具有某些關鍵指標的宏觀儀表板的高階主管,組織內各層級的員工現在都能利用生成式人工智慧 (GenAI) 取得海量的業務見解。
這對組織內的資料儲存影響巨大。過去有些組織可能會因為認為某些資料價值有限,而選擇棄用或將這些資料來源下線;但如今大家逐漸意識到,任何資料來源最終都有可能有助於發現意想不到的新見解與趨勢。因此,企業不僅要確保儲存所有產生的資料,還能將這些資料全部加以利用。
這一趨勢的關鍵推動因素之一是傳統的磁性硬碟機。由於 Seagate MozaicTM 等技術進步,現在硬碟機的單一碟片可以容納 3TB 的資料。將其擴展到企業資料中心或主機託管站點的機架式儲存系統,即可將單一 19 吋寬、73 吋高 (42U) 的機架空間轉換為高達 32PB 的儲存空間。透過啟用這些類型的儲存容量,組織可以非常有效率地儲存大量資料,從而讓他們將大量低容量硬碟機整合到更小、更節能的系統中,並確保硬碟機有足夠的空間進一步成長。
以更宏觀的角度來看,這些類型的大容量硬碟機非常適合整體儲存基礎架構。組織將繼續使用高速 SSD 來儲存其 GenAI 模型的最新版本和其他應用程式,其中記憶體存取速度的重要性超過容量需求。同樣,其他類型的 SSD 可能會用於 AI 聊天機器人、快速查詢儲存和其他中等要求的應用程式。然而,對於為這些自訂 AI 模型提供資料來源的許多資料的一般用途儲存而言,高容量硬碟機可提供最最佳化的特性組合,非常適合這類應用。
另一個關鍵因素是這些資料儲存裝置的位置。出於成本和安全原因,大多數組織會將大部分資料保留在自己的防火牆後,而放在不是雲端。這對於部分存取頻率較低、但現在能透過新的模型訓練與自訂工具更輕鬆地整合進 AI 模型中的資料來源而言,顯得特別重要。隨著組織開始建立自己的 AI 模型,建立自己的內部 AI 基礎架構來訓練、自訂和託管其中一些模型的趨勢大規重新興起。Dell、HPE、Lenovo 和 Cisco 等公司都發現,針對企業設計且配有 GPU 的伺服器需求大幅成長,而 Nvidia 也一直在談論企業 AI 工廠的崛起。結果是,大家重新燃起興趣,開始想建立企業資料中心及其所需的所有運算、網路和儲存資源。
隨著這些硬體元件陸續就緒,再加上 GenAI 模型和工具能力快速擴展、使用量日益成長,我們最初期待的能提供有意義見解的大數據願景終於得以實現。雖然並非所有的努力都會帶來靈光乍現的神奇見解,可明顯看出,GenAI 應用的最令人意外和最有用的結果:資料分析的真正民主化,已經出現並開始帶來影響。
President and chief analyst of TECHnalysis Research, Bob O’Donnell is a regular guest on Yahoo Finance, Bloomberg and CNBC.