位處邊緣的資料

邊緣迷思

邊緣就在不遠處。

以距離和時間來看,邊緣都在不斷逼近。

邊緣絕非那種堪稱草率的被動式外圍網路,而是處理資料分析、管理、甚至儲存的忙碌場所。發明家 David McCrory 將朝向邊緣的遷移行動稱做邊緣對資料的引力,這樣的遷移正在讓各行各業改頭換面,開啟全新的市場機會。在一份 2018 年 10 月發表的報告中,McKinsey & Company 舉出了 107 種不同的邊緣用途,預估到 2025 年邊緣運算的潛在價值會在 $1,750 億美元到 $2,150 億美元間,這個數字還只計算了硬體公司的數值。

若企業盼望開發利用從前無法運用的資料價值,就絕對不能忽視即將來臨的全新邊緣用途。

若企業盼望開發利用從前無法運用的資料價值,就絕對不能忽視即將來臨的全新邊緣用途。

大多數企業都已經逐漸對現實情況醒覺,如同 Gartner 分析師 Thomas J. Bittman 所述:「我們必須擴大自己的思考模式,不能再侷限於集中化處理和雲端,而是要朝向邊緣位置和分散式處理發展,追求低延遲和即時的處理能力。」不過對於並非專精科技的人來說,學習過程理所當然不太容易。

有些誤解不意外地會混淆人們的邊緣的瞭解。接下來看看最常見的三大迷思,以及迷思與現實的差異。

迷思 1:邊緣將會吞噬雲端。
分散式運算日益強大,因此有些創投家開始轉換優先順序,有些人則提出了激烈的預測。其中一項值得注意的預測出現在一場 2017 年的演講中,題目為「回歸邊緣,雲端運算告終」(Return to the Edge and the End of Cloud Computing),由企業投資者 Peter Levine 於將近兩年前提出。Levine 表示由於機器學習和物聯網取向的運算轉移是從雲端朝向邊緣,可以據此看出雲端將「在不遠的將來」消散殆盡。同年 Gartner 副總裁暨分析師 Thomas J. Bittmanu 也提出類似的警告。「邊緣將會吞噬雲端」 即是該篇文章中過於空泛的預測,文內提及運算的轉移會朝向「邊緣位置和分散式處理發展,追求低延遲和即時的處理能力」。

現實情況:邊緣和雲端的發展相輔相成。
最近的 IDC 研究之所以預測 2025 年全世界會有 30% 的資料需要即時處理,有幾項確切的原因。舉個簡單的範例:自動車輛 (自動駕駛車輛) 和連網車輛 (這類車輛會和其他車輛溝通交換大量資料,但不會為駕駛員下判斷)。兩者均是相當直覺的邊緣使用案例。如果連網車輛或自動駕駛車輛的感應器發現有個小孩在馬路中間玩耍,而有另一台車很可能從另一邊闖紅燈衝過來,這項資訊就需要迅速處理。此時已經沒有幾毫秒的空檔時間可以浪費,來不及將深度分析資訊傳回雲端加以處理。資料必須在當下採取行動。

Levine 指出這類攸關性命的資料,必須在端點進行處理 (通常採取機器學習的方式),這點正確無誤。但 Levin 演講的標題不太妥當。Levin 甚至也在那場演講中,親自承認「重要的資訊仍會儲存在集中式雲端上」,並表示雲端會成為各類資料的學習中心,實現集體的機器學習,而機器學習需要用到大量資料和自邊緣匯集而來的深度分析資訊。Gartner 的 Bittman 也承認「雲端有其用處」。

所以邊緣並不會超越雲端,而是要求雲端將觸手伸向邊緣。

「邊緣或雲端哪方會勝出?」並不是合適的問法。應該問的是「雲端和邊緣將會如何互相搭配?」或者說「邊緣和雲端將會如何彼此合作?」

「邊緣或雲端哪方會勝出?」並不是合適的問法。應該問的是「雲端和邊緣將會如何互相搭配?」或者說「邊緣和雲端將會如何彼此合作?」

對於能從集中式處理獲益的應用環境而言,超大規模資料中心的模式仍運作良好,像是大規模歸檔、內容散佈、應用程式儲存、快速原型設計等,均屬此類用途。

不過特定類型的雲端也確實在隨之弱化。Seagate 與 Vapor IO 共同發表的 2019 年度報告〈位處邊緣的資料〉指出,Vapor IO、Edgeconnex 和 DartPoints 這類公司正在改用微型模組化的資料中心,也稱做邊緣資料中心。這種小規模、地區性、自給自足、成本低的自動化「微型地區資料中心位在網路的邊緣,位在各種嶄新的位置,例如停車場、市政路權控管、行動電信基地台等。」根據另一位微型資模組化資料中心發明家 Dell EMC 的看法,這類邊緣叢集的設計要能承受得住外圍在環境和安全方面的挑戰,必須擁有「足夠的運算效能,能夠不靠集中式資料中心,獨立彙整和處理資料」。雲端暨邊緣運算基礎架構供應商 Packet 則稱呼這類供應項目是「隨處可用」的雲端。

矛盾的是,邊緣可以視為雲端自然發展而成的結果。雖然按 Telefonica 副總裁 Patrick Lopez 的說法,雲端達成了「網際網路的民主化」,實現了視訊串流和遊戲活動,但「我們認為接下來的時代屬於邊緣。」

Lopez 表示:「邊緣運算基本上是集雲端和電信的優點於一身。所謂雲端的優點在於,邊緣運算會囊括所有雲端服務,將雲端服務帶往更靠近使用者的地方。而電信的優點則在於能立即供應、時時開機、時時連網的能力,這是電信技術最知名的一點。」

迷思 2:邊緣只有一種。
畢竟大家常常把邊緣說得就像只有一種,不是嗎?

現實情況:邊緣有許多種。
這個說法對,但也不對。但這並非是說法不同的問題。

統稱邊緣的時候,指的是在靠近資料的建立位置處理資料的生態系統。但邊緣也確實有很多種類。

這個意思是,網路的數量不斷增加,而外圍網路邊緣的數量也在成長,內有執行使用者感興趣的各種應用程式的端點。有些甚至會嘗試確定數目,為了好玩而找出可能達到的數字上限。

有項重要的現實情況更是加深了複雜度:所有邊緣網路都端看用途為準。

有項重要的現實情況更是加深了複雜度:所有邊緣網路都端看用途為準。

邊緣網路可能是在田野間的穀倉運作,也可能位在連網車輛內,或是其他各式各樣的位置。

特別建置的邊緣,肯定不久後就會出現。隨著時間過去,邊緣將會邁向雲端化的客製化做法,但可能僅限於軟體層。如同 Telefonica 的 Lopez 的說法,普遍的存取能力和應用程式開發的簡易性,都屬於雲端的特色,但也會成為邊緣不可或缺的要素。如果開發出能在一種邊緣運作的應用程式,這個應用程式就應該也要能部署在任何網路上。

迷思 3:把雲端縮小放進盒子裡,邊緣就出現了!
我們已經建立了一種概念,有些儲存和處理作業需要在邊緣進行。而雲端環境有些特質,一定會希望複製運用到各式各樣的邊緣上,例如於某個邊緣網路開發的應用程式,必會期待在不同的邊緣網路上具有相同的網路存取能力和相容性。這樣邊緣不就是個小型的雲端?

現實情況:邊緣並非小型雲端。
別忘了,邊緣的誕生,起因為資料和資料的需求,而非相反。

邊緣之所以並非小型雲端的原因,首先就在於邊緣是完全由資料驅動。

邊緣之所以並非小型雲端的原因,首先就在於邊緣是完全由資料驅動。

邊緣的形體取決於用途,因為其用途而需要在使用者附近產生和處理資料。

而邊緣的用途極為廣泛。像是智慧城市中公用設施的管控、虛擬實境的場景、老舊橋樑監測、透過虛擬助理在工廠製衣的機器人等等。在這類環境中產生,而需要於邊緣處理的資料,也是各不相同。因此邊緣基礎架構取決於應用環境。

如同前述,邊緣的空間和時間也不足以處理特定類型的資料。根據 Levine 的說法,超大規模資料中心中的歸檔資料,或是大量機器學習程序所需的資料 (資料集區、教導機器學習演算法的大型資料叢集),並無法在邊緣發揮作用。

邊緣並非小型雲端的最後一點原因,則是因為邊緣是遠端控制的自動化作業,以實體靠近使用者為特色。邊緣與雲端不同,是以其位置和靠近資料的程度來判別。

與集中式且同質性高的通用資料中心樞紐不同,各個邊緣都專注於處理特定問題。

至少目前尚為如此。