Saat skala menuntut performa: Cara penyedia layanan cloud global mencapai kedua kebutuhan dengan hard disk
28 Jun, 2025
Karena persyaratan multi-sewa dan performa tinggi membentuk kembali infrastruktur data, salah satu perubahan yang paling penting terjadi tidak hanya di kluster pelatihan, tetapi juga dalam sistem yang merespons miliaran interaksi pengguna secara real time.
Di salah satu raksasa internet terbesar di dunia1, arsitek infrastruktur baru-baru ini mulai menata ulang beban kerja utama yang terkait dengan keterlibatan pengguna: infrastruktur caching yang mendukung aktivitas komentar media sosial (yaitu, lapisan data sementara yang memungkinkan akses cepat ke konten yang sering diminta). Taruhannya tinggi—volume lalu lintas yang melonjak, konkurensi tinggi, dan permintaan baca/tulis yang tinggi—begitu juga kebutuhan untuk mengurangi biaya dan energi dalam skala besar. Tim mengidentifikasi solusi strategis namun tidak konvensional: tingkat cache berbasis hard disk, yang dibuat di hard disk perusahaan Seagate berkapasitas rendah.
Lapisan ini oleh sebagian orang dianggap memerlukan flash, tetapi analisis beban kerja menunjukkan bahwa hard disk memenuhi tuntutan performa sekaligus menawarkan manfaat biaya dan efisiensi yang signifikan, terutama untuk beban kerja inferensi dan penahapan data, yang biasanya lebih dibatasi oleh biaya, daya, dan skala. dibandingkan dengan latensi mentah.
Arsitektur ini menggambarkan apa yang mungkin terjadi saat keputusan infrastruktur didasarkan pada perilaku beban kerja yang sebenarnya, dan bagaimana hard disk—bila digunakan secara strategis—dapat memungkinkan operasi yang berperforma, terukur, dan hemat biaya pada skala global.
Sasaran beban kerja yang menjadi fokus adalah untuk memungkinkan akses yang cepat dan andal ke data komentar pengguna selama keterlibatan konten viral—tantangan yang dengan cepat menjadi kompleks dalam skala besar. Namun volume dan volatilitas permintaan membuatnya menjadi sesuatu yang tidak biasa.
Saat sebuah konten menjadi viral, interaksi langsung melonjak. Ribuan hingga jutaan pengguna dapat membanjiri satu utas dalam hitungan menit—menyukai, membalas, menyegarkan, dan memposting ulang. Sistem harus mendukung aktivitas baca dan tulis objek kecil yang cepat, memuncak dengan tajam, lalu turun dengan cepat. Dan meskipun penting, performa hanya memberikan nilai saat kemacetan sistem memungkinkan performa tersebut digunakan.
Arsitek platform diperlukan untuk mendukung:
Tiering panas/dingin tradisional tidak efektif untuk pola dinamis semacam ini. Dan meskipun flash dapat memenuhi kebutuhan performa, profil biaya, keausan, dan energinya membuatnya tidak berkelanjutan pada lapisan arsitektur ini.
Ini adalah asumsi umum bahwa lapisan caching—terutama untuk sistem yang menghadap pengguna—harus berbasis flash untuk memenuhi kebutuhan performa. Namun dalam kasus ini, analisis beban kerja mendetail mengungkapkan bahwa throughput (laju di mana data dapat dibaca atau ditulis per detik) dan konkurensi (kemampuan untuk menangani banyak permintaan simultan) adalah faktor pembatas dan bukan latensi tingkat mikrodetik. Hard disk berperforma tinggi dalam dimensi ini, dan dalam arsitektur tingkat sistem yang dirancang untuk memaksimalkan kekuatan ini—melalui paralelisme, strategi caching, dan tiering cerdas—hard disk dapat mengungguli penyiapan berbasis flash untuk beban kerja yang sama.
Dengan memanfaatkan kombinasi kekuatan ini, penyedia cloud dapat:
Di seluruh penerapan tersebut, hard disk perusahaan menawarkan biaya akuisisi per terabyte yang jauh lebih rendah—saat ini lebih dari 7× lebih murah dibandingkan SSD, menurut analisis penelitian Seagate oleh IDC, TRENDFOCUS, dan Forward Insights. Delta ini dapat sangat memengaruhi pilihan arsitektur—terutama jika efisiensi dan ketahanan cache merupakan bagian dari persamaan.
Arsitektur terakhir menerapkan hard disk perusahaan berkapasitas rendah Seagate sebagai lapisan caching persisten, dan menempatkannya di antara lapisan aplikasi utama dan lapisan cloud berbasis hard disk berkapasitas tinggi. Konfigurasi dibuat menggunakan enklosur yang telah digunakan tim di seluruh beban kerja lainnya, sehingga memungkinkan penggunaan kembali sistem yang efisien.
Berikut adalah cara kerjanya:
Hard disk di tingkat caching biasanya beroperasi dengan memprioritaskan diameter luar piringan mereka untuk ruang cache yang dapat digunakan, mengoptimalkan perilaku tulis, dan memaksimalkan performa efektif untuk kasus penggunaan.
Diagram arsitektur ini menggambarkan bagaimana caching berbasis hard disk, penyimpanan dalam, dan layanan aplikasi bekerja sama untuk menangani ledakan data viral secara efisien dan hemat biaya.
Penerapan ini menghasilkan peningkatan yang berarti dalam biaya infrastruktur dan efisiensi energi secara keseluruhan—sambil mempertahankan tuntutan performa tinggi dari beban kerja melalui hard disk yang dirancang untuk throughput yang berkelanjutan, ketahanan tulis, ketersediaan data di bawah tekanan, dan penerapan skala armada.
Sebagian besar beban kerja inferensi dan staging data lebih dibatasi oleh biaya, daya, dan skala daripada latensi mentah, sehingga hard disk praktis sesuai dengan tingkat arsitektur yang tepat.
Pada saat publikasi, arsitektur platform ini sedang digunakan secara aktif oleh pelanggan di seluruh wilayah geografis utama, dengan evaluasi berkelanjutan dari peluncuran yang lebih luas. Indikator awal sangat kuat: metrik performa cache tetap stabil, pengalaman pengguna tetap responsif, dan TCO ditingkatkan.
Jika hasil uji coba terus bertahan, platform dapat memperluas model ini secara signifikan—dengan potensi volume penerapan tahunan mencapai jumlah hard disk enam digit, yang mencerminkan permintaan lebih dari 6 EB per tahun dan keyakinan pada hard disk untuk menghadirkan performa dan efisiensi pada skala armada.
Ini bukan hanya pengoptimalan satu kali—ini adalah pola yang muncul untuk membangun berbagi gambar, mikroblog, video, dan konten lain yang lebih baik di mana konkurensi dan relevansi pengguna akhir hard disk persyaratan infrastruktur dan memungkinkan peningkatan profitabilitas platform.
Keberhasilan desain ini tidak bergantung pada satu terobosan, tetapi pada tiga prinsip inti yang akan selaras dengan pembuat platform AI lainnya:
Hard disk tidak "memenangkan" flash di sini—hard disk cukup masuk akal. Seperti inilah tampilan untuk menyelaraskan performa, biaya, dan efisiensi operasional di lingkungan dunia nyata. Di seluruh perusahaan dan infrastruktur cloud, mereka terus melayani sebagian besar beban kerja data yang paling penting untuk throughput, efisiensi, dan skala.
Untuk memenuhi kebutuhan performa, beban kerja modern memerlukan komputasi dan penyimpanan yang dapat diskalakan—terutama karena keberhasilan model bergantung pada relevansi pengguna akhir yang langsung dan berkelanjutan.
Karena AI dan beban kerja modern lainnya terus membentuk desain infrastruktur di seluruh industri, pertanyaannya bukanlah apakah akan menggunakan hard disk atau flash. Ini adalah cara membangun sistem yang mencerminkan perilaku beban kerja nyata, kendala nyata, dan peluang nyata untuk dioptimalkan.
penyedia layanan cloud global terkemuka ini membuktikan bahwa hard disk tidak hanya relevan—hard disk merupakan inti dari cara arsitektur modern berkembang ke skala, memastikan akses dan ketersediaan data yang responsif bahkan di bawah permintaan puncak.
Dianonimkan per NDA bersama.
45% of data created by IoT will be stored, processed, analyzed, and acted upon at or near the edge of the network by 2019. In order to enable the digital revolution, increases in affordable storage capacity and performance continue to be critical aspects of business growth.