27 Jan, 2025
Beban kerja AI menghasilkan volume data terstruktur dan tidak terstruktur yang sangat besar. Untuk mendukung siklus pelatihan, inferensi, dan pelatihan ulang, perusahaan membutuhkan penyimpanan yang terukur serta berkapasitas tinggi yang mampu menangani pertumbuhan data yang berkelanjutan.
Tidak ada kesuksesan AI tanpa kumpulan data.
Tidak ada kumpulan data besar tanpa penyimpanan data yang cukup dan efisien. Beban kerja AI menciptakan aliran data berkelanjutan—mulai dari kumpulan data pelatihan dan log inferensi hingga metadata, embedding, dan output model. Seiring dengan berkembangnya AI generatif dan model bahasa besar (LLM), volume serta variasi data perusahaan tumbuh secara eksponensial. Peningkatan skala yang pesat ini menuntut arsitektur penyimpanan yang mampu menangani pemasukan data secara konstan, akses berkecepatan tinggi, dan pelestarian yang andal dari waktu ke waktu.
Data mendukung AI dan hard disk berkapasitas besar mendukung data.
Wawasan ini menjadi fokus utama melalui survei tahun 2025 dari firma riset Recon Analytics.
Survei global ini memberikan rincian tentang cara perusahaan di berbagai industri menyesuaikan infrastruktur mereka untuk mendukung AI. Responden mewakili organisasi yang sudah menggunakan atau berencana menggunakan AI, menawarkan wawasan tentang kebutuhan penyimpanan, tantangan penskalaan, dan masa depan infrastruktur data perusahaan.
Survei global yang ditugaskan oleh Seagate menanyakan kepada 1.062 responden. Mereka adalah pembeli penyimpanan TI dan pembuat keputusan yang bekerja dalam peran infrastruktur penyimpanan untuk perusahaan yang melaporkan pendapatan tahunan lebih dari $10 juta, memiliki penggunaan penyimpanan saat ini lebih dari 50 terabyte (TB), telah mengadopsi AI atau berencana untuk mengadopsi AI dalam tiga tahun ke depan, dan berlokasi di Amerika Serikat, Tiongkok, Inggris, Korea Selatan, Singapura, Prancis, India, Jepang, Taiwan, dan Jerman.
Survei tersebut berfokus pada efek adopsi AI pada prioritas infrastruktur, retensi data, dan manajemen data. Hasilnya menjelaskan tentang cara AI akan memengaruhi kebutuhan infrastruktur selama tiga tahun ke depan.
Survei terbaru Recon Analytics mengungkapkan pergeseran penting dalam cara perusahaan merencanakan ekosistem data mereka untuk era AI. Alih-alih memperlakukan AI sebagai inisiatif yang terisolasi, organisasi kini mengevaluasi kembali strategi penyimpanan, alokasi sumber daya, dan desain infrastruktur jangka panjang sebagai respons terhadap percepatan penggunaan AI. Survei ini melihat cara para pemimpin TI global mempersiapkan diri untuk masa depan yang pertumbuhan data, persyaratan retensi, dan ekspektasi performa akan meningkat lebih cepat dari sebelumnya.
Pertama dan terpenting, survei menunjukkan bahwa penggunaan AI mendorong pertumbuhan eksponensial dalam hal permintaan penyimpanan data hingga tahun 2028.
Sebanyak 61% responden dari perusahaan yang sebagian besar menggunakan penyimpanan cloud mengatakan bahwa penyimpanan berbasis cloud di perusahaan mereka harus meningkat lebih dari 100%—yakni, harus berlipat ganda, selama tiga tahun ke depan.
Gambar 1. 61% responden yang perusahaannya terutama menggunakan penyimpanan cloud untuk manajemen data AI mereka berharap untuk meningkatkan persyaratan penyimpanan mereka sebesar 100% atau lebih.
Aplikasi AI mendorong pembuatan data yang belum pernah terjadi sebelumnya, sehingga semakin banyak data yang disimpan organisasi, semakin mereka dapat memvalidasi bahwa AI berfungsi seperti yang diharapkan. Dengan akses ke data perilaku, seperti kumpulan data pelatihan, pos pemeriksaan model, perintah, dan jawaban, perusahaan dapat memeriksa algoritma, serta memahami dan menyempurnakan pengambilan keputusan AI dengan lebih baik. Tanpa skala dan efisiensi pusat data, potensi AI akan terbatas, karena kemampuan untuk menyimpan dan mengambil kumpulan data besar sangat penting bagi kesuksesan AI.
Bukan hanya jumlah penyimpanan yang mendorong kesuksesan AI. Durasi penyimpanan data juga penting.
Industri seperti keuangan, perawatan kesehatan, manufaktur, dan operasi pemerintahan bergantung pada retensi jangka panjang untuk memenuhi persyaratan kepatuhan dan kebutuhan audit. Mempertahankan data historis memperkuat kerangka kerja tata kelola, mendukung pelaporan regulasi, dan membuat output AI lebih akurat dari waktu ke waktu.
Dari responden survei yang dipekerjakan oleh bisnis yang telah mengadopsi teknologi AI, 90% percaya bahwa retensi data yang lebih lama meningkatkan kualitas hasil AI.
Gambar 2. 90% perusahaan yang menggunakan AI saat ini percaya bahwa mempertahankan lebih banyak data historis akan meningkatkan akurasi model.
Temuan ini menunjukkan korelasi antara mempertahankan data untuk periode yang lebih lama dan wawasan AI yang lebih andal. Ini mungkin didukung oleh beberapa faktor. Pertama, pemrosesan berulang yang konstan merupakan bagian dari cara kerja algoritma AI. Output konten memberikan umpan balik ke model, meningkatkan akurasinya, dan mengaktifkan model baru. Kumpulan data mentah dan hasilnya menjadi sumber untuk pengembangan lebih lanjut dan alur kerja baru.
Menyimpan kumpulan data lebih lama juga memiliki fungsi penting bisnis lainnya: melindungi kekayaan intelektual perusahaan. Tindakan menyimpan 'tanda terima' dari kumpulan data dan proses asli model memberikan penjelasan hasil bila diperlukan (misalnya, sebagai bagian dari proses hukum).
Tanda terima ini menetapkan silsilah data, memastikan catatan yang jelas tentang data perjalanan yang diambil dari input hingga output. Silsilah data memungkinkan organisasi melacak asal dan penggunaan kumpulan data, sehingga model AI dapat dibuat dengan data yang akurat. Ini memungkinkan sistem AI sepenuhnya dapat diaudit serta mendukung kepatuhan terhadap peraturan yang ketat dan akuntabilitas internal.
Selain itu, perusahaan dapat memilih untuk menyimpan lebih banyak data lebih lama karena mereka menyadari bahwa saat ini mereka tidak dapat mengetahui wawasan baru dan berharga apa yang mungkin ditemukan oleh algoritma esok hari dari data kemarin. Retensi data yang lebih lama memungkinkan pemrosesan data lama dengan model AI yang belum dikembangkan. Karena alasan ini, retensi data yang lebih lama akan meningkatkan nilai bisnis yang dapat diberikan oleh AI.
Dalam temuan terkait, pembuat keputusan infrastruktur memandang retensi data yang diperluas sebagai hal yang penting untuk membangun kepercayaan, fondasi penting yang tanpanya wawasan AI tidak memiliki nilai.
88% responden yang perusahaannya menggunakan AI saat ini percaya bahwa adopsi AI yang tepercaya meningkatkan kebutuhan untuk menyimpan lebih banyak data untuk jangka waktu yang lebih lama.
Gambar 3. 88% responden yang perusahaannya menggunakan AI saat ini mengatakan bahwa penggunaan AI yang tepercaya memerlukan peningkatan kebutuhan untuk menyimpan lebih banyak data untuk jangka waktu yang lebih lama.
Seagate mendefinisikan AI tepercaya sebagai alur kerja dan model data AI yang menggunakan input yang dapat diandalkan dan menghasilkan wawasan yang andal. AI tepercaya dibuat berdasarkan data yang memenuhi kriteria berikut:
Infrastruktur penyimpanan yang terukur mendukung AI tepercaya karena infrastruktur tersebut mengelola, menyimpan, dan mengamankan sejumlah besar data yang digunakan oleh sistem AI dengan benar.
Sebagai bagian dari membangun AI yang tepercaya, 80% responden menekankan pentingnya pos pemeriksaan.
Penyimpanan titik pemeriksaan adalah proses menyimpan status model AI pada interval pendek tertentu selama pelatihannya. Model AI dilatih pada kumpulan data besar melalui proses berulang yang dapat memerlukan waktu mulai dari beberapa menit hingga berbulan-bulan. Durasi pelatihan model bergantung pada kerumitan model, ukuran kumpulan data, dan daya komputasi yang tersedia. Selama waktu ini, model diberikan data, parameter disesuaikan dan sistem mempelajari cara memprediksi hasil berdasarkan informasi yang diprosesnya.
Menurut survei, perusahaan yang menggunakan penyimpanan 100+PB menyimpan dan mencadangkan titik pemeriksaan setiap hari hingga setiap minggu, dengan 87% di antaranya menyimpan titik pemeriksaan ini di cloud atau dalam gabungan hard disk dan SDD.
Untuk mendukung proses penyimpanan titik pemeriksaan dalam skala sebesar ini, perusahaan membutuhkan sistem penyimpanan yang mampu menopang aktivitas penulisan yang konstan tanpa mengganggu kemajuan model. Hard disk berkapasitas tinggi dan arsitektur cloud hibrida memberikan keandalan dan efisiensi biaya yang diperlukan untuk mempertahankan siklus snapshot yang pesat ini. Dengan secara konsisten mengambil dan melindungi titik-titik penting, organisasi dapat menjaga kemajuan pelatihan, mempercepat pemulihan dari gangguan, dan mempertahankan alur kerja pengembangan AI yang stabil dan dapat diprediksi.
Komputasi dan energi adalah tema populer dalam diskusi tentang adopsi AI. Survei Recon Analytics juga menyoroti penyimpanan sebagai pendorong penting.
Gambar 4. 66% pembuat keputusan infrastruktur menempatkan penyimpanan sebagai komponen terpenting kedua di antara empat pendukung AI teratas mereka. Mereka juga menempatkan penyimpanan sebagai penghalang terpenting keempat untuk penerapan AI.
“Hasil survei umumnya menunjukkan lonjakan permintaan penyimpanan data yang akan datang, dengan hard disk muncul sebagai pemenang yang jelas. Jika Anda mempertimbangkan bahwa para pemimpin bisnis yang kami survei bermaksud untuk menyimpan lebih banyak lagi data berbasis AI ini di cloud, cloud berada pada posisi yang tepat untuk menghadapi gelombang pertumbuhan kedua.”
Pendiri dan Analis Utama Recon, Roger Entner, menjelaskan poin utamanya sebagai berikut:
Untuk mendapatkan nilai maksimal dari AI, perusahaan harus mempersiapkan penyimpanan data yang terukur dan efisien. Baik secara langsung atau melalui layanan cloud, ketergantungan AI pada data bergantung pada hard disk, yang menawarkan kapasitas, efisiensi biaya, dan keberlanjutan yang tak tertandingi, sebagai fondasi utama AI tepercaya.
Hard disk menghadirkan keunggulan biaya per TB yang tak tertandingi untuk penyimpanan AI skala besar. Hard disk berkapasitas besar menawarkan keseimbangan optimal antara skalabilitas, efisiensi energi, dan keberlanjutan, memungkinkan perusahaan untuk memperluas kapasitas penyimpanan tanpa melebihi batasan anggaran atau daya.