AI Generatif akhirnya memungkinkan janji data besar
24 Okt, 2025
Pendapat Bob O’Donnell, komentator CNBC dan Bloomberg terkait pembebasan analisis data dan implikasi penyimpanan
Mereka yang telah mengikuti tren industri teknologi besar selama beberapa waktu sekarang pasti ingat konsep "data besar". Idenya adalah bahwa perusahaan akan menyatukan semua berbagai sumber data yang dapat mereka akses — dokumen kantor dan email tradisional, data proses bisnis, hasil penjualan, basis data pelanggan, video, log obrolan, dan banyak lagi — lalu memanfaatkan semua data tersebut untuk mendapatkan wawasan yang berarti guna memberdayakan organisasi mereka.
Secara teori, konsepnya bagus dan harapan terhadapnya tinggi. Pasti terdapat informasi bermanfaat yang tersembunyi dan banyak wawasan tak terduga yang akan mulai muncul saat semua sumber data yang berbeda digabungkan menjadi hal yang diyakini para pendukungnya akan menjadi campuran makna yang kuat. Praktiknya, hasilnya jauh berbeda.
Pertama, ternyata jauh lebih sulit untuk mengatur data perusahaan ke dalam struktur yang memungkinkan berbagai sumber digabungkan atau dibandingkan dengan cara yang bermakna. Tidak hanya terdapat masalah dengan hal-hal seperti menyatukan data terstruktur dan tak terstruktur, tetapi juga terdapat kesulitan dalam memformat ulang, mengimpor, menghubungkan, dan melakukan bentuk pemetaan data lainnya.
Namun, yang terbukti lebih menantang adalah mencoba melakukan analisis pada penyimpanan data yang dapat mereka akses. Ternyata hanya mereka yang memiliki pelatihan sangat khusus dalam alat analitik data tingkat lanjut, yaitu, ahli SQL yang dapat menyusun perintah sangat rumit yang diperlukan untuk memanfaatkan kumpulan data yang sangat besar ini. Sayangnya, banyak dari orang-orang tersebut tidak tahu jenis kueri yang dapat menghasilkan wawasan tak terduga yang dijanjikan data besar. Pebisnis umum yang memahami pertanyaan tersebut tidak dapat dengan mudah mengajukan kueri dan banyak upaya akhirnya sia-sia karena tidak dapat diterjemahkan di antara kedua kelompok.
Dengan makin meluasnya penggunaan GenAI, yang sangat bagus dalam menemukan pola dan menghasilkan ide dari basis data yang besar, situasinya mulai berbalik. Dengan memasukkan data organisasi ke model AI, baik dengan melatih model khusus maupun menyesuaikan LLM (model bahasa besar) yang ada, organisasi kini akhirnya dapat membuat penyimpanan data raksasa yang selalu dimaksudkan untuk menjadi inti kueri data besar. Selain itu, antarmuka bergaya chatbot sederhana yang memanfaatkan model ini kini tersedia untuk digunakan dengan mudah oleh orang-orang di tingkat organisasi mana pun. Hasil akhirnya adalah bahwa janji awal big data akhirnya menjadi kenyataan. Mulai dari tenaga penjualan junior yang memiliki firasat tentang tren yang mereka rasa mulai dilihat di lapangan, hingga eksekutif tingkat C yang mencari dasbor gambaran besar yang menggabungkan metrik utama tertentu, orang-orang di seluruh organisasi kini dapat memanfaatkan GenAI untuk memperoleh berbagai wawasan yang luas tentang bisnis.
Implikasinya terhadap penyimpanan data ini dalam suatu organisasi sangat besar. Meskipun di masa lalu beberapa organisasi mungkin membuang atau menonaktifkan beberapa sumber data tertentu karena terbatasnya nilai yang dirasakan, kini muncul kesadaran yang berkembang bahwa sumber data apa pun dapat membantu dalam penemuan wawasan dan tren baru yang tak terduga. Hasilnya, perusahaan tidak hanya memastikan bahwa mereka menyimpan semua data yang dihasilkan, tetapi juga menyediakan semuanya.
Salah satu pendorong utama tren ini adalah hard disk magnetik biasa yang sudah ada. Berkat kemajuan teknologi seperti Seagate MozaicTM, kini memungkinkan untuk memasukkan data sebesar 3TB pada satu piringan di dalam hard drive. Dengan meningkatkannya ke dalam sistem penyimpanan bergaya rak di pusat data perusahaan atau lokasi bersama, kapasitas penyimpanan dapat mencapai 32 PB dalam satu ruang rak selebar 19 inci dan tinggi 73 inci (42U). Dengan memungkinkan jenis kapasitas penyimpanan ini, organisasi dapat menyimpan data dalam jumlah besar secara efisien, yang memungkinkan mereka menggabungkan banyak hard disk berkapasitas rendah menjadi sistem yang lebih kecil dan hemat daya, serta memastikan hard disk memiliki banyak ruang untuk pertumbuhan lebih lanjut.
Jika dilihat secara keseluruhan, jenis hard disk berkapasitas tinggi ini sangat cocok dengan arsitektur penyimpanan secara keseluruhan. Organisasi akan terus menggunakan SSD berkecepatan tinggi untuk menyimpan versi terbaru model GenAI dan aplikasi lain tempat pentingnya kecepatan akses ke memori lebih besar dibandingkan tuntutan kapasitas. Demikian pula, jenis SSD lainnya kemungkinan akan dimanfaatkan untuk hal-hal seperti chatbot AI, penyimpanan kueri cepat, dan aplikasi lain yang cukup menuntut. Namun, untuk penyimpanan data tujuan umum dari banyak sumber yang dimasukkan ke model AI yang disesuaikan ini, hard disk berkapasitas tinggi menyediakan serangkaian karakteristik optimal yang sangat sesuai untuk aplikasi.
Faktor penting lainnya adalah lokasi perangkat penyimpanan data ini. Karena alasan biaya dan keamanan, sebagian besar organisasi menyimpan banyak datanya di balik firewall mereka sendiri, bukan di cloud. Hal ini khususnya berlaku untuk beberapa sumber data yang jarang diakses yang kini dapat lebih mudah diintegrasikan ke dalam model AI dengan alat pelatihan dan penyesuaian model baru. Saat organisasi mulai membangun model AI mereka sendiri, terjadi peningkatan besar dalam membangun infrastruktur AI internal mereka sendiri untuk melatih, menyesuaikan, dan menghosting beberapa model tersebut. Perusahaan seperti Dell, HPE, Lenovo, dan Cisco melihat lonjakan besar dalam permintaan untuk server yang dilengkapi GPU yang dirancang untuk perusahaan, dan Nvidia telah membicarakan peningkatan pabrik AI perusahaan selama beberapa waktu kini. Hasilnya adalah minat baru dalam membangun pusat data perusahaan dengan semua sumber daya komputasi, jaringan, dan penyimpanan yang menyertainya.
Dengan semua elemen perangkat keras ini yang bersatu padu dipadukan dengan kemampuan yang berkembang pesat serta meningkatnya penggunaan model dan alat GenAI, potensi visi data besar dengan wawasan bermanfaat yang awalnya dijanjikan akhirnya terwujud. Meskipun tidak semua upaya akan selalu menghasilkan wawasan “a-ha” yang ajaib, sudah jelas bahwa salah satu hasil paling mengejutkan dan bermanfaat dari penggunaan GenAI, yakni pembebasan analisis data yang sesungguhnya telah hadir dan mulai menunjukkan dampaknya.
Ingin mewujudkan visi big data Anda? Bicaralah dengan pakar untuk mengetahui caranya.
President and chief analyst of TECHnalysis Research, Bob O’Donnell is a regular guest on Yahoo Finance, Bloomberg and CNBC.
Mengapa data adalah aset yang menentukan ekonomi AI