BLOG

Depolama ve bilgi işlem: Yapay zeka iş akışları için eş zamanlı ihtiyaçlar.

Sabit diskler ve SSD'ler, yapay zeka uygulamalarında hayati bileşenler olarak GPU'lara, CPU'lara, HBM'ye ve DRAM'e katılır.

İçindekiler

storage-and-compute-tandem-needs-for-ai-thumbnail-image storage-and-compute-tandem-needs-for-ai-thumbnail-image storage-and-compute-tandem-needs-for-ai-thumbnail-image

Yapay zeka (AI) uygulamaları dünya çapında gün geçtikçe daha fazla benimseniyor. Aynı zamanda, yapay zekayı mümkün kılan BT çözümlerinin yetenekleri de hızla artıyor. Ardından da eşi benzeri görülmemiş yenilikler geliyor. 

Şu anda işlemci (mantık) tarafı, yapay zekaya yaptığı katkılardan dolayı işletme liderlerinin ve yatırımcıların dikkatini çekiyor. Elbette işlemciler, yapay zeka ve yüksek performanslı bilgi işlem için çok önemlidir. Ancak yapay zekanın başarısı yalnızca bilgi işlem ve yüksek hızlı performansa bağlı değildir. Yapay zeka uygulamaları, ham veriler için bir ilk veri havuzu sağlayan, yapay zeka iş akışlarında güven oluşturan denetim noktalarını mümkün kılan ve çıkarımlar ile yapay zeka analizinin sonuçlarını depolayan veri depolamaya da dayanır. 

Başarılı bir yapay zeka uygulaması, bilgi işlem ve veri depolama kaynaklarının sinerji oluşturmasını gerektirir. 

Büyük veri merkezleri yapay zeka yeteneklerini geliştirdikçe yapay zeka uygulamalarının yalnızca bir yapay zeka veri merkezi mimarisinin bilgi işlem tarafına dayanmadığı daha da netleşiyor. Bilgi işlem kümesi yüksek performanslı, yüksek bant genişlikli bellek (HBM), dinamik rastgele erişimli bellek (DRAM) ve hızlı performans gösteren yerel katı hal diskleri (SSD’ler) içeren işlemcilerden oluşuyor ve yapay zeka eğitimi için güçlü bir motor oluşturuyor. Bilgi işlem kümesi bileşenleri yereldir ve genellikle yan yanadır, çünkü eklenen mesafeler gecikme ve performans sorunlarına neden olabilir.

Yapay zeka uygulamaları ayrıca, yüksek kapasiteli ağ sabit diskleri ve ağ SSD'lerini (hesaplama kümesindeki daha yüksek performanslı yerel SSD'lere kıyasla daha yüksek kapasiteli olması amaçlanmıştır) içeren depolama kümesine de bağlıdır. Depolama kümesi ağa bağlıdır (dağıtılmış), çünkü depolama performansının hızı daha az önemsenir. Bileşenlerin uzaklığı; toplam gecikme denkleminde, beklenen gecikmenin nanosaniyelere kadar çıkabildiği bilgi işlem kümesiyle karşılaştırıldığında daha küçük bir faktördür. Veriler nihayetinde uzun süreli saklama için ağırlıklı olarak büyük kapasiteli sabit disklerden oluşan depolama kümesine akar.

Bu makalede, tipik bir yapay zeka iş akışının birden fazla aşamasında bilgi işlem ve depolamanın birlikte nasıl çalıştığı incelenmektedir.

Yapay zeka için performans ve ölçeklenebilirlik.

Yapay zeka iş akışlarındaki bazı teknolojiler daha yüksek performans gösterirken bazıları daha ölçeklenebilirdir. Ancak bunların her biri sürecin ayrılmaz bir parçasıdır. Cihazdaki bellek yüksek performanslıdır ve genellikle işlemcilere, grafik işleme birimlerine (GPU'lar) ve merkezi işlem birimlerine (CPU'lar) veya veri işleme birimlerine (DPU'lar) bağlı HBM veya DRAM'den oluşur. DPU'lar, belirli görevlerde yardımcı olan ve CPU'lara bağlı yük boşaltma işlevsel motorlardır. Bazı mimariler bunları kullanırken bazıları kullanmaz. Belleğin yüksek iş hacmi , verimli veri alımına ve yapay zekanın model eğitimi yönlerine olanak tanır.

SSD'lerin düşük gecikme süresi ve yeterli kapasitesi, hızlı çıkarımlara ve depolanan içeriğe sık erişime izin verir. Yapay zeka veri merkezi mimarisinde hızlı performans gösteren yerel SSD’ler, işlemcilere ve belleğe yakın olacak şekilde bilgi işlem kümesine dahil edilir. Yerel SSD'ler genellikle üç seviyeli hücre belleğiyle çalışır ve ayrıca yüksek dayanıklılığa sahiptir. Ancak bunlar genellikle ağ SSD'lerinden daha pahalıdır ve aynı yüksek kapasiteye sahip değildir. 

Yerel SSD'lere kıyasla daha yüksek veri depolama kapasitesine sahip olan ağ SSD'leri, bir yapay zeka uygulamasının iş akışı boyunca diğer belirli sorumluluklarla birlikte depolama kümesine dahil edilir. Performans hızları, yerel SSD'lerin hızıyla eşleşmez. Ağ SSD’leri, günlük disk yazma işleminde nispeten daha az dayanıklıdır, ancak daha büyük kapasiteleriyle bunu telafi eder.

Yapay zeka veri merkezi mimarisinin depolama kümesinin de bir parçası olan ağ sabit diskleri, yapay zeka iş akışlarındaki en ölçeklenebilir ve verimli BT cihazlarıdır. Bu cihazların erişim hızları nispeten daha düşüktür, ancak çok yüksek kapasiteye sahiptir. Bu da hızlı ve sık erişim gerektirmeyen durumlar için idealdir.

Yapay zekanın sonsuz döngüsü.

Yapay zeka iş akışları, sonsuz bir tüketim ve oluşturma döngüsünde çalışır ve yalnızca bilgi işlem özellikli işlemciler ve bellek değil, depolama bileşenleri de gerektirir. Yapay zeka iş akışının birbiriyle ilişkili adımları; verilerin kaynağının sağlanması, modelleri eğitme, içerik oluşturma, içerik depolama, verileri koruma ve verileri yeniden kullanma adımlarıdır. Şimdi bu aşamalarda bilgi işlem ve depolamanın oynadığı rollere bakalım.

Adım 1: Veri kaynağı sağlama

Veri kaynağı sağlama aşaması, verilerin yapay zeka analizi için tanımlanmasını, keşfedilmesini ve hazırlanmasını içerir.

Bilgi işleme: GPU'lar, yüksek hızlı veri ön işleme ve dönüşümünü teşvik ederek veri kaynağı sağlama aşamasında temel bir rol oynar. Ana uygulama CPU üzerinde çalışırken tekrarlayan hesaplamaları paralel olarak çalıştırarak CPU'ları tamamlarlar. CPU, birincil birim olarak hareket eder ve GPU daha küçük ve daha özel görevleri yerine getirirken, birden fazla genel amaçlı bilgi işlem görevlerini yönetir.

Depolama: Veri kaynağı sağlama aşamasında hem ağ SSD'leri hem de ağ sabit diskleri, yeni bir şey oluşturmak için gereken büyük miktarda veriyi depolamak için kullanılır. Ağ SSD’leri, daha hızlı performans sunarak anında erişilebilir veri katmanı görevi görür. Ağ sabit diskleri geniş, yoğun, ölçeklenebilir kapasite sağlar ve ayrıca ham verileri uzun süreli saklama ve veri koruması sağlar.

Adım 2: Modelleri eğitme.

Model eğitimi adımında model, depolanan verilerden öğrenir. Eğitim, bir modelin birleştiği ve kontrol noktalarıyla korunduğu bir deneme yanılma sürecidir. Eğitim için yüksek hızlı veri erişimi gerekir.

Bilgi İşlem: GPU'lar, paralel işleme kapasitelerinin derin öğrenmeyle ilgili yoğun bilgi işlem yüklerinin üstesinden gelmelerini sağladığı model eğitimi aşamasında kritik öneme sahiptir. Yapay zeka eğitimi, GPU'ların aynı anda gerçekleştirdiği binlerce matris çoğaltmasını içerir ve bu işlem, süreci hızlandırıp milyarlarca parametreyle karmaşık modellerin eğitilmesini mümkün kılar. CPU'lar, GPU'larla birlikte çalışarak bellek ve bilgi işlem kaynakları arasındaki veri akışını düzenler. CPU'lar toplu iş hazırlama ve kuyruk yönetimi gibi görevleri yönetir, böylece doğru veriler GPU'lara doğru zamanda aktarılır. Bunlar ayrıca modelin hiper parametrelerinin optimizasyonunu da gerçekleştirir ve GPU'ların paralel işlem gücünü gerektirmeyen hesaplamalar yapar.

Model eğitiminde, etkin veri kümelerini işlemcilerin yakınında tutan HBM ve DRAM, hızlı veri erişimi için çok önemlidir. Genellikle GPU'lara entegre olan HBM, en sık kullanılan verileri eğitim sırasında GPU'lar tarafından erişilebilir tutarak verilerin işlenebilme hızını önemli ölçüde artırır.

Yerel SSD’ler, bu aşamada kullanılan veri kümeleri için hızlı erişimli depolama görevi görür. Bunlar ara eğitim sonuçlarını depolar ve büyük veri kümelerinin hızlı bir şekilde alınmasını sağlar. Milyonlarca görüntü içeren görüntü tanıma modelleri gibi büyük miktarda veriye hızlı erişim gerektiren eğitim modelleri için özellikle yararlıdır.

Depolama: Sabit diskler, yapay zeka modellerini eğitmek için gereken büyük miktarda veriyi ekonomik bir şekilde depolar. Sabit diskler gerekli ölçeklenebilir kapasiteyi sağlamanın yanı sıra veri bütünlüğünün korunmasına da yardımcı olur. Böylece oluşturulan içeriğin çoğaltılmış sürümlerini depolar ve korurlar. Sabit diskler diğer depolama seçenekleriyle karşılaştırıldığında düşük maliyetlidir, uzun vadeli güvenilir depolama sağlar ve büyük veri kümelerini verimli bir şekilde koruyup yönetir.

Diğer özelliklerinin yanı sıra ağ sabit diskleri ve ağ SSD'leri, model eğitimini korumak ve geliştirmek için denetim noktalarını depolar. Denetim noktaları eğitim, ayarlama ve uyarlama sırasında belirli anlarda bir modelin durumunun kaydedilmiş anlık görüntüleridir. Bu anlık görüntüler, daha sonra fikri mülkiyeti kanıtlamak veya algoritmanın sonuçlara nasıl ulaştığını göstermek için kullanılabilir. Denetim noktalarında SSD'ler kullanıldığında, düşük gecikmeli erişimleri nedeniyle denetim noktaları hızlı bir aralıkla (yani dakikada bir) yazılır. Ancak sabit disklerle karşılaştırıldığında kapasitelerinin düşük olması nedeniyle genellikle kısa bir süre sonra bu verilerin üzerine yazılır. Buna karşılık, kaydedilen sabit disk denetim noktaları genellikle daha yavaş bir aralıkta (örneğin, her beş dakikada bir) yazılır, ancak sabit diskin ölçeklenebilir kapasitesinden dolayı neredeyse sürekli olarak tutulabilirler.

Adım 3: İçerik oluşturma.

İçerik oluşturma aşaması, çıktılar oluşturmak için eğitilmiş modeli kullanan çıkarım sürecini içerir.

Bilgi işleme: İçerik oluşturma sırasında GPU'lar yapay zeka çıkarım görevlerini yürütür ve eğitilen modeli yeni veri girişlerine uygular. Bu paralellik, GPU'ların aynı anda birden fazla çıkarım yapmasına olanak tanıyarak video oluşturma veya konuşma tabanlı yapay zeka sistemleri gibi gerçek zamanlı uygulamalar için vazgeçilmez hale getirir. GPU'lar, içerik oluşturma sırasında bilgi işlem görevlerini yönetirken, CPU'lar, kontrol mantığını yönetmek ve seri işleme gerektiren işlemleri yürütmek için çok önemlidir. Buna; komut dosyaları oluşturma, kullanıcı girdilerini işleme ve GPU'nun yüksek iş hacmi ihtiyaç duymayan düşük öncelikli arka plan görevlerini çalıştırma dahildir.

İçerik oluşturma adımında HBM ve DRAM kullanılır. Bellek, burada gerçek zamanlı veri erişiminde çok önemli bir rol oynar, yapay zeka çıkarımlarının sonuçlarını anlık olarak depolar ve daha fazla ayrıntılandırma için modele geri gönderir. Yüksek kapasiteli DRAM, özellikle video oluşturma veya gerçek zamanlı görüntü işleme gibi uygulamalarda iş akışını yavaşlatmadan içerik oluşturmanın birden fazla yinelemesini sağlar.

İçerik oluşturma sırasında yerel SSD'ler, gerçek zamanlı işleme için gerekli olan yüksek okuma/yazma hızlarını sağlar. Yapay zeka yeni görüntüler, videolar veya metinler oluşturduğunda, SSD'ler sistemin sık görülen, yüksek hızlı G/Ç işlemlerini herhangi bir darboğaz olmadan gerçekleştirmesini sağlar ve içeriğin hızlı bir şekilde üretilmesini sağlar.

Depolama: Bu oluşturma adımının birincil depolama sağlayıcıları HBM, DRAM ve yerel SSD'lerdir.

Adım 4: İçerik depolama.

İçerik depolama aşamasında, yeni oluşturulan veriler sürekli iyileştirme, kalite güvencesi ve uyumluluk için kaydedilir.

Bilgi işleme:
Uzun süreli depolamaya doğrudan dahil olmasa da GPU'lar ve CPU'lar, depolama için hazırlanırken verilerin sıkıştırılmasına veya şifrelenmesine yardımcı olabilir. Büyük veri hacimlerini hızlı bir şekilde işleyebilmeleri, içeriğin gecikme olmaksızın arşivlemeye hazır olduğu anlamına gelir. Bellek, veriler uzun süreli depolamaya taşınmadan önce geçici bir Önbellek olarak kullanılır. DRAM, yazma işlemlerini hızlandırarak yapay zeka tarafından oluşturulan içeriği hızlı ve verimli bir şekilde kaydeder. Bu, özellikle veri depolamadaki gecikmelerin performans sorunlarına yol açabileceği gerçek zamanlı yapay zeka uygulamalarında önemlidir.

Depolama: İçerik depolama aşaması; sürekli iyileştirme, kalite güvencesi ve uyumluluk için veri tasarrufu sağlayan ağ SSD’lerine ve ağ sabit disklere bağlıdır. Ağ SSD'leri, hız uyumlu veri katmanı sağlar ve yapay zeka tarafından oluşturulan içeriğin kısa süreli, yüksek hızlı depolanması için kullanılır. SSD'ler, sabit disklere kıyasla daha düşük kapasiteleri göz önüne alındığında genellikle sık erişilen içeriği veya düzenleme ve iyileştirme için hemen hazır olması gereken içeriği depolar.

Yineleme işlemi, depolamaya ihtiyaç duyan yeni, doğrulanmış verilerin ortaya çıkmasına neden olur. Bu veriler sürekli iyileştirme, kalite güvencesi ve uyumluluk için kaydedilir. Sabit diskler, oluşturulan içeriğin çoğaltılmış sürümlerini depolayıp korur ve yapay zeka işlemleri sırasında oluşturulan içeriği depolamak için kritik kapasite sağlar. SSD'ler gibi diğer depolama seçeneklerine kıyasla nispeten düşük bir maliyetle yüksek depolama kapasitesi sunduklarından, özellikle bu işlem için uygundurlar.

Adım 5: Verileri koruma.

Veri koruma aşamasında, çoğaltılan veri kümeleri bölgeler ve ortamlarda korunur. Bu aşamada genellikle depolama kaynakları kullanılır.

Depolama: Depolanan veriler, güvenilir yapay zekanın omurgasını oluşturur. Bu veriler sayesinde veri bilimciler, modellerin beklendiği gibi çalışmasını sağlar. Ağ SSD'leri, sabit diskleri yerel SSD katmanına bağlamak ve verilerin ekosistemde dolaşmasına yardımcı olmak için bir performans elemanı olarak kullanılır.

Sabit diskler, daha uzun süreli depolama ve veri koruması gerektiren verilerin birincil sağlayıcılarıdır. Yapay zeka içerik oluşturma sonuçlarının korunmasına yardımcı olur, oluşturulan içeriği güvenli bir şekilde depolar, böylece gerektiğinde bu içeriğe erişim sağlanabilir. Artan veri hacimlerini verimli bir şekilde işlemek için gereken ölçeklenebilirlik de sağlarlar.

6. Adım: Verileri yeniden kullanma.

Son olarak, verilerin yeniden kullanımı aşamasında kaynak, eğitim ve çıkarım verileri iş akışının bir sonraki yinelemesine uygulanır.

Bilgi işleme: GPU'lar, yeni çıkarımlar veya ek eğitim için modelleri, arşivlenmiş veri kümelerinde yeniden çalıştırarak verilerin yeniden kullanımı aşamasında önemli bir rol oynar ve yapay zeka veri döngüsünün yeniden başlamasını sağlar. Büyük veri kümelerinde paralel hesaplamalar gerçekleştirebilmeleri, yapay zeka sistemlerinin minimum zaman yatırımıyla model doğruluğunu sürekli olarak geliştirmesini sağlar. CPU'lar depolanan verileri yeniden kullanmak üzere sorgular ve alır. Geçmiş verileri verimli bir şekilde filtreleyip işleyerek ilgili bölümleri eğitim modellerine geri beslerler. Büyük ölçekli yapay zeka sistemlerinde CPU’lar, depolama sistemleri ve bilgi işlem kümeleri arasındaki etkileşimleri yönetirken genellikle bu görevleri yerine getirir.

Geçmiş veriler, yapay zeka modelinin analizinin başka bir yinelemesinde yeniden kullanılmak üzere alındığında, bellek büyük veri kümelerine hızlı erişimi garanti eder. HBM, veri kümelerinin yeniden eğitim veya gerçek zamanlı çıkarım için hemen kullanılabilecekleri GPU belleğine hızlı bir şekilde yüklenmesini sağlar.

Depolama: İçerik çıktıları, modele geri beslenerek yeni modellerin doğruluğunu artırır ve kullanılmasını sağlar. Ağ sabit diskleri ve SSD'ler, yapay zekayla coğrafi olarak farklı yerlerde veri oluşturmayı destekler. Ham veri kümeleri ve sonuçlar, yeni iş akışları için kaynak olur. SSD'ler, daha önce depolanan verilerin alınmasını hızlandırır. Düşük gecikmeli erişim, bu verilerin yapay zeka iş akışlarına hızlı bir şekilde yeniden entegre edilmesini sağlayarak bekleme sürelerini azaltır ve genel sistem verimliliğini artırır. Sabit diskler, yapay zeka verilerinin yeniden kullanımı aşamasının büyük kapasiteli depolama gereksinimlerini karşılayarak modelin sonraki yinelemesinin makul bir maliyetle uygulanmasını sağlar.

Depolama, yapay zekanın temelini oluşturur.

Gördüğümüz gibi, yapay zeka iş akışları yüksek performanslı işlemciler ve veri depolama çözümleri gerektirmektedir. Cihazdaki bellek ve SSD'ler, hızlı çıkarımlara olanak tanıyan yüksek hızlı performans sayesinde yapay zeka uygulamalarında önemli bir yere sahiptir. Ancak, sabit diskleri yapay zekanın omurgası olarak görüyoruz. Birçok yapay zeka iş akışında bulunması gereken ekonomik ölçeklenebilirlik göz önüne alındığında bunların özellikle kritik öneme sahip olduğunu anlıyoruz.

Isı destekli manyetik kayıt (HAMR) teknolojisinin benzersiz uygulamamız olan Mozaic 3+™ teknolojisine sahip Seagate sabit diskleri, alan yoğunluğu, verimlilik ve alan optimizasyonu avantajları nedeniyle yapay zeka uygulamaları için güçlü bir seçimdir. Disk başına 3 TB+ eşsiz alan yoğunluğu sunarlar ve şu anda 30 TB’den başlayan kapasitelerde ve hiper ölçekli müşterilere toplu olarak sevk edilmektedirler. Seagate, Mozaic platformunu hali hazırda disk başına 4 TB+ ve 5 TB+ elde edecek şekilde test etmektedir.

Mevcut nesil dikey manyetik kayıt (PMR) sabit diskleriyle karşılaştırıldığında, Mozaic 3+ sabit diskleri dört kat daha az çalışma gücü gerektirir ve terabayt başına on kat daha düşük karbon emisyonu yayar.

Yapay zeka iş yüklerinde işlem ve depolama birlikte çalışır. Yapay zeka uygulamalarında yüksek performanslı SSD’lerin yanı sıra bilgi işlem merkezli işleme ve bellek de önemlidir. Seagate sabit disklerinin öncülük ettiği ölçeklenebilir büyük kapasiteli veri depolama çözümleri de bu uygulamalarda önemini korumaktadır.