Perspective

13 10월, 2025

AI

기업은 AI 투자를 최대한 활용하기 위해 어떻게 준비해야 할까요?

Perspective

기업은 AI 투자를 최대한 활용하기 위해 어떻게 준비해야 할까? 썸네일 1440x900

데이터 없이는 AI 성공도 없습니다. 막대한 데이터가 필요합니다.

또한 충분하고 효율적인 데이터 스토리지 없이는 대규모 데이터 세트도 없습니다.

데이터는 AI를 뒷받침하고 대용량 하드 드라이브는 데이터를 뒷받침합니다.

이러한 통찰력은 리서치 업체인 Recon Analytics의 2025년 설문 조사를 통해 확연히 드러났습니다. 

Seagate가 의뢰한 글로벌 설문 조사는 1,062명의 응답자를 대상으로 실시되었습니다. 응답자는 연간 매출이 1,000만 달러 이상이고 현재 스토리지 사용량이 50테라바이트 이상이며 AI를 도입했거나 향후 3년 이내에 AI를 도입할 계획인 기업에서 스토리지 인프라스트럭처 역할을 담당하는 IT 스토리지 구매자 및 의사 결정권자로, 미국, 중국, 영국, 대한민국, 싱가포르, 프랑스, 인도, 일본, 대만, 독일에 위치하고 있습니다.

이 설문 조사는 AI 도입이 인프라 우선 순위, 데이터 보존 및 데이터 관리에 미치는 영향에 중점을 두었습니다. 이 결과는 AI가 향후 3년 동안 인프라 요구 사항에 어떤 영향을 미칠지 보여 줍니다.

설문 조사 하이라이트

무엇보다도, 설문 조사는 AI 도입으로 인해 2028년까지 데이터 스토리지 수요가 기하급수적으로 증가할 것이라는 점을 보여 주었습니다.  

  • 클라우드 스토리지를 주로 사용하는 기업의 응답자 중 무려 61%가 향후 3년 동안 기업의 클라우드 기반 스토리지가 100% 이상, 즉 2배로 증가해야 한다고 답했습니다.

그림 1. AI 데이터 관리를 위해 클라우드 스토리지를 주로 사용하는 기업의 응답자 중 61%는 스토리지 요구 사항이 100% 이상 증가할 것으로 예상합니다.

AI 애플리케이션이 전례 없는 데이터 생성을 주도함에 따라 조직은 더 많은 데이터를 저장할수록 AI가 예상대로 작동하는지 검증할 수 있습니다. 학습 데이터 세트, 모델 체크포인트, 프롬프트, 답변과 같은 행동 데이터에 액세스하여 기업은 알고리즘을 면밀히 조사하고 AI 의사 결정을 더 잘 이해하고 개선할 수 있습니다. 방대한 데이터 세트를 저장하고 검색하는 능력이 AI 성능의 핵심이기 때문에 규모와 효율성을 갖춘 데이터 센터가 없다면 AI의 잠재력도 제한될 것입니다. 

AI의 성공을 좌우하는 것은 스토리지의 양만이 아닙니다. 데이터 저장 기간도 중요합니다.

  • AI 기술을 도입한 기업에 고용된 응답자 중 90%는 데이터 보존 기간이 길어지면 AI 결과의 품질이 향상된다고 생각합니다.

그림 2. 현재 AI를 사용하는 기업의 90%는 더 많은 과거 데이터를 유지하면 모델 정확도가 향상된다고 생각합니다.

이 결과는 데이터를 더 오래 보존하는 것과 AI 통찰력의 신뢰성 사이에 상관관계가 있음을 나타냅니다. 이는 여러 요인에 의해 뒷받침될 수 있습니다. 첫째, 지속적인 반복 처리가 AI 알고리즘의 작동 방식에 내재되어 있습니다. 콘텐츠 출력은 모델에 피드백을 제공하여 정확도를 향상하고 새로운 모델을 활성화합니다. 원시 데이터 세트와 결과는 추가 개발 및 새로운 작업 흐름의 소스가 됩니다.

그러나 데이터 세트를 더 오래 보관하면 다른 비즈니스 핵심 기능에도 다음과 같이 도움이 됩니다. 기업의 지적 재산을 보호할 수 있습니다. 모델의 원래 데이터 세트 및 프로세스에 대한 '영수증'을 보관하여 필요할 때(예: 법적 절차의 일부로) 결과에 대한 설명을 제공합니다. 이러한 '영수증'은 데이터 계보를 확립하여 데이터가 입력에서 출력으로 이동하는 과정을 명확하게 기록합니다. 데이터 계보를 통해 조직은 데이터 세트의 출처와 사용을 확인할 수 있으므로 AI 모델이 정확한 데이터에 의존할 수 있습니다. 이를 통해 AI 시스템을 완전히 감사할 수 있으며 규정 준수 및 내부 책임을 모두 지원합니다.

또한 기업은 더 많은 데이터를 더 오래 저장하기로 선택할 수도 있습니다. 왜냐하면 미래의 알고리즘이 과거의 데이터에서 발견할 수 있는 새롭고 귀중한 통찰력이 무엇인지 오늘은 알 수 없기 때문입니다. 데이터 보존 기간이 길어지면 아직 개발되지 않은 AI 모델로 오래된 데이터를 처리할 수 있게 됩니다. 이러한 이유로 데이터 보존 기간이 길수록 AI가 제공할 수 있는 비즈니스 가치가 향상됩니다. 

관련 연구 결과에서 인프라 의사 결정권자는 신뢰를 구축하기 위해 장기 데이터 보관이 필수적이라고 봅니다. 신뢰가 없다면 AI 통찰력은 큰 가치를 갖지 못합니다.

  • 현재 AI를 사용하는 기업의 응답자 중 88%는 신뢰할 수 있는 AI를 도입하면 더 오랜 기간 동안 더 많은 데이터를 저장해야 할 필요성이 커진다고 생각합니다.

Seagate는 신뢰할 수 있는 AI를 신뢰할 수 있는 입력을 사용하고 신뢰할 수 있는 통찰력을 생성하는 AI 데이터 작업 흐름 및 모델로 정의합니다. 신뢰할 수 있는 AI는 다음과 같은 기준을 충족하는 데이터를 기반으로 구축됩니다. 

  • 고품질 및 정확성 
  • 명확한 합법성, 소유권 및 출처 
  • 안전한 스토리지 및 보호 
  • 알고리즘에 의해 설명 가능하고 추적 가능한 변환 
  • 데이터 처리에서 일관되고 신뢰할 수 있는 출력 

그림 3. 현재 AI를 사용하는 기업의 응답자 중 88%는 신뢰할 수 있는 AI를 도입하려면 더 오랜 기간 동안 더 많은 데이터를 저장할 필요성이 증가해야 한다고 응답했습니다.

확장 가능한 스토리지 인프라스트럭처는 AI 시스템에서 사용되는 방대한 양의 데이터를 적절하게 관리, 저장 및 보호할 수 있으므로 신뢰할 수 있는 AI를 지원합니다.

  • 신뢰할 수 있는 AI 구축의 일환으로 응답자의 80%는 체크포인트의 중요성을 강조했습니다.

체크포인트는 학습하는 동안 특정한 짧은 간격으로 AI 모델의 상태를 저장하는 프로세스입니다. AI 모델은 몇 분에서 몇 달까지 걸릴 수 있는 반복 프로세스를 통해 대규모 데이터 세트를 학습합니다. 모델의 학습 기간은 모델의 복잡성, 데이터 세트의 크기 및 사용 가능한 계산 능력에 따라 달라집니다. 이 기간 동안 모델에 데이터가 제공되고 매개변수가 조정되며 시스템은 처리하는 정보를 기반으로 결과를 예측하는 방법을 배웁니다. 

체크포인트는 학습 중 여러 지점에서 모델의 현재 상태(데이터, 매개변수 및 설정)의 스냅샷과 같은 역할을 합니다. 1분에서 몇 분 간격으로 스토리지 장치에 저장되는 스냅샷을 통해 개발자는 모델의 진행 상황에 대한 기록을 유지하고 예기치 않은 중단으로 인해 귀중한 작업이 유실되는 일을 예방할 수 있습니다. 

설문 조사에 따르면, 100PB 이상의 스토리지를 사용하는 기업은 매일 또는 매주 체크포인트를 저장 및 백업하고 있으며, 그중 87%는 이러한 체크포인트를 클라우드 또는 HDD와 SDD를 혼합하여 저장합니다. 

스토리지: AI 성공의 비밀 동인

컴퓨팅과 에너지는 AI 도입에 대한 논의에서 인기 있는 주제입니다. 그러나 Recon Analytics 설문 조사에서는 스토리지를 중요한 동인으로 강조하고 있습니다.  

  • 인프라 구매자의 관점에서 데이터 스토리지는 보안에 이어 AI 인프라에서 두 번째로 중요한 부분으로 평가되었습니다. 보안과 스토리지 다음의 중요도는 데이터 관리, 네트워크 용량, 컴퓨팅, 규정, LLM 실행 가능성, 에너지가 순이었습니다. 
  • 응답자의 2/3(66%)는 스토리지를 상위 4개 AI 지원 요소 중에서 두 번째로 중요한 요소로 평가했고, 도입에 있어 네 번째로 중요한 장애 요인으로 평가했습니다.

 그림 4. 인프라 의사 결정권자의 66%는 스토리지를 상위 4개 AI 지원 요소 중에서 두 번째로 중요한 요소로 평가했습니다. 또한 스토리지를 AI 배포에 있어 네 번째로 중요한 장애 요인으로 평가했습니다.

Recon의 설립자이자 수석 분석가인 Roger Entner는 다음과 같이 시사점을 설명합니다.  

"설문 조사 결과는 일반적으로 데이터 스토리지에 대한 수요가 급증하고 있으며 하드 드라이브가 확실한 승자로 떠오르고 있음을 시사합니다. 설문 조사에 참여한 기업 리더들이 점점 더 많은 AI 기반 데이터를 클라우드에 저장하려 한다는 점을 고려하면 클라우드 서비스가 두 번째 성장의 물결을 탈 수 있는 좋은 위치에 있는 것으로 보입니다."


AI에서 최대한의 가치를 얻으려면 기업은 확장 가능하고 효율적인 데이터 스토리지를 준비해야 합니다. 직접 준비하든, 클라우드 서비스를 통해서 준비하든 데이터에 대한 AI의 의존도는 신뢰할 수 있는 AI의 중추인 하드 드라이브에 달려 있습니다. 하드 드라이브는 타의 추종을 불허하는 용량, 비용 효율성, 지속 가능성을 제공합니다.