X

기술 관련 식견 HDD 작업 부하가 TCO에 미치는 영향

나날이 증가하는 컴퓨팅 성능과 스토리지 용량의 환경에서 TCO는 거의 모든 데이터 운영자에게 평가를 위한 척도가 됩니다. 클라우드 모델링 및 데이터 분석, Seagate 기술 Andrei Khurshudov 박사

PDF 버전 다운로드

서론
생산되는 디지털 데이터의 양은 매년 기하급수적으로 증가하고 있으며, 스토리지에 대한 수요 또한 증가하고 있습니다. 솔리드 스테이트 스토리지(SSD) 기기의 최근 인기에도 불구하고, 디지털 데이터의 압도적 다수는 여전히 거의 모든 데이터 센터의 바탕이 되는 자기 기록 매체, 즉 하드 디스크 드라이브(HDD)에 저장됩니다. 또한 이제 의료, 소매, 제조 등 다양한 산업에서 대규모 데이터 센터를 찾아볼 수 있습니다. 대규모 데이터 센터는 온라인 검색, 쇼핑, 소셜 네트워크를 비롯하여 IT 업계에 의해 제공되는 기타 솔루션의 바탕이 됩니다.

데이터 센터가 하드웨어 RAID 데이터 중복성을 갖춘 하이엔드 스토리지 시스템의 집합으로써 구축되었는지 아니면 (글로벌 분산 파일 시스템에 의해 제공되는) 소프트웨어 데이터 중복성을 갖춘 로우 엔드 하드웨어를 사용하여 구축되었는지의 여부와는 무관하게, 드라이브 고장 및 교체는 비용을 수반하며, 데이터 센터의 총 소유 비용(TCO)을 상당히 증가시킬 수 있습니다. 업계의 분석에 따르면 하드웨어 고장, 유지 보수, 수리, 교체 등의 경우 각각 US$100에서 US$300 사이의 비용이 드는 것으로 나타났습니다.1,2

나날이 증가하는 컴퓨팅 성능과 스토리지 용량의 환경에서 TCO(Total Cost of Ownership)는 거의 모든 데이터 운영자에게 평가를 위한 척도가 됩니다. TCO는 일반적으로 자본 및 운영 비용, 하드웨어와 소프트웨어의 비용뿐만 아니라 데이터 센터 관리, 유지 보수 및 수리 등 데이터 센터 구축 및 운영과 관련한 모든 비용으로 구성됩니다. HDD의 신뢰성은 다른 데이터 센터 하드웨어의 신뢰성과 함께 데이터 센터의 유지 보수와 관련한 운영 비용에 커다란 영향을 미칩니다.

일부의 관측과는 달리, HDD는 데이터 센터의 가장 신뢰할 수 있는 구성 요소들 중의 하나입니다. 예를 들어 스토리지 및 컴퓨팅 서버에는 HDD에 앞서 시스템의 신뢰성을 제한할 수 있는 많은 다른 구성요소들이 있습니다. 냉각팬은 일반적으로 약 100K 시간의 MTBF 값을 지닙니다. 서버 전원 공급장치는 일반적으로 400K 시간의 MTBF로 평가됩니다. 이와 같은 구성요소들은 1,000K+ MTBF 정격의 일반적인 니어라인 HDD보다 훨씬 신뢰성이 떨어집니다.

물론 데이터 센터(또는 일반적인 서버의 내부)에는 팬이나 전원 공급장치보다 훨씬 더 많은 드라이브가 있을 수 있습니다. 드라이브의 수가 더 많을수록 그 중 하나가 장애를 일으킬 확률이 당연히 더 높아지고, 그로 인해 교체가 필요하게 됩니다.

다행히 데이터 센터 운영자에게 도움이 될 몇 가지 요인들이 있습니다.

첫째, Seagate의 경험에 따르면 HDD의 신뢰성은 데이터 센터 운영자에 의해 정의 및 제어되는 작동 조건에 크게 의존합니다. 겉보기에는 똑같이 생긴 두 개의 드라이브 중 하나가 가혹한 작동 환경에서는 다섯 배에 이르는 신뢰성 감소를 겪을 수도 있습니다. 이로 인해 데이터 센터 운영자에게는 최소의 운영 비용으로 더 나은 신뢰성을 얻을 수 있도록 작동 환경을 조정할 수 있는 능력이 주어집니다.

둘째, Seagate는 데스크탑, 니어라인 및 미션 크리티컬 환경에서는 일반적인 다양한 작동 조건에서 훌륭하게 작동하도록 설계된 다양한 유형의 드라이브들을 생산합니다. Seagate는 높은 신뢰성을 위한 필수 요소가 무엇인지를 잘 이해하고 있으며, 가능한 최상의 신뢰성을 보장하기 위한 일련의 권장사항들을 가지고 있습니다.

드라이브가 실제 데이터 센터의 내부에서 사용되는(그리고 스트레스가 가해지는) 방식에는 여러 차이가 존재합니다. HDD 스트레스의 필수 매개변수는 사용 시간, 작동 온도 및 사용자 부하입니다. 이들 각각의 매개변수는 일반적으로 데이터 센터 아키텍처(토폴로지, 서버 디자인, 전반적 데이터 센터 스토리지 용량 및 활용, 가상화, 작업 부하 밸런싱 등을 포함)와 최종 사용자의 애플리케이션(양방향으로 전송된 데이터의 총량, 시간의 경과에 따른 데이터 속도) 모두의 강력한 기능입니다. 신뢰성에 대한 사용 시간, 작동 온도 및 사용자 작업 부하 각각의 중요성을 분석해보도록 하겠습니다.

사용 시간
HDD 신뢰성에 대한 사용 시간의 영향은 이해하기가 아주 쉽습니다.

수학적으로, 아래의 간단한 방정식은 사용 시간과 평균 무고장 시간(MTBF)으로 표시되는 제품 신뢰성이 구성요소 장애 누적 확률을 알아내기 위해 어떻게 결합되는지를 보여줍니다. 사용 시간이 증가함에 따라, 장애 누적 확률 또한 증가합니다.

장애 누적 확률 (비율) = 1-e-시간/MTBF

직관적으로, 운영 및 사용을 위해 장치를 켜 놓은 시간이 줄어들수록 장애 발생 확률은 낮아집니다.

현실적으로, 데스크탑 환경의 HDD의 사용 시간은 평균적으로 약 6.5 시간/일에 해당하는 2,400 작동 시간/년으로 기대합니다. 니어라인 또는 미션 크리티컬 환경의 경우 드라이브는 100%의 시간(24 시간/일) 동안 작동하여 8,760 작동 시간/년에 이를 것으로 기대합니다. 분명 우리는 니어라인 및 미션 크리티컬 드라이브가 더 높은 사용 시간의 스트레스 하에서 작동할 것으로 기대합니다. 따라서 HDD를 개발 및 테스트할 때 설계 및 테스트 프로토콜은 시간, 온도, 작업 부하 등을 포함하여 예상되는 미래의 드라이브 작동 조건에 따라 결정됩니다.

온도 스트레스
높은 온도 또한 HDD를 포함한 거의 모든 전자 및 전기 기계 장치의 신뢰성에 부정적인 영향을 미칩니다. 고장율은 일반적으로 소위 아레니우스(Arrhenius) 의존성에 의해 온도 변화에 따라 급격하게 증가합니다. 신뢰성과 MTBF에 대한 온도의 영향은 비교적 잘 이해할 수 있으며, 드라이브 설계 및 테스트 과정에서 항상 고려됩니다. 경험에 입각한 규칙은 제품에 대해 지정된 범위를 지키면서 HDD를 최대한 시원하게 유지하는 것입니다. HDD의 일반적인 작동 온도 범위는 선택된 드라이브의 종류와 관계 없이 5°C - 60°C입니다. HDD의 신뢰성 향상을 위한 데이터 센터 계획에는 효율적 냉각을 위한 노력이 포함되어야 합니다.

작업 부하 스트레스
작업 부하가 신뢰성에 미치는 영향은 약간 더 이해하기 어렵습니다.

정의 상, HDD의 주요 기능은 데이터의 저장 및 검색으로, 수백 Gb의 데이터를 스토리지 표면의 모든 평방 인치 안에 저장하는 것입니다. HDD는 약 200MB/s 이상의 지속적인 데이터 속도로 데이터를 기록 및 검색할 수 있습니다.

이와 같은 높은 기록 밀도와 높은 데이터 처리량 달성하기 위해서는 자기 읽기 및 쓰기 구성요소들이 빠르게 움직이는 회전 매체로부터 몇 나노미터(1nm = 0.001μm) 간격을 두고 물리적으로 떨어져 있어야 합니다. 이것은 드라이브가 여러 요인들 중에서도 특히 사용 시간 및 고객의 작업 부하 범위에 의해 특성이 결정되는 특정 환경에 맞게 설계, 테스트 및 분류되어야 하는, 복잡한 기술 설계 작업입니다.

작업 부하는 정상 작동 중 드라이브가 노출되는 작업 스트레스의 양을 정의하기 위해 사용되는 기술 용어입니다. 예를 들어, 드라이브 A는 매일 몇 GB의 데이터를 읽고 쓸 수 있고, 동일한 설계의 다른 드라이브 B는 하루에 수백 GB의 데이터를 읽고 쓸 수 있다고 합시다. 이 경우, 우리는 드라이브 B가 훨씬 더 높은 작업 부하 스트레스를 받고 있다고 말할 수 있습니다.
얼마나 많은 작업 부하가 너무 많은 작업 부하인지를 알아보기 위해, 세 가지의 일반적 시나리오(드라이브 A, B, C)를 살펴보도록 하겠습니다.

4TB Seagate Constellation ES.3 HDD를 예로 들어 보겠습니다. 이 드라이브는 약 175MB/s의 지속적 데이터 전송 속도를 유지할 능력을 갖추고 있습니다. 이와 같은 세 개의 드라이브가 모두 비슷한 조건에서 작동한다고 가정합니다(서버 또한 동일한 것으로 가정함). 첫 번째 드라이브(드라이브 A)는 5MB/s(또는 연평균 158TB/년 전송)의 데이터를 지속적으로 전송하고, 두 번째 드라이브(드라이브 B)는 10MB/s(평균 315TB/년)의 데이터를 전송합니다. 마지막으로, 세 번째 드라이브(드라이브 C)는 이 예에서 100MB/s(평균 3,150TB/년)를 전송합니다.

위의 예에서, 드라이브 B는 드라이브 A보다 2배 더 높은 작업 부하 스트레스에 노출되어 있고, 드라이브 C는 드라이브 A보다 작업 부하 스트레스가 20배 더 높은 것을 쉽게 알 수 있습니다.

선형 의존성을 가정할 때 다음으로 얻을 수 있는 합리적 결론은, 드라이브 B는 드라이브 A보다 고장율이 2배 더 높고, 드라이브 C는 드라이브 A보다 고장율이 20배 더 높을 것으로 가정하는 것입니다. 하지만 Seagate의 데이터에 따르면, 작업 부하에 따른 고장율의 선형 확장 가정이 잘못된 것으로 나타났습니다.

수 년에 거친 연구와 실험 결과, Seagate의 엔지니어들은 드라이브 신뢰성에 대한 작업 부하의 복잡한 영향을 이해하고,

  • 모든 HDD 유형에는 WRL(작업 부하 속도 제한)로 정의되는 작업 부하의 안전한 임계값이 존재한다는 결론을 내리게 되었습니다.
  • 작업 부하가 WRL을 초과하지 않는 이상, 작업 부하 스트레스는 제품의 신뢰성과 고장율에 미치는 영향이 거의 또는 전혀 없습니다.
  • WRL이 초과될 경우, 해당 제품의 신뢰성은 감소하기 시작합니다.

따라서 실제 데이터 센터의 작업 부하 스트레스를 이해하고, 이에 따라 HDD를 선택하는 것이 매우 중요합니다. 표 1은 다양한 데이터 센터 환경에 가장 적합한 드라이브를 선택하기 위한 Seagate의 권장 사항을 요약하여 보여줍니다.

표 1. 작업 부하에 대한 HDD 권장 사항

작업 부하 권장되는 제품 종류 작업 부하 속도 제한, TB/년
Light Nearline Light <180
Heavy Nearline <550

드라이브 A, B, C가 모두 니어라인 드라이브라고 가정할 때, 드라이브 A와 B는 평균적으로 매우 유사한 신뢰성(두 드라이브 모두 WRL이 550TB/년)을 지닐 것으로 기대할 수 있습니다. 하지만 드라이브 C는 평균 작업 부하 정격이 3150TB/년으로서 니어라인 드라이브에 대해 권장되는 WRL을 크게 초과하며, 더 높은 고장 위험에 노출되어 있습니다.

이 표를 통해 데이터 센터 운영자들은 올바른 작업 부하에 대한 올바른 HDD를 선택할 수 있습니다. 권장 사항을 따를 경우, 사용되는 HDD에 대해 가능한 최상의 신뢰성과 낮은 장기 TCO를 보장할 수 있습니다.

그림 1을 통해, 드라이브 A와 B는 동일한 안전 지대에 속하며 작업 부하로 인한 고장 가속이 없는 것을 볼 수 있습니다. 드라이브 C는 권장되는 작업 부하 속도 제한을 크게 벗어나 작동하며, 신뢰성 감소를 보일 가능성이 있습니다.

hdd-workload-tco-500x318.jpg

결론
TCO는 거의 모든 데이터 센터 운영에 대한 주요 평가 척도 중의 하나입니다.

사용되는 드라이브가 데이터 센터 작동 조건을 충족하지 않을 경우, 신뢰성은 전반적인 TCO에 부정적인 영향을 미칠 수 있습니다. 데이터 센터 운영자는 드라이브를 선택할 때, 사용 시간과 온도 외에도 예상 작업 부하 및 신뢰성에 미치는 영향을 고려해야 합니다.

Seagate는 모든 데이터 센터 작업 부하 환경에 대해 적절한 HDD 선택을 위한 명확한 지침을 제공합니다. HDD를 지정된 범위 내의 낮은 온도와 사용 시간 및 작업 부하 사양 내로 유지하는 것은 장기 드라이브 신뢰성과 TCO 개선을 위한 필요 조건입니다. 이와 같은 지침을 따를 경우, HDD 교체, 유지 보수 및 테스트와 관련하여 가능한 최상의 드라이브 신뢰성과 최저의 비용을 보장할 수 있습니다.

클라우드 모델링 및 데이터 분석의 Andrei Khurshudov 박사, Seagate

리소스

  1. The Datacenter as a Computer: An Introduction to the Design of Warehouse-Scale Machines, Luiz André Barroso 및 Urs Hölzle, 2009년
  2. Characterizing Cloud Computing Hardware Reliability, Kashi Venkatesh Vishwanath 및 Nachiappan Nagappan, SoCC’10, 2010년 6월 10-11일, 미국 인디애나 주 인디애나 폴리스.
  3. http://www.seagate.com/internal-hard-drives/enterprise-hard-drives/hdd/enterprise-capacity-3-5-hdd/

 

태그:

관련 제품
Enterprise Performance 10K HDD
Seagate Enterprise Performance 10K HDD

미션 크리티컬 서버 및 외장 스토리지 어레이. SED 및 FIPS 옵션.

enterprise-perf-15k-300gb-dynamic
Enterprise Performance 15K HDD

SED, SED-FIPS와 TurboBoost™의 강화된 캐시 모델을 탑재한 블레이드, 랙 및 타워 서버를 위한 2.5인치 드라이브.

enterprise capacity 2-5 상단 히어로 좌측 2tb
Enterprise Capacity 2.5 HDD

보안 드라이브 옵션이 포함된 블레이드 서버와 JBOD/RAID 시스템을 위한 저전력.

Terascale HDD 다이내믹
Seagate Terascale HDD

NAS, DAS를 위한 저전력 클라우드 스토리지. ISE(즉각 보안 삭제) 보안 옵션