생성형 AI, 클라우드 등이 최근 이슈화 되면서 데이터센터의 중요성이 점차 강화되고 있다. 이로 인해 각 기업들과 기관에서 데이터센터 구축에 혈안이 되어있으며, 이로 인해 데이터센터의 안정성과 가용성이 무엇인지, 어떻게 담보할 수 있는지, 그리고 유지보수는 제대로 이루어질 수 있는지 등에 대해 관심이 늘어나고 있다. 데이터센터는 그 규모와 성능을 비교할 때 일반적으로 용량(Capacity)과 가용성(Redundancy) 그리고 효율성(Efficiency) 등으로 비교하게 되는데, 오늘은 그에 대해 알아보기로 하자.
1. 용량 (Capacity)
데이터센터에서 "용량"은 데이터센터의 규모를 의미한다. 요즘은 10메가와트(10MW), 20메가와트 등 대형 데이터센터가 많이 만들어지고 있는데, 이렇게 데이터센터는 그 데이터센터가 수용할 수 있는 IT인프라의 최대 용량으로 그 데이터센터의 규모를 말하는 게 일반적이다. 하지만, 과거에는 거의 모든 데이터센터가 2~3kW의 랙전력을 공급했었기 때문인데, 데이터센터의 규모는 주로 면적이나 랙수량으로 표시되어 왔었다. 최근 AI와 머신러닝 등으로 전력소모가 50kW가 넘는 등 랙전력의 다양성으로 인해 면적 및 랙수량과 더불어 데이터센터의 IT부하(IT load, IT인프라가 사용할 수 있는 전기 용량)를 통해 규모를 가늠하고 비교하는 사례가 증가하고 있다.
전산실의 면적 | 전산실의 면적이 넓을수록 확장성에 유리함 |
랙 수량 | 랙수량은 면적과 비슷한 개념인데, 수용 가능한 랙수량이 많을수록 확장성에 유리한 구조로 평가함 |
랙 전력 | 랙 전력은 랙당 kW로 나타나는데, 랙 전력의 상승되는 추세로 점점 더 중요해 지고 있 |
IT부하 | 해당 데이터센터가 IT장비에 공급할 수 있는 총 전력량(kW 또는 MW)을 말함 |
2. 가용성 (Redundancy)
데이터센터에서 "가용성"은 해당 데이터센터에 입주한 IT인프라가 중단없이 가동되는 수준을 의미하는데. 데이터센터의 성능에 대한 비교지표 중 가용성이 가장 중요하다. 왜냐하면 데이터센터가 IT 장비가 최적의 상태로 가동될 수 있도록 많은 기계, 전기, 보안 설비등을 운영하다 보면 불가피하게 가동이 중단되는 상황이 발생하게되고 이 때 IT장비를 중단하지 않는 운영이 가능하다면 높은 등급의 가용성을 공급하는 데이터센터로 평가 받을 수 있기 때문이다. 가동이 중단되는 상황에는 크게 예치 못한 장애, 정기적인 테스트 및 점검, 수명이 다된 설비(부품)의 교체 등 세가지 상황이 있다. 그리고 가용성 수준은 티어(Tier)라는 지표로 나타난다. 티어는 기계, 전기, 통신, 소방 등 설비(인프라스트럭처)의 백업 구성수준을 등급화 한 것인데, TIER I, TIRE II, TIER III, TIER IV 등급으로 나누어 지며 등급이 높을수록 높은 가용성을 공급하는 데이터센터로 판단되어 진다.
구 분 | TIER I |
TIRE II | TIER III | TIER IV |
연간 가동율 | 99.671% | 99.741% | 99.982% | 99.995% |
연간 IT장비 다운타임 | 28.8시간 | 22.0시간 | 1.6시간 | 0.4시간 |
주요 수요처 | 일반 인터넷서비스 | 소규모 연구소 등 | 상업용 IDC | 금융기관, 국가기관 |
3. 효율 (Efficiency)
데이터센터에서 "효율"은 기계, 전기, 통신, 소방 등 인프라 스트럭처 설비의 에너지 효율을 말한다. 데이터센터가 전기를 얼마나 효율적으로 사용하도록 설계되고 운영되는지를 판단할 수 있는 지표를 PUE(Power Usage Effectiveness)라고 한다.
PUE(Power Usage Effectiveness) = Total Facility Energy / IT Equipment Energy
PUE는 총부하(데이터센터 전체가 사용할 수 있는 전기 용량)를 IT부하(IT장비가 사용할 수 있는 전기 용량)로 나눈 값이다.
즉, 데이터센터가 가진 총 전기용량 중 얼마만큼을 IT장비에 공급할 수 있는지를 말한다. 보통 1에서 2사이의 값을 가지며, PUE가 1에 가까울수록 에너지효율이 좋은 데이터센터라고 할 수 있다. 글로벌 데이터센터의 평균 PUE는 1.6 수준으로 낮아졌다가 최근 생성형 AI의 상용화 등으로 다시 높아지고 있는 추세이다. 한 통계에 따르면 국내 데이터센터 평균 PUE는 2.3이고, 가장 많은 데이터센터를 운영중인 구글의 경우 평균 PUE가 1.10로 알려져 있다.
이상 데이터센터의 규모 및 평가를 비교할 수 있는 대표적 지표인, 용량(Capacity), 가용성(Redundancy) , 효율성(Efficiency)에 대해 알아보았다.