AI 서버의 전원 공급 장치(PSU)는 어떻게 선택하나요?AI 서버의 전원 공급 장치 솔루션

2023-10-04

如何挑選AI伺服器電源供應器(PSU)?

AI 기술이 빠르게 발전하고 보급됨에 따라, 서버 시장에서는 최근 몇 년 동안 큰 변화가 일어났습니다. Open AI에서 ChatGPT를 내놓은 뒤 언어 모델, 지능형 챗봇 바람을 일으켰으나, ChatGPT 뒤에서 이뤄지는 연산은 강력한 ‘AI 서버’에 의존합니다. 이에 따라, AI 서버 시장이 주목받기 시작했습니다.

 

AI 서버는 무엇인가요?

AI 서버는 특수하게 설계되고 최적화된 서버의 하나로, 이들 서버는 구글의 Tensor Processing Units (TPU) 또는 NVIDIA의 AI 가속기 카드 등과 같이 하나 또는 다수 개의 고효율 GPU(그래픽 처리 장치) 또는 AI 전용 가속기를 포함합니다. 이 하드웨어 장치들은 AI 활용을 위해 대량의 병렬 처리 능력을 제공합니다. 소프트웨어도 AI 서버의 중요한 구성 요소입니다. 이는 AI 및 머신러닝 작업량 최적화를 위한 운영 시스템을 포함하고, AI 프레임(예, TensorFlow, PyTorch 등)의 라이브러리 및 툴을 지원할 수 있습니다.

 

왜 AI 서버가 필요한가요? AI 서버의 응용

인공지능(AI)의 연산에 대한 수요가 매우 많기 때문에 AI 서버가 필요합니다. AI 서버는 방대한 데이터를 저장하고 처리하는데 최적화된 하드웨어 및 소프트웨어를 제공하여 AI 모델의 훈련 및 운영을 지원합니다. AI 서버의 응용범위는 매우 광범위합니다. 예를 들면, 이미지 및 음성 인식, 자연어 처리, 예측 분석, 개인 맞춤형 추천 시스템, 자율주행(영상 인식), 의료 영역(지능형 진단 등)이 있습니다.

 

AI 서버와 일반 서버의 차이점?

현재 최신 사양의 AI 서버는 각각 최대 6000 와트의 전력을 사용하며, 데이터 센터의 에너지 소비는 전세계 에너지 사용량의 약 2%를 차지합니다. 그러나 AI 서버의 에너지 효율은 일반 서버보다 더 높고, 보다 환경 친화적이며, 모델 훈련, AI 추론, 생산형 AI(GAI, Generative AI) 등의 응용 분야에서의 처리 속도도 훨씬 우세합니다. AI 모델 훈련의 경우, 대규모 언어 모델에는 10억에서 100억 개의 매개 변수가 포함되어 있으며, 올해(2024년) 1조 개의 매개 변수 수준을 넘어설 전망이며, AI 서버는 기술 발전을 주도하는 핵심 역할을 할 것으로 예상됩니다.

 

AI 서버와 일반 서버의 주요 차이점은 설계와 용도에 있습니다. 일반 서버는 데이터 저장, 프로그램 실행, 네트워크 서비스 등에 주로 사용되지만, AI 서버는 인공 지능 훈련과 활용을 위해 특별히 설계되었습니다. 일반 서버보다 AI 서버는 보다 강력한 CPU, GPU 또는 기타 사용자 지정 가속기 등을 장착하여 AI 서버는 보다 강력한 컴퓨팅 능력, 대용량 메모리 저장 공간, 고대역폭 네트워크 및 낮은 지연 시간과 같은 특성을 갖추고 있습니다. 또한 AI 서버는 고급 열 관리 기술과 초 고효율의 전원 모듈이 장착되어 있습니다. 결국 AI 서버(AI Server)와 과거에 사용되던 일반 서버(General Server) 사이에는 무엇이 다른지 더 자세히 살펴보겠습니다.

 

The differences between AI servers and general servers can be summarized as follows

 

General Server

Entry-level Accelerated Server

High-end Accelerated Server

Workload

Traditional Machine Learning

Inference, Generative AI

Inference, Training

CPU

1 or 2 CPUs

1 CPU

2 or more CPUs

Accelerator

CPU Built-In

1-4 GPUs or other custom accelerators.

4~10 GPUs or other custom accelerators.

Memory

Registered DDR Memory

Registered DDR Memory+GDDR VRAM

Registered DDR Memory+ HBM

Network Transfer

10 or 25 Gbps Ethernet

100+ Gbps Ethernet

400+ Gbps Ethernet NIC, Infiniband

Power Module

1300W~2000Wx2

2000Wx3 or 3000Wx4

3000Wx6

 

 

현재 주류 AI 서버는 NVIDIA의 H100이며, Hopper GPU 아키텍처를 사용하며, 제 9 세대 데이터 센터 GPU로, 이전 세대 A100의 성능을 30 배로 향상시킬 수 있습니다. 대형 언어 모델을 훈련하는 데 매우 적합하지만, 전력 소비도 매우 높습니다. 국제 에너지 기구 (IEA)의 추정에 따르면, AI 모델을 훈련하는 데 사용되는 전력은 100 가구의 연간 전력 사용량보다 많다는 것을 보여주며, 이는 향후 데이터 센터가 전력 소비 대가가 될 것임을 시사합니다. AI 서버는 시스템 가용성에 중점을 두며, 훈련 중에 전력이 중단되면 결과의 손실을 초래할 수 있으므로 AI 서버에는 여러 고전력 전원 모듈이 병렬로 장착되어 서버가 중단되지 않도록 보장해야 합니다.

 

FSP는 고전력 전원 모듈 개발에서 수년간의 경험을 쌓았으며, 제품 라인은 전통적인 일반 서버부터 최신 AI 가속 서버까지 지원합니다. 또한, 다양한 브랜드의 서버에서 FSP 제품을 사용하고 있습니다. FSP 전원 모듈은 전체 디지털 (Full Digital) 디자인을 채택하며, 효율성 성능은 모두 80PLUS 티타늄 (80PLUS Titanium) 수준을 충족합니다. 전력 모듈을 병렬로 사용할 때 고급 AI 서버를 지원할 수 있으며, 4~10개의 GPU가 동시에 작동하여 AI 계산 요구를 충족하는 동시에 에너지 효율을 크게 향상시킬 수 있습니다.

 

미래에는 AI 가속 연산 분야에서 더 많은 혁신적인 제품과 새로운 아키텍처가 나타나며 인공 지능 분야의 지속적인 발전을 지원할 것입니다. 이러한 새로운 기술은 계산을 더 효율적으로 만들 것이며, 물론 GPU 소비 전력도 계속 증가할 것이며, 전원 모듈에 대한 요구도 더 많아질 것입니다. FSP는 업계 동향을 지속적으로 관찰하고 대응 제품을 출시하고 있습니다. 자세한 정보는 https://www.fsp-group.com/kr/product/IPCPSU.html에서 확인하실 수 있습니다.

 

AI 서버 장점 및 전망

VR/AR, 초고화질, 자율주행 기술 등 신기술에 대한 수요에 따라 현 단계에서 전 세계는 데이터 폭발의 시대에 살고 있습니다. ICD 통계에 따르면, 전 세계 클라우드 데이터량은 2013년 4.4ZB에서 2023년 >50ZB가 되었고, 10배 이상 증가했습니다. 전 세계 클라우드 데이터량이 빠르게 증가하는 추세에서, AI 서버는 대용량 데이터를 동시에 처리하는 데 뛰어나고, 기업이 대용량 데이터를 저장하는 기본 장비로서 각 기업의 필수적인 전략적 요소가 됩니다. 또한, AI 서버 내부의 전원 공급 장치(PSU)는 AI 서버 성능에 영향을 미치는 핵심요소 중 하나입니다. AI 서버 내부의 하드웨어 부품이 요구하는 전력은 일반 서버보다 훨씬 많기 때문입니다. 따라서, AI 서버의 전원 공급 장치(PSU)는 일반 서버와 비교하여 더 많은 전력을 공급하여 고성능 부품을 구동하고, 또한, 충분한 잔여 전력으로 부하의 변화에 대응하여 데이터 정체를 방지해야 합니다.

 

AI 서버 전원의 중요성(와트, 안정성, 신뢰성)

좋은 AI 서버용 전원 공급 장치(PSU)를 고르기 위해서는 먼저 이해해야 할 점이 있습니다. AI 서버가 안정적으로 작업을 수행하기 위해서는 강력하고 안정적인 전원 공급 장치(PSU)가 뒷받침되어야 합니다. PSU는 핵심 부품의 하나로, 전력망의 교류 전류(AC)를 서버의 전자부품에 필요한 직류 전류(DC)로 전환하는 역할을 합니다. 고성능 AI 서버에 있어 PSU는 충분하고 안정적인 전력으로 CPU, GPU 또는 AI 가속기를 제공해야 합니다. 이 외에도, PSU의 효율은 핵심적입니다. 이는 전체 에너지 소비 및 발열 필요에 직접적으로 영향을 미칩니다. 고효율의 PSU는 에너지 소비를 최소화하고, 발열을 낮춰 서버가 고부하 운영 시에도 안정성을 유지할 수 있습니다. 또한, 고효율의 PSU는 전원 공급 장치의 수명을 연장시키고, 전원 문제로 인한 서버의 정지 시간을 줄여줍니다.

 

AI 서버 전원 공급 장치(PSU)를 선택하는 방법은 다음과 같습니다

전원 요구 사항 확인:

 먼저 모든 하드웨어 요구 사항을 충족시키기 위해 충분한 전력을 제공하는지 확인하십시오. 시스템 장애를 방지하기 위해 전력 요구 사항보다 높은 와트 수를 선택하는 것이 좋습니다. 복잡한 연산 시스템일수록 전원 공급량이 더 높아질 수 있으며, AI 서버의 총 전력 공급량은 18kW에 이를 수 있습니다.

효율 등급:

효율 등급도 중요한 고려 사항 중 하나입니다. 효율이 낮은 제품은 전력을 낭비하고 열을 증가시킬 수 있으며, PSU의 수명을 단축시킬 수 있습니다. 효율 등급 시스템 중 주요한 것은 "80 Plus" 에너지 효율 등급입니다. 이는 전원 공급 장치가 적어도 80%의 효율을 보장할 수 있다는 것을 의미합니다.

 

80 PLUS Rating

Rating

Typical Load Efficiency

80 PLUS Bronze

85%

80 PLUS Silver

89%

80 PLUS Gold

92%

80 PLUS Platinum

94%

80 PLUS Titanium

96%

Source: Intel, compiled by the author

 

안전성과 신뢰성:

양호한 전원 공급 장치는 우수한 안정성과 신뢰성을 갖추어야만 중요한 보호 기능을 발휘할 수 있습니다. 우수한 전원 공급 장치 제조업체는 PSU에 대한 다양한 제품 테스트를 진행합니다. 이는 출력 전압 조정, 전력 조정률, 부하 조정률 등의 기능 테스트를 포함합니다.

보호 기능:

전원 공급 장치가 우수한 보호 기능을 갖추었는지 확인해야 합니다. 과부하 보호(OCP), 과열 보호(OTP), 과전압 보호(OVP)와 같은 세 가지 보호 기능은 PSU에 내장된 안전 기능으로, 하드웨어 손상을 방지하고 시스템 안정성을 보장하기 위해 사용됩니다. 과부하 보호(OCP)는 출력 전류가 한계를 초과할 때 PSU를 차단하거나 제한하여 하드웨어 손상을 방지합니다. 과열 보호(OTP)는 내부 온도가 과도하게 높을 때 PSU가 자동으로 차단되어 과열을 방지합니다. 과전압 보호(OVP)는 출력 전압이 한계를 초과할 때 PSU를 차단하거나 제한하여 하드웨어가 고전압으로부터 손상을 입지 않도록 보호합니다.

커넥터와 크기:

전원 공급 장치의 케이블 디자인은 전체 모듈, 반 모듈, 비 모듈화 디자인으로 구분됩니다. 이들의 차이는 케이블을 분리할 수 있는지 여부로, 주문 제작이 가능한지 여부에 영향을 줍니다. 또한 커넥터 선택은 매우 중요합니다. 이는 메인 보드와 다른 하드웨어 구성 요소를 올바르게 연결하는 데 사용됩니다. 또한 PSU는 다양한 크기가 있으며, 적절한 크기를 선택하여 케이스 내에 충분한 공간을 확보할 수 있도록 해야 합니다.

열 배출과 소음:

전원 공급 장치는 열 배출 팬이 장착되어야 하는 하드웨어이기 때문에 팬의 열 배출 효율과 소음이 PSU를 선택하는 데 고려해야 할 사항 중 하나입니다. 전원 공급 장치 팬의 속도가 빠를수록 열 배출 효율이 높을 수 있지만 더 큰 소음을 발생시킬 수 있으므로 소비자는 두 가지를 균형 있게 고려해야 합니다. 또는 전문 전원 공급 장치 제조업체가 생산하는 제품을 선택할 수도 있습니다.

 

FSP AI 서버의 전원 공급 솔루션

이러한 필요를 고려하여, FSP는 일련의 AI 서버용 전원 공급 장치를 출시했고, 이중 가장 대표적인 제품은 FSP3000-20FE 입니다. 이 제품은 전고조파 왜곡률(iTHD)이 매우 낮고, 동작온도 범위는 0~55°C이며, 해발 5,000미터에 적응할 수 있도록 설계되어 있습니다. 최대 3000W 총 전력량을 제공할 수 있습니다. 열악하고 극단적인 환경에서도 이 제품은 여전히 동작할 수 있으며, 적응력이 매우 강한 장점이 있습니다. 또한, 이 제품은 과전류보호(OCP), 과열보호(OTP) 및 과전압 보호(OVP) 회로 보호 설계가 되어 있고, 출력단의 단락 보호 및 재복구 전원 차단 기능으로 메인보드와 통신할 수 있어 안전성을 신뢰할 수 있습니다. 이러한 보호들로 인해 기계가 과열되거나 과부하로 인해 기계 전체가 고장나는 문제를 걱정할 필요가 없습니다. FSP는 YSEC1600AM-2A00P10, YSEC2000AM-2A00P10과 같은 우수한 서버용 제품을 다수 출시했습니다. 이 제품들은 AI 서버용 전원 공급 장치로, 80 Plus Platinum 인증을 받았으며 효율이 최대 94%에 달하고 PMBus 1.2기술이 탑재되어 있습니다. 작고 정교하여 에지 컴퓨팅 장치에 설치하기에 적합하다는 장점이 있습니다. 또한, 높은 변환 효율 및 우수한 발열 성능으로 인해 장시간 작동하더라도 전원 공급 장치 및 에지 컴퓨팅 장치가 안정적으로 운영됨을 보장할 수 있습니다.

 

이후 에지 컴퓨팅 및 AI 기술이 더욱 발전함에 따라 이들 하드웨어의 필요성은 점점 더 높아집니다. 이와 같은 상황에서 향후 AI 서버와 이의 전원 공급 장치는 더욱 중요한 역할을 수행합니다. 적합한 전원 공급 장치를 선택하는 것은 AI 서버의 원활한 운영을 보장하고 AI 활용의 지속적인 발전과 혁신을 보장할 수 있습니다.

 

산업용 PC전원: FSP3000-20FE
  • 낮은 전류 총합 왜형률
  • 작동 온도: 0 to 50°C
  • 해발 5천 미터 사용 설계
  • OCP, OTP, OVP 회로 보호 지원
  • 모든 출력에서 단락 보호
  • 전원 중단시 복귀 가능
  • 평균 무고장 시간: 25°C, 100% 출력 부하에서 10만 시간 연속 작동
YSEC1600AM-2A00P10
  • N+1 Redundant
  • Support PMBus 1.2
  • Hight Power Density 39.5 W/in3
  • Application for IPC/Storage/Embedded server/Networking
YSEC2000AM-2A00P10
  • N+1 Redundant
  • Support PMBus 1.2
  • Hight Power Density 48.3 W/in3
  • Application for IPC/Storage/Embedded server/Networking

 

Know more about edge computing applications

 

FSP소개

세계 최고의 전원공급장치 제조업체인 FSP그룹은 1993년 설립 이래 '서비스, 전문, 혁신'이라는 경영 철학을 바탕으로 포괄적인 그린 에너지 솔루션 제품을 공급하고 있습니다.

hi this is over contact us
item is select