www.engineering-japan.com
03
'26
Written on Modified on
AIファクトリー向け800V DC電源アーキテクチャ
Analog Devicesは、NVIDIA MGXエコシステムにおいて次世代AIインフラ向けのスケーラブルな電力供給を支援しています。
www.analog.com

Analog Devices(ADI)は、電力消費が増大するAIコンピューティング環境向けに設計された高電圧電源管理、保護、およびテレメトリ技術を通じて、NVIDIAのMGXベースAIファクトリーの導入を支援しています。
電力密度の向上を促進するAIインフラ
従来型データセンターからAIファクトリーへの移行により、ラック単位および施設全体での電力需要が増加しています。最新のGPUクラスターは、従来世代のコンピューティングインフラと比較して大幅に高い電力密度を必要とし、電力配分、効率、およびシステム拡張性に新たな課題をもたらしています。
NVIDIAのMGXアーキテクチャは、AIインフラの設計および導入を加速するために開発されたモジュール型のオープンプラットフォームです。このエコシステムにより、ハードウェアベンダーは相互運用可能なソリューションを開発しながら、進化するコンピューティング、ネットワーク、および電力要件に対応できます。
MGXエコシステムの参加企業として、ADIは次世代AIコンピューティングプラットフォームを支える電源管理技術を提供しています。
48Vから800V DCへの電力配分移行
AIインフラにおける最も重要な変化の一つは、従来の48V電源アーキテクチャからラックレベルの800V DC配電システムへの移行です。
GPUの消費電力が増加し続ける中、低電圧アーキテクチャは電流処理能力、導体損失、および電力配分効率に関する課題に直面しています。高電圧配電は、同じ電力を供給する際に必要な電流を削減し、抵抗損失を低減するとともに、電源インフラの簡素化に貢献します。
800V DCへの移行は、将来的にメガワット級のラック電力を必要とするAIシステムを支えることを目的としています。高電圧配電は、電力供給部品の小型化を可能にするとともに、より高い拡張性を持つシステム設計を実現します。
将来のMGXベースプラットフォームでは、電力供給効率がシステム性能と運用コストにおいてますます重要な要素になると考えられています。

AIシステム向けモジュール型電源インフラ
MGXのモジュール設計思想は、コンピューティングハードウェアにとどまらず、電源インフラの設計にも影響を与えています。
近年のAIシステムアーキテクチャでは、電源供給システムをコンピュートラックから分離する傾向が強まっています。これにより、将来のハードウェアアップグレードやプラットフォーム進化への柔軟な対応が可能になります。
このアプローチにより、インフラ全体を再設計することなくGPU要件の変化に対応できるほか、電力変換装置を専用サブシステムへ移設することで、ラック内のスペースをより多くの計算処理ハードウェアに割り当てることができます。
ハイパースケール事業者や大規模AI学習施設にとって、このモジュール型アーキテクチャは導入サイクルの短縮とエコシステム全体の相互運用性向上を支援します。
連続運用を実現する高電圧ホットスワップ技術
AIファクトリーは通常24時間365日稼働するため、システム保守やハードウェア交換は重要な運用要件となります。
ホットスワップ技術により、周辺インフラを停止することなくサーバートレイやシステムモジュールの挿入・取り外しが可能になります。しかし、800V DC環境でホットスワップ機能を実装するには、大きな技術的課題があります。
高電圧システムでは、接続時の突入電流を高精度に制御するとともに、高度な故障検知機能と迅速な保護動作によって機器の損傷を防ぐ必要があります。また、運用者はシステムの健全性を監視し、稼働率を維持するための詳細なテレメトリデータを必要とします。
これらの要件が、高電圧AIインフラ向けに特化した新しい保護・監視技術の開発を促進しています。
電力保護・制御・テレメトリ技術
ADIは、AIファクトリー向け800V DC電源アーキテクチャを支える複数の技術分野に注力しています。
同社のポートフォリオには、高電圧ホットスワップコントローラ、DC/DC変換技術、保護システム、およびテレメトリソリューションが含まれています。これらの技術は、厳しい電気的条件下でも高密度コンピューティング環境の安定運用を支援するよう設計されています。
主要な技術目標には、高速故障保護、高精度な電力制御、および電気性能の継続的な監視が含まれます。高度なテレメトリ機能はシステム運用の可視化を実現し、予知保全戦略を支援することで、インフラ可用性に影響を与える前に潜在的な問題を特定できるようにします。
AIインフラの規模拡大に伴い、デジタル電源管理とリアルタイム監視は、データセンター全体の信頼性戦略においてますます重要な要素となっています。
スケーラブルなAIファクトリー展開を支援
モジュール型AIインフラへの進化には、コンピューティングプラットフォーム、ネットワーク技術、および電力供給システム間の連携が必要です。NVIDIA MGXエコシステムにおいて、電源アーキテクチャはシステム密度、効率性、および拡張性を左右する基盤技術となっています。
ADIは、高電圧AIインフラに必要なDC/DC変換、保護、および監視機能を実現することに注力しています。800V DCアーキテクチャを支援することで、大規模なAI学習および推論環境に伴う増大する電力需要への対応を目指しています。
ラック当たりの消費電力が増加し続ける中、電力供給技術は将来のAIファクトリーの性能、効率、および運用信頼性を決定する上で、ますます重要な役割を果たすと考えられています。
Aishwarya Mambet(Induportals編集者)、AIの支援により編集。
www.analog.com

