www.engineering-japan.com
05
'26
Written on Modified on
AIデータセンターファブリック向けPCIe 6.0リタイマー
Microchipは、大規模GPUクラスターにおける信号到達距離の拡張とリソース利用率の向上を目的とした低遅延インターコネクトソリューションを発表した。
www.microchip.com

Microchipは、AIデータセンターにおける信号品質と遅延の課題に対応するため、PCIe 6.0およびCXL 3.1対応リタイマーファミリーを発表した。この製品は、より大規模で柔軟なサーバーアーキテクチャをサポートするとともに、AIファブリックにおけるメモリ拡張とリソース分離を可能にする。
高速AIインフラにおける信号品質の課題
現代のAIクラスターでは、CPU、GPU、メモリプール、およびストレージシステム間でデータを転送するために高帯域幅インターコネクトが利用されている。PCIe 6.0の64GT/sという高速データレートに達すると、プリント基板、ライザーカード、コネクター、ケーブル全体で信号品質を維持することがますます困難になる。
信号劣化は、データを安定して伝送できる物理的距離を制限し、システムの拡張性を低下させるだけでなく、大規模GPU環境におけるボトルネックの原因となる。これにより、メモリやコンピューティングリソースが十分に活用されず、AIアクセラレーターインフラの効率低下につながる可能性がある。
こうした課題に対応するため、MicrochipはXpressConnect PCIe 6.0/CXL 3.1リタイマーファミリーを開発した。この製品は高速信号を再生成し、従来のPCIe Gen 5およびGen 6の電気的制約を超えて信号伝送距離を延長できるよう設計されている。
AIファブリック全体での低遅延データ転送
数千台規模のアクセラレーターが同時にデータをやり取りするAIデータセンターでは、遅延が重要な性能指標となっている。Microchipによると、このリタイマーのピン間遅延は12ナノ秒未満であり、PCIe 6.0仕様で規定される上限と比較して約80%短い。
この低遅延性能は、高密度AIクラスター内で発生するデータ待機時間を削減し、GPU、アクセラレーター、および共有メモリ間の通信効率向上を目的としている。データパス内の遅延を低減することで、高価なAI計算リソースの利用率向上にも寄与する。
Microchipは、このリタイマーをスケーラブルなAIファブリックを構築するための基盤技術と位置付けている。大規模コンピューティング環境においては、効率的なデータ移動が計算性能そのものと同等に重要になりつつある。さらに、この技術はメモリ拡張やリソース分離をサポートし、インフラ運用者がリソースをより柔軟かつ効率的に共有・割り当てできるようにする。
PCIe 6.0およびCXL 3.1接続アーキテクチャ
このリタイマーは、最大64GT/sで動作するPCIe 6.0およびCXL 3.1インターコネクトに対応している。複雑なサーバーマザーボード、ライザーカード、バックプレーン、およびケーブル接続アーキテクチャへの導入を想定して設計されている。
現行世代のプラットフォームに加え、PCIe Gen 3、Gen 4、およびGen 5環境にも統合可能であり、データセンター運営者やシステム設計者は複数世代のハードウェアに共通の接続アーキテクチャを展開できる。
また、1x16、2x8、4x4といった柔軟なレーン分割構成をサポートしている。業界標準のリタイマーフットプリントガイドラインに準拠しているため、多様なサーバーおよびアクセラレータープラットフォームへの導入が可能であり、設計の複雑さを軽減できる。
データセンター接続エコシステムとの統合
この新製品は、Microchipのデータセンター向け製品ポートフォリオを補完するものであり、3nmプロセスのSwitchtec PCIe Gen 6スイッチ、Adaptec SmartRAIDコントローラー、ホストバスアダプター(HBA)、およびFlashtec NVMeコントローラーとの連携を想定している。これらのコンポーネントは、相互運用可能なPCIeおよびCXLファブリック内で動作するよう設計されている。
さらに、このリタイマーは同社のChipLink診断エコシステムとも統合されている。統合GUI(グラフィカルユーザーインターフェース)を通じて、リアルタイムの2次元アイダイアグラム解析やPAM4テレメトリーデータを取得できる。
これらの機能により、データセンターネットワーク全体のリンク品質、信号品質、およびインターコネクトの健全性を継続的に監視することが可能になる。
このような可視化機能は、障害解析やトラブルシューティングを容易にし、問題特定や保守作業の迅速化によって総所有コスト(TCO)の削減につながる可能性がある。
ハイパースケール環境向けエンタープライズ機能
このリタイマーは、業界標準インフラに対応したドロップインソリューションとして設計されている。このアプローチにより、ハイパースケール事業者は複数ベンダー間の相互運用性を維持しながら、特定ベンダーへの依存リスクを低減できる。
エンタープライズ向け機能として、ホットプラグ対応、エンドツーエンドのデータ整合性機能、および最新AIサーバーアーキテクチャとの互換性を備えている。これらの機能は、システム可用性とサービス継続性が重要となる大規模クラウド環境において特に有用である。
追加情報
このセクションでは、元のニュースリリースに含まれていなかった技術仕様および競合比較情報について説明する。
PCIe 6.0およびCXLリタイマー市場には、Marvell、Rambus、Montage Technologyなどの企業が製品を提供している。Microchipの製品と同様に、競合するPCIe 6.0リタイマーも64GT/s動作をサポートし、AIサーバー、CXLメモリ拡張システム、およびリソース分離型インフラを主な対象としている。MarvellのAlaska Pリタイマーは、高度なテレメトリー機能と低遅延性能を備えたPCIe Gen 6およびCXL 3.x接続をサポートしている。一方、Montage TechnologyのPCIe 6.x/CXL 3.xリタイマーは、最大64GT/sのデータレートと強化されたリンク診断機能を提供する。
Microchipが差別化要因として挙げているのは、12ナノ秒未満のピン間遅延性能に加え、PCIe 6.0およびCXL 3.1への対応、旧世代PCIeとの後方互換性、さらにPCIeスイッチ、ストレージコントローラー、診断ツールを含む広範なエコシステムとの統合である。また、標準リタイマーフットプリントへの準拠や、メモリ分離およびリソースプーリングを重視したAIファブリックアーキテクチャへの対応も強調している。
Aishwarya Mambet(Induportals編集者)、AIの支援により編集。
www.microchip.com

