| トピック | 出題範囲 |
| トピック 1 | - 管理:このセクションでは、システム管理者のスキルを評価し、データセンターにおけるAIワークロードの管理に不可欠なタスクを網羅します。受験者は、フリートコマンド、Slurmクラスタ管理、そしてAI環境に特有のデータセンターアーキテクチャ全体を理解していなければなりません。また、Base Command Manager(BCM)、クラスタプロビジョニング、Run.ai管理、そしてAIとハイパフォーマンスコンピューティングアプリケーションの両方に対応したマルチインスタンスGPU(MIG)の構成に関する知識も求められます。
|
| トピック 2 | - ワークロード管理:このセクションでは、AIインフラストラクチャエンジニアのスキルを評価し、AI環境におけるワークロードの効率的な管理に焦点を当てます。Kubernetesクラスターの管理、ワークロード効率の維持、システム管理ツールを用いた運用上の問題のトラブルシューティング能力を評価します。NVIDIAテクノロジーと連携し、異なる環境間でワークロードがスムーズに実行されることを重視します。
|
| トピック 3 | - インストールと展開:このセクションでは、システム管理者のスキルを測定し、インフラストラクチャのインストールと展開に関するコアプラクティスを扱います。受験者は、Base Command Manager のインストールと設定、NVIDIA ホストでの Kubernetes の初期化、NVIDIA NGC およびクラウド VMI コンテナーからのコンテナーの展開についてテストされます。また、AI データセンターにおけるストレージ要件の理解、DPU Arm プロセッサーへの DOCA サービスの展開、AI ドリブン環境の堅牢な構築についても学習します。
|
| トピック 4 | - トラブルシューティングと最適化:NVIこの試験セクションでは、AIインフラストラクチャエンジニアのスキルを評価し、高度なAIシステムで発生する技術的な問題の診断と解決に焦点を当てます。出題範囲には、Docker、NVIDIA NVlinkおよびNVSwitchシステムのFabric Managerサービス、Base Command Manager、Magnum IOコンポーネントのトラブルシューティングが含まれます。受験者は、ストレージパフォーマンスの問題を特定して解決し、AIワークロード全体で最適なパフォーマンスを確保する能力も実証する必要があります。
|