TrinityX Cluster Manager は ClusterVision が開発したHPC及びAIシステムの構築・管理のためのツールです。
簡素化した構成管理とプロビジョニング、リアルタイムのシステム監視、ユーザーポータルと一体化した管理画面により、運用コストを大幅に削減できます。
数ノードの小規模から 1,000 ノード以上の大規模なクラスターシステムまで、構築と管理を効率的に行い、運用コストを大幅に節約するソフトウェアです。GPUを搭載した大規模なクラスターシステムであっても、容易にシステム構築と運用管理することができます。
HPC および AI 環境として、Linux ベースのクラスターシステムに必要なものを全てワンストップで提供します。OS 管理(RHEL及び互換ディストリビューション、Ubuntu)、ジョブスケジューラ(Slurm、PBS)、CUDAやInfiniBandのドライバーとソフトウエアスタック、ユーザーポータル(Open OnDemand)、並列ストレージ( BeeGFS、Lustre、SpectrumScale) などを標準でサポート。システムをスムーズかつ効率的に構築し、即時運用することができます。
Pacific Teck では TrinityX の導入について、初期設定や使用目的に応じた機能の設定など、導入に関する技術コンサルティングを請け負っています。
TrinityXはユーザーフレンドリーなインターフェイスを用いて、ステップバイステップにクラスタ構築と設定を行えます。
出来上がった環境は、従来の HPC 環境のみならず、昨今の AI 用途にも向いた構成となります。また、マルチGPU、InfiniBand/RDMAアーキテクチャ、高速ネットワークスイッチの導入と監視設定など、導入ハードルの高い構成を標準的にサポートしています。
プロビジョニングには BitTorrent プロトコルを使用、小規模 (5 ノード) から大規模 (1000 ノード以上) のノードへのHPC/AI環境のデプロイを数分で完了します。
さらに、このデプロイは TPM(Trusted Platform Module)モジュールによって管理されるセキュアなPXEブートによって行われます。
ファイルの入出力、ジョブの投入・管理を行うユーザーポータルとして、業界標準の OpenOndemand を搭載。VNC によるリモートデスクトップや、Jupyter Notebookを slurm のジョブとして投入でき、コントローラノードへのターミナルもブラウザ内から起動することが可能です。
また、管理者アカウントで接続すると、クラスターの構成管理やモニタリングなどの管理機能へもユーザーポータルを経由してアクセスできます。
システム全体のヘルスチェックとパフォーマンスを監視することができます。TrinityX のダッシュボードは、クラスタメトリクス、リソースの使用率、ワークロードの分散をリアルタイムで把握でき、カスタマイズも可能です。これらの情報から、ボトルネックを特定したり、リソース割り当てを最適化することもできます。
TrinityX はクラスタリソースを効率的に管理し、利用率を最大化するための情報を提供します。リソースの割り当て、リソースクォータの設定、リソースプロビジョニングの自動化など、多彩な機能により管理コストを最小化します。
TrinityXは、Slurm、(open)PBSpro を標準でクラスタに組み込み、モニタリングします。
クラスタ全体でワークロードを分散処理しつつ、キューへのジョブの蓄積状況などの履歴を表示して分析することができるため、利用状況に合わせたスケジューリング設定の調整が容易です。
TrinityXは、各種のオープンソースソフトウエアを組み合わせたクラスターマネージャーであり、お客様独自の要件を満たすために必要な柔軟性と拡張性を提供します。モジュラーアーキテクチャにより、機能を容易にカスタマイズ、拡張し、他のツールやシステムと統合することができます。さらに、活気あるコミュニティにより継続的な開発とサポートが保証され、信頼性の高い進化するソリューションとなっています。
TrinityXは BeeGFS、Lustre、IBM Spectrum Scale (GPFS)、など、HPCで一般的な並列ファイルシステムをサポートしています。
TrinityXは、SLA主導のリモートシステム管理(PHASE III)を可能にするマネージドサポートフレームワークを実現します。
TrinityX コマーシャルサポート | TrinityX コミュニティエディション | |
---|---|---|
サポート | 強化されたサポート | 自己管理型 |
応答する時間 | 翌営業日 | – |
サポートとディスカッションチャンネル | メール、Microsoft Teams | GitHub |
TrinityX コードサポート | 〇 | – |
TrinityX クラスター管理ポータル | 〇 | 〇 |
OpenHPC と OpenOnDemand※1 TrinityX の統合 | 〇 | 〇 |
GPU、InfiniBand、OpenHPC ツール: CUDA、ROCm、Slurm、MPI | 〇 | – |
ヘルスチェックとインストールサポート | 〇 | – |
診断、トラブルシューティング | 〇 | – |
並列ファイルシステムのインストール、チューニング、サポート | オプションサービス | – |
エンドユーザーアプリケーションの統合、チューニング、テスト | オプションサービス | – |
データバックアップの設計、統合、サポート | オプションサービス | – |
徹底的な管理者およびユーザートレーニング | オプションサービス | – |
キャパシティプランニング / ユーザーアプリケーションベンチマーク | オプションサービス | – |
※1 TrinityXコマーシャルサポートのOpenOndemandベストエフォートサポートが必要な場合は別途お見積もりをご用意いたします。
お客様のご要望に合わせてカスタマイズが可能です。システム構成などお気軽にご相談ください。*必須項目