Slurmは、AI・機械学習、HPC 向けのジョブスケジューラーです。小規模から大規模な HPC クラスターシステムに加え、昨今の GPU クラスターシステムにも対応しています。
特に NVIDIA GPU に対する機能の実装を拡大し、昨今の AI と機械学習向けの GPU クラスターシステムでのスタンダードなジョブスケジューラーとなっています。ハイパフォーマンスシステムのワークロードを最適化し、最高のパフォーマンスと効率的なリソース使用率を確保することができます。
Slurm はシステムを効果的に管理するためのツールと機能を提供します。ジョブの投入と監視からリソースの割り当てやアカウンティングまで、Slurm は包括的な機能を提供します。
高度なスケジューリング アルゴリズムにより効率的にリソースを割り当てることができるため、リソースの利用率を最大化することができます。クラスターシステム全体のワークロードのバランスを調整し、アイドル時間を最小限に抑えてスループットを最大化します。
Slurm は監視およびレポート機能を有しています。パフォーマンスと使用率に関するリアルタイムの分析情報を提供し、さまざまなメトリックを用いた情報を確認することができ、ワークロードをさらに最適化することができます。
オプションのプラグインには、アカウンティング、リソース制限、SLA/QoS、高度な予約、バックフィル スケジューリングなどの機能を使用することができます。ご要望に応じてプラグインに関するコンサルティングを承っています。
多くのジョブが投入される環境で大きなジョブと小さなジョブが混在する場合、大きなジョブのリソースが確保されないため大きなジョブの実行が始まらないといった問題がありました。Slurm はこのような問題を解決する様々な機能が採用されており、リソースを最大限に活用するための効率的なジョブスケジューリングを行うことができるようになっています。
Slurm を用いると計算時間が短縮され、ユーザー エラーが減り、運用コストが削減されるなどのさまざまなメリットを得られます。効率的な設定は構成支援サービスをご利用いただくことで最適なものをご紹介させていただくことが可能です。
Pacific Teck は、SchedMD社と提携してSlurm Workload Manager のコマーシャルサポートを提供いたします。
Slurm はオープンソース ソリューションですが、ソースコードの 95% 以上を SchedMD社 が記述しているため、障害発生時のパッチファイルの提供や CVE の対応など、システムをセキュアに継続的に運用していくために必須なコマーシャルサポートを提供することができます。
Pacific Teckが日本国内専用Slurmマーシャルサポート窓口となり、Slurm の修正が必要な技術的問題を Slurm の開発を行う SchedMD社 にエスカレーションし対応します。
万が一、システムの根幹をなすジョブスケジューラーが停止してしまうと、高価なシステムを使用することができない期間が発生し、大きな損失が発生してしまう可能性があります。Slurm コマーシャルサポートはそのような緊急時にも、Slurmのプロフェッショナルサポートを受けられるので安心です。
SchedMD は Slurm のソースコードの 95% 以上を記述する実質的な Slurm の開発元にあたる米国企業です。Slurm の開発に加えて障害発生時に対する技術サポートと利用者/管理者/SI 向けのトレーニングを提供しています。
Pacific Teckが日本国内専用Slurmマーシャルサポート窓口となり、Slurm に関する技術的問題を Slurm の開発を行う SchedMD社 にエスカレーションし対応します。
Slurmコマーシャルサポートではお客様にて生じた障害の深刻度(Severity)に応じてサポートを提供します。
システム障害が継続し、多数のエンドユーザーに影響を及ぼしています。Slurm の問題によりシステムがダウンまたは使用不能な状態にあり回避する方法がありません。
散発的な停止または重大なシステム障害を引き起こしている大きな影響の問題があります。この問題は常にエンドユーザーに影響を及ぼし、システムの利用を困難にしています。
システムアクセスの部分的、重大ではない損失を含む問題や、システム上の一部の操作に障害が発生していますが、回避策によりエンドユーザーがシステムを利用することができる、中程度から大規模な影響の問題が生じています。
顧客環境内の機能の一部または全く失われない軽度の問題が発生してます。
(または、設定に関する質問や、テスト・システムで作業する場合に使用します。Severity 4 の問題は、将来の製品の改良や修正に関する要望として使用することもできます。)
Pacific Teck Japan
月曜日から金曜日の 9:00~17:00 (日本の祝祭日、年末年始を除く)
SchedMD (米国およびヨーロッパ)
月曜日から金曜日の 2:00~17:00 MST* (日本時間 17:00~9:00* / 米国の祝祭日、年末年始を除く)
日本の営業時間が終わるとヨーロッパ、米国と順次営業が開始されるため土曜9:00から月曜9:00を除いた時間は24時間対応となります (祝祭日、年末年始を除く)
*サマータイム制度を採用しているため 3 月のサマータイム開始時からは 1 時間遅くなり、11 月の終了以降は 1 時間早くなります(元に戻ります) 。
毎年のサマータイムの詳細について確認が必要な場合はお問い合わせください。
SchedMD のエンジニアがオンサイトまたはオンラインで実施します。ご要望に応じて利用者/管理者向けの内容をカスタマイズして提供します。
Slurm を最大限に活用いただくため、Slurm の専門家が目的に応じたシステムの構成や設定について構成支援を提供します。
Slurm に機能を追加したいといったご要望にSlurm の専門家が対応します。
お客様のご要望に合わせてカスタマイズが可能です。システム構成などお気軽にご相談ください。