日本語 English 中文
世界中のHPC専門最先端技術製品の販売・サポート
Slurmコマーシャルサポート

Slurm Workload Manager とは

Slurmは、AI・機械学習、HPC 向けのジョブスケジューラーです。小規模から大規模な HPC クラスターシステムに加え、昨今の GPU クラスターシステムにも対応しています。
特に NVIDIA GPU に対する機能の実装を拡大し、昨今の AI と機械学習向けの GPU クラスターシステムでのスタンダードなジョブスケジューラーとなっています。ハイパフォーマンスシステムのワークロードを最適化し、最高のパフォーマンスと効率的なリソース使用率を確保することができます。

Slurmコマーシャルサポート 包括的なワークロード管理

包括的なワークロード管理

Slurm はシステムを効果的に管理するためのツールと機能を提供します。ジョブの投入と監視からリソースの割り当てやアカウンティングまで、Slurm は包括的な機能を提供します。​

Slurmコマーシャルサポート 効率的なリソース割り当て

効率的なリソース割り当て

高度なスケジューリング アルゴリズムにより効率的にリソースを割り当てることができるため、リソースの利用率を最大化することができます。クラスターシステム全体のワークロードのバランスを調整し、アイドル時間を最小限に抑えてスループットを最大化します。​

Slurmコマーシャルサポート 徹底的な監視とレポート

徹底的な監視とレポート

Slurm は監視およびレポート機能を有しています。パフォーマンスと使用率に関するリアルタイムの分析情報を提供し、さまざまなメトリックを用いた情報を確認することができ、ワークロードをさらに最適化することができます。​

オプションのプラグインには、アカウンティング、リソース制限、SLA/QoS、高度な予約、バックフィル スケジューリングなどの機能を使用することができます。ご要望に応じてプラグインに関するコンサルティングを承っています。​

多くのジョブが投入される環境で大きなジョブと小さなジョブが混在する場合、大きなジョブのリソースが確保されないため大きなジョブの実行が始まらないといった問題がありました。Slurm はこのような問題を解決する様々な機能が採用されており、リソースを最大限に活用するための効率的なジョブスケジューリングを行うことができるようになっています。
Slurm を用いると計算時間が短縮され、ユーザー エラーが減り、運用コストが削減されるなどのさまざまなメリットを得られます。効率的な設定は構成支援サービスをご利用いただくことで最適なものをご紹介させていただくことが可能です。​

ユースケース

研究機関
研究機関
航空宇宙
航空宇宙
AI・機械学習​
AI・機械学習
自動車​ ・自動運転​
自動車・自動運転
バイオ・ゲノム
バイオ・ゲノム

クラウド
クラウド
エネルギー
エネルギー
金融
金融
政府機関
政府機関
製造エンジニアリング
製造エンジニアリング

Slurmコマーシャルサポート

Slurmコマーシャルサポート

Pacific Teck は、SchedMD社と提携してSlurm Workload Manager のコマーシャルサポートを提供いたします。
Slurm はオープンソース ソリューションですが、ソースコードの 95% 以上を SchedMD社 が記述しているため、障害発生時のパッチファイルの提供や CVE の対応など、システムをセキュアに継続的に運用していくために必須なコマーシャルサポートを提供することができます。

Pacific Teckが日本国内専用Slurmマーシャルサポート窓口となり、Slurm の修正が必要な技術的問題を Slurm の開発を行う SchedMD社 にエスカレーションし対応します。

万が一、システムの根幹をなすジョブスケジューラーが停止してしまうと、高価なシステムを使用することができない期間が発生し、大きな損失が発生してしまう可能性があります。Slurm コマーシャルサポートはそのような緊急時にも、Slurmのプロフェッショナルサポートを受けられるので安心です。

SchedMDロゴ

SchedMD は Slurm のソースコードの 95% 以上を記述する実質的な Slurm の開発元にあたる米国企業です。Slurm の開発に加えて障害発生時に対する技術サポートと利用者/管理者/SI 向けのトレーニングを提供しています。

Slurmコマーシャルサポートメニュー

Slurmコマーシャルサポート

Pacific Teckが日本国内専用Slurmマーシャルサポート窓口となり、Slurm に関する技術的問題を Slurm の開発を行う SchedMD社 にエスカレーションし対応します。

  • SchedMD は Slurm の最新バージョンと一つ前のバージョンのサポートを提供します。
    Slurm の新しいバージョンは 9 か月周期でリリースされます。
  • メジャー リリースにはバグ修正が提供されています。メンテナンス リリースは、ほぼ 1 か月ごとに提供されます。
  • 重要なバグ修正とセキュリティ修正は、最新バージョンと一つ前のバージョンで利用可能です。
  • 新機能の実装と既存のバージョンの動作の変更は次のメジャーリリースで適用されます。
  • アップグレードパスは二つ前のバージョンのいずれかから提供されます。

◼︎ サポートレベル

Slurmコマーシャルサポートではお客様にて生じた障害の深刻度(Severity)に応じてサポートを提供します。

Severity 1 : 重大な影響

システム障害が継続し、多数のエンドユーザーに影響を及ぼしています。Slurm の問題によりシステムがダウンまたは使用不能な状態にあり回避する方法がありません。

  • 初回受付:
    営業時間内 2 時間以内を目標に返信
  • 状況のご連絡:
    1 日毎
  • 継続対応:
    問題が解決するまで

Severity 2 : 高い影響

散発的な停止または重大なシステム障害を引き起こしている大きな影響の問題があります。この問題は常にエンドユーザーに影響を及ぼし、システムの利用を困難にしています。

  • 初回受付: 1 営業日内を目標に返信
  • 状況のご連絡: 1 週間毎
  • 継続対応: 営業日内での対応

Severity 3 : 中程度の影響

システムアクセスの部分的、重大ではない損失を含む問題や、システム上の一部の操作に障害が発生していますが、回避策によりエンドユーザーがシステムを利用することができる、中程度から大規模な影響の問題が生じています。

  • 初回受付: Pacific Teck Japan の翌営業日内に返信
  • 状況のご連絡: 1 月毎
  • 継続対応: 営業時間内での対応

Severity 4 : 軽度な影響

顧客環境内の機能の一部または全く失われない軽度の問題が発生してます。
(または、設定に関する質問や、テスト・システムで作業する場合に使用します。Severity 4 の問題は、将来の製品の改良や修正に関する要望として使用することもできます。)

  • 初回受付: Pacific Teck Japan の翌営業日内に返信
  • 状況のご連絡: 更新があった場合
  • 継続対応: 営業時間内での対応 (対応の優先順位は Severity 1 ~ 3 より低くなります)

◼︎サポート受付/対応時間

Pacific Teck Japan
月曜日から金曜日の 9:00~17:00 (日本の祝祭日、年末年始を除く)

SchedMD (米国およびヨーロッパ)
月曜日から金曜日の 2:00~17:00 MST* (日本時間 17:00~9:00* / 米国の祝祭日、年末年始を除く)

日本の営業時間が終わるとヨーロッパ、米国と順次営業が開始されるため土曜9:00から月曜9:00を除いた時間は24時間対応となります (祝祭日、年末年始を除く)

*サマータイム制度を採用しているため 3 月のサマータイム開始時からは 1 時間遅くなり、11 月の終了以降は 1 時間早くなります(元に戻ります) 。
毎年のサマータイムの詳細について確認が必要な場合はお問い合わせください。

Slurmトレーニング

SchedMD のエンジニアがオンサイトまたはオンラインで実施します。ご要望に応じて利用者/管理者向けの内容をカスタマイズして提供します。

Slurm構成支援

Slurm を最大限に活用いただくため、Slurm の専門家が目的に応じたシステムの構成や設定について構成支援を提供します。

Slurmコンサルティング

Slurm に機能を追加したいといったご要望にSlurm の専門家が対応します。

Slurmコマーシャルサポート のお見積もり・お問い合わせ

お客様のご要望に合わせてカスタマイズが可能です。システム構成などお気軽にご相談ください。