日本語 English
世界中のHPC専門最先端技術製品の販売・サポート
パラレルファイルシステムBeeGFS

BeeGFSとは

BeeGFSは、小規模な環境から数千ノードを超える大規模な環境までシームレスに拡張できる高性能分散パラレルファイルシステム(分散ファイスシステムまたは並列ファイルシステム)です。高度な性能を要求される厳しい環境で、負荷に耐えつつパフォーマンスを向上させることを目的として設計されています。

システム内のサーバーとディスクの数を増やすことで、ファイルシステムのパフォーマンスと容量を必要なレベルまでに簡単に拡張することができます。データへのアクセスをスムーズに処理するための拡張性、ストレージアクセスの柔軟性、管理が簡単なのも特徴です。BeeGFSの導入によって、計算結果を得るまでの時間短縮や、新たな解析手法などが可能となり、生産性の向上が期待できます。

従来のシステム構造は複雑で、設定や管理も複雑。メタデータサーバ専用のサーバ、データを分散保存する用の専用のサーバが必要などコストも高額となります。BeeGFSはシンプルな構造かつ設定・管理も簡単です。BeeGFSは、ソフトウェア製品でありそれ自体が安価であるだけでなく、ハードウェアの依存性・制限がなくLinuxサーバであれば市場で一番安価なサーバをベースに構築することが可能です。またストレージサーバとメタサーバ、マネージメントサーバを同じサーバ上に共有することも可能なため、構成自体を予算に合わせて容易に柔軟に組むことが可能です。

BeeGFSによるシステム構造

BeeGFSのアーキテキクチャ

BeeGFSアーキテクチャー

①クライアントサービス

  • ファイスシステムをマウントするためのLinuxネイティブモジュール

②ストレージサービス

  • ファイルを分散してストレージに格納

③メタデータサービス

  • ファイルのストライプ情報を管理
  • ファイルオープン/クローズ時のアクセスはしない

④マネージメントサービス

  • サービスの登録とシステム監視

⑤グラフィカルな管理とモニタリングサービス

  • 管理タスクを実行し、システム情報を監視するためのGUI(Windowsライクのインストール方法も利用可能)

BeeGFSの特徴

  • ハードウェアから独立したパラレルファイルシステム(ソフトウェアベースのパラレルファイルストレージ)
  • IO高速性能が必要な環境向けに開発された
  • ユーザのニーズに合わせて簡単に要領拡張、性能向上が可能
  • インストール、メンテナンスが簡単(ユーザースペース)
  • パフォーマンス、スケーラビリティ、堅牢性、使いやすさを重視した設計

BeeGFSを選ぶ理由

データを最大限に活用


BeeGFSの柔軟性、堅牢性、および卓越したパフォーマンスは、世界中のお客様に結果をより迅速に提供し、BeeGFSの利点がなければ不可能だった新しいデータ分析方法を可能にすることにより、生産性を向上させます。

最大のスケーラビリティ

BeeGFSは、さまざまなレベルで最大のパフォーマンスとスケーラビリティを提供します。 分散メタデータと同様に、ファイルベースまたはディレクトリベースでストレージサーバー間で柔軟なストライピングを使用して、分散ファイルコンテンツをサポートします。

BeeGFSは、特にパフォーマンスが重要な環境での使用に最適化されています。

クラス最高のクライアントスループット:

100 GBitネットワークでストリーミングするプロセスは1つだけで8 GB /秒、いくつかのストリームはネットワークを完全に飽和させることができます。

クラス最高のメタデータパフォーマンス:

動的なメタデータ名前空間のパーティション分割によるリニアなスケーラビリティ。

クラス最高のストレージスループット:

BeeGFSサーバーでは、ストレージハードウェアに完全に適合するように、基盤となるファイルシステムを柔軟に選択できます。

最大限の柔軟性

BeeGFSは、RHEL / Fedora、SLES / OpenSuse、Debian / Ubuntuなどの幅広いLinuxディストリビューションと、昔の2.6.18から最新のバニラまでの幅広いLinuxカーネルをサポートしています。ストレージサービスは、通常のPOSIXインターフェイスを使用して既存のローカルファイルシステム(xfs、zfsなど)上で実行され、クライアントとサーバーはダウンタイムなしで既存のシステムに追加できます。BeeGFSは、ネットワーク接続の1つがダウンした場合の複数のネットワークと動的フェイルオーバーをサポートしています。

IO500・10 Node Challengeにランクイン

Supercomputing 2019で発表されたIO500と10 Node ChallengeにBeeGFSを使用しているシステムが上位にランクインしています。

BeeGFSの機能

高信頼性機能(Buddy Mirroring)

  • 高可用向上のための組み込み型レプリケーション
  • ディレクトリ単位での柔軟設定が可能
  • メタ、ストレージデータ毎に個別に設定が可能
  • 異なるラック間または、ファイル領域間でのミラー設定が可能
Buddy Mirroring

ストレージプール

  • 異なるタイプのストレージをサポート
  • イベントログの変更
  • 時系列データベースの統計
  • 移動後のマウントポイントが変わらない。
  • データ配置はユーザが指定可能
  • 無停止でのハードメンテナンスが可能
Storage Pools

ストレージ + コンピュート: コンバージドセットアップ

小規模システム向けに計算ノードをストレージサーバとして設定することが可能

Storage + Compute: Converged Setup

BeeGFSのオプション機能

BeeOND (BeeGFS On Demand)

  • パラレルファイルシステムインスタンスをその場で作成
  • 簡単な起動/停止コマンド ・用途: クラウドコンピューティング、テスト環境、クラスタ計算ノード等々
  • JOBスクリプトに記述しスケジュールによる作成が可能(例: Univa Grid Engine)
  • 一般的な使用例:JOB毎のパラレルファイルシステム
  • ローカルディスクの容量と性能を利用 JOB実行中の計算ノードのSSD等
  • グローバルストレージの利用
  • 性能の出にくいIOパターンを高速化
BeeOND

エンタープライズレベルのサポート

インストールとサポートは、Pacific TeckおよびパートナーSIが行います。 アジア最大規模サイトにBeeGFSをインストールした経験があり、ソースコードレベルの修正が必要な際にはBeeGFS向けのコンサルやサポートを提供するThinkParQ社と連携して対応します。

Pacfic TeckはThinkParQ社のプラチナムパートナーであり、BeeGFSベストパートナーオブザイヤーにAPACエリアで2018年、2019年2020年と3年連続で選ばれました。

ユースケース

HPC

BeeGFSは大学や研究コミュニティの間で人気があり、世界で著名なスーパーコンピューターを強化し、世界中の多くの科学者たちが日々実施する膨大なデータ量の効率的な分析に貢献しています。

AI & ディープラーニング

車の自動運転から人間の行動模倣まで、BeeGFSの最新アーキテクチャコンセプトはAIとディープラーニング環境に対応します。必要なパフォーマンスとスケーラビリティを提供することで、システム規模に関わらずcognitiveインフラストラクチャとワークフローを加速します。 BeeGFSビジネスモデルに基づいて、企業のお客様がcognitive環境に投資し、TCOを削減できるよう支援します。

サイエンスコンピューティング

BeeGFSは、大学や世界的な研究コミュニティの間で広く普及しており、科学者が毎日大量のデータを効率的に分析できるようにするために、世界最速のスーパーコンピューターの一部を支えています。

ライフサイエンス

BeeGFSは、ライフサイエンス分野で採用されている並列ファイルシステムです。 Precision Medicineなどの分野で迅速に保存および分析するゲノミクスデータが急増しているため、BeeGFSはお客様にとって第一の選択肢となります。

金融・石油/ガス・メディア・自動車・その他市場

BeeGFSは世界中のさまざまな業界で使用されており、小規模から数千のホストを持つエンタープライズクラスのシステムまで、あらゆる種類とサイズのストレージシステムへの高速アクセスを提供します。

使用実績

BeeGFSベンチマーク・その他発表

BeeGFS関連動画

ホワイトペーパー

Introduction_to_BeeGFS_by_ThinkParQ

BeeGFS / BeeONDのお見積もり・お問い合わせ

お客様のご要望に合わせてカスタマイズが可能です。システム構成などお気軽にご相談ください。