日本語 English 中文
世界中のHPC専門最先端技術製品の販売・サポート
VAST Data Platform

VAST Data Platform(オールフラッシュストレージアプライアンス)

※2023年11月、製品名を「VAST Universal Storage」から「VAST Data Platform」へ改名しました。製品機能に変わりはありません。

高速で低コスト、エクサバイトに対応するオールフラッシュ ストレージ
あらゆる用途に対応する性能と、優れた管理解析機能

VAST Data Platform

VAST Data Platform は最新のアプリケーションの性能を最大限に発揮させるスループット、エクサバイトの拡張性、アーカイブと同等の経済性、NAS のシンプルさを提供する、初の非構造化データプラットフォームのオール フラッシュ ストレージ アプライアンスです。

VAST のアーキテクチャは、QLC フラッシュドライブとストレージクラスメモリ、NVMe-oFを採用し、その上で独自開発のSIMILARITY技術を用いて、これまで複数の製品を組み合わせて多段階に分かれていたストレージ階層を一まとめにすることができます。結果として、従来のフラッシュテクノロジーのシステムと比べ、大幅な低コスト化を実現、最大 90% も高い費用対効果を得られるようになっています。

ファイルストレージまたはオブジェクトストレージとして、ディープラーニングや、マルチメディア、HPC、ライフサイエンス、ビッグデータ解析、バックアップなど、VAST Data Platform は世界中で様々な分野に使用されています。

今まで:オールフラッシュ、NAS、クラウドオブジェクトアーカイブ→これから:VAST Data Platform

低コストなオールフラッシュストレージ

ストレージクラスメモリを用いて、書き込み回数を大幅に削減。 現在主流の MLC/TLC より安価な QLC ドライブの採用を可能にし、低価格を実現しました。

最大 10 年の長期保証

書き込み寿命の短い QLC を採用しているハイエンドストレージであるにも関わらず、テープドライブのような長期保証を提供します。

単一ネームスペースでマルチプロトコル対応

旧来の NFSv3/4をはじめ、NFS+RDMA[+GPUDirect]、SMB、S3 に対応し、これらのどのプロトコルを使用しても同じファイルにアクセスすることができます。

自動リビルド機能

ディスクに空きがある限り自動的にリビルドが実行されます。システムの全部または一部を止めることなくディスクを入れ替えるのみで完全復旧することができます。異常停止した場合でも、不揮発性のストレージメモリを介したアトミック処理が行われているため、再起動時にリビルドすることなく最短で起動を完了させることができます。

データの類似性を用いたデータ削減

データ圧縮と同時に重複排除を行う独自のSIMIRALITY技術により、ストレージ全体に対して類似個所を判定し、物理容量を超えるデータ量を保存することができます。既存のデータに対し、どの程度圧縮できるかの事前検証にも対応します。

最も優れた管理サービス機能

使いやすい GUI 管理画面や統計情報の取得機能など、追加費用なしですべての管理機能が使用可能。オーバーヘッドのない1000以上のスナップショットをディレクトリ単位で作成、各レイヤーのデータの流れを可視化、クラウドへのバックアップや、ディレクトリ毎のクォータにも対応します。

NVMe-oF とは?
NVMe-oF (NVMe over Fabrics) は、半導体メモリ用に設計された新しい転送プロトコルである NVMe プロトコルを拡張し、システムがイーサネットやInfinibandなどのファブリック ネットワークや PCIe 接続を介して NVMe SSD にアクセスできるようにして高速化を実現する仕組みです。

GPUDirect Storageとは?
GPU の上で動くアプリケーションが、CPU や OS を介さずにストレージ内のデータにアクセス可能とするテクノロジーです。より高いスループットと低レイテンシを実現します。

ストレージクラスメモリ とは?
これまでの CPU – メモリ – ストレージ の構成においては、メモリは高速ですが容量が少なく、ストレージは容量が大きくても低速という問題がありました。ストレージクラスメモリはメモリとストレージの間に配置される不揮発性メモリであり、メモリより大容量かつディスクより高速な I/O であるという特徴があります。
VAST Data Platform ではこれらのストレージクラスメモリの利点を最大限に利用。 QLC へ最適なブロックサイズで書き込みを実現したり、分散されたメタデータの保持などに用いられています。

製品機能

VAST Disaggregated Shared Everything Architecture
(分散型シェアードエブリシング アーキテクチャー: DASE)

VAST DASE は単体で拡張可能な冗長クラスタを構成することを可能にするアーキテクチャです。VAST Data Platform は VAST プロトコルサーバーと、ネットワークスイッチ、VAST NVMe エンクロージャーで構成されます。サーバ資源をすぐに開放することができるステートレスなプロトコルサーバーとストレージとして機能が分離されており、それら接続することで高い拡張性と冗長性を実現しています。

VAST DASE では NVMe-oF を採用することで、SSD やストレージクラスメモリにリモートアクセスしながら、パフォーマンスを損なうことなく CPU をストレージデバイスから切り離すことができるようになりました。リソースを共有しないシェアード・ナッシング方式と同等のパフォーマンスに加え、プロトコルサーバーに障害が発生してもネットワーク経由でデータを再構築する必要がなく、より高い障害耐性を得ることができます。VAST DASE では複数のドライブに障害が発生しても、他のドライブに空き容量がある限り稼働し続けることができ、復旧についてもシステムの一部ですら再起動する必要はありません。また、電源やファンなどすべてのモジュールが冗長化されています。

VAST Data Platform はプロトコルサーバーを増やすとスループットが向上し、NVMe エンクロージャーを増やすと容量を増やすことができます。

分散型シェアードエブリシング アーキテクチャー
これまでのシェアードエブリシングと VAST の分散型シェアードエブリシングアーキテクチャの違い

シェアードエブリシングは、すべてのノードからデータに直接アクセスできるデータ共有の方式です。これまでのシェアードエブリシング方式では、複数のノードからのアクセスを実現するためデータをロックする必要があり、ノード数が増えると性能が飽和するという問題がありました。VAST の分散型シェアードエブリシング アーキテクチャ では NVMe-oF やストレージクラスメモリ、SSD と VAST OS が最適な書き込みバッファを介した処理を行うことでこの問題を解消し、スケーラブルで障害に強いシステムを作ることができるようになりました。

クライアント

NFS または、NFS+RDMA[+GPUDirect]、SMB、S3 のいずれかのプロトコルでファイルにアクセスすることができます。また、複数の I/O を使用する NFS マルチパスにも対応し、より高速な転送速度を実現しています。
従来のストレージではプロトコルが異なると同じファイルにアクセスすることができなかったり、パフォーマンスが大幅に低下するという問題がありましたが、VAST DASE ではいずれのプロトコルを使用してもパフォーマンスが低下することなく同じネームスペースのファイルとしてアクセスすることができます。IPv4 および IPv6 を利用可能です。

VAST プロトコルサーバー

数に制限のないステートレスサーバでクラスタを構成することができます。ステートレスサーバーはプロトコル変換に特化し、内部にデータを蓄積しません。そのため障害が発生してもネットワーク経由でデータを再構築する必要はありません。各サーバーは疎結合されていて独立して動作するので、すべてのサーバーが単体で共有グローバル名前空間にアクセスすることができます。これによりサーバー間のクロストークとイレージャコーディングの同期の問題が回避され、事実上無制限のスケーラビリティを実現すことができるようになりました。HA 構成に対応し、2 ~ 10000 以上のサーバーを構成することができます。

VAST NVMe エンクロージャー

NVMe エンクロージャーはプロトコルサーバー数に依存せず拡張するこ とができ、単一のマルチプロトコルネームスペースでエクサバイトのデータを管理することができます。エンクロージャーには二つのファブリックモジュールがアクティブ-アクティブで動作しており、いずれかに障害が発生しても正常なファブリックモジュールがアトミック書き込みの一貫性を維持しつづけます。
また、保存時の暗号化が有効になっている場合は、FIPS 140-2 検証済みライブラリを使用してすべてのデータを暗号化することも可能です。

製品の特徴

最も優れた管理サービス機能

VAST の管理サービスは GUI、CLI、API から利用することができます。GUI のダッシュボードは基本的な情報を直感的に得られるようにデザインされており、帯域以外にも IOps、遅延、データ圧縮率、使用容量予測など、1000 以上のグラフ、データから自由にカスタマイズして表示させることができます。また、大きな帯域を使用しているユーザーや、ボトルネックになっている原因をグラフから特定することや、パフォーマンス問題改善のリバースエンジニアリングのための情報を得る事が可能です。

詳細なアクセス制限、クォータ設定、QoS 設定、制限を変更するトリガの設定や、データの複製、保護などの操作も行うことが可能です。例えば、クォータはディレクトリ単位でも設定することができます。情報はリアルタイム以外にも、ログから過去の情報を表示させることができ、保存期間も自由に設定することが可能です。多要素認証に対応し管理アクセスを保護します。1000回以上のスナップショットの作成をディレクトリ個別に行うことができます。スナップショットは隠しディレクトリにあるため、ユーザーの人為的ミスによるデータ削除に管理者を煩わせることなく対処できます。暗号化は NFS KRB5p、TLS、S3 HTTPS、および SMB 3 (TBA) をサポートします。すべての機能は追加費用なしで利用することができます。

VAST Data PlatformのGUI管理画面例
VAST Data PlatformのGUI管理画面例
VAST Data Platform の GUI管理画面例

データベースの一貫性

VAST のファイルシステムではデータを単純に上書きするのではなく、計画された追加書き込みを行うように最低化された VAST のテクノロジーを用いてデータ管理が行われています。
新しい書き込みは間接レイヤーを介して書き込みストライプに追加されます。具体的には、書き込まれる予定のデータに対して一時的に不揮発性のストレージクラスメモリに格納されたポインタを介して書き込みストライプが生成され、すべての QLC への書き込みはアトミックで処理されるようになっています。
このため、電源の消失やシステムクラッシュが起きたとしてもデータの破損は生じません。

最大 10 年保証

VAST Data Platform は最大 10 年間の保守サービスを提供します。
QLC ドライブを採用していますが、前述のようにストレージクラスメモリを介して大きなブロックの書き込みストライプを生成することで書き込み回数を大幅に削減することに成功し、耐用年数を最大限にのばしています。
また、VAST Data Platform は異なる世代のハードウェアを混在させることができるように設計されています。運用中に容量を増やしたい場合でも最新のプロトコルサーバーや  NVMe エンクロージャーを既存のシステムに追加接続して拡張することが可能です。

データの類似性を用いたデータ削減 (Similarity-Based Data Reduction)

従来の 1000 分の 1 の小さな粒度で類似個所を判定して容量を削減する技術が使用されています。VAST Data Platform では、書き込まれるデータの中から共通部分と類似個所を特定し、QLC に保存されるデータを準備するフローの中で Byte レベルでデータを削減します。

従来の 1000 分の 1 の小さな粒度で類似個所を判定して容量を削減する技術が使用されています。VAST Universal Storage では、書き込まれるデータの中から共通部分と類似個所を特定し、QLC に保存されるデータを準備するフローの中で Byte レベルでデータを削減します。

一方、これまでのストレージに採用されていた類似性判定は、ローカルのみ、またはグローバルでも粒度が荒すぎて使用容量の削減には不十分でした。VAST のデータ類似性を用いた上記のデータ削減技術はグローバルかつ最適な粒度でデータの類似性を判定することでディスク容量の数倍のデータを保存します。

一方、これまでのストレージに採用されていた類似性判定は、ローカルのみ、またはグローバルでも粒度が荒すぎて使用容量の削減には不十分でした。VAST のデータ類似性を用いた上記のデータ削減技術はグローバルかつ最適な粒度でデータの類似性を判定することでディスク容量の数倍のデータを保存します。

データ類似性を用いたデータ削減例 (VAST DATA 調べ)

3:1
Pre-Reduced
Backups
3:1
Pre-Compressed
Log Files
2:1
Life Science Data
3:1
HPC Data
3:1
Animation Data
8:1
Uncompressed
Time-series Data

GPUDirect 対応

GPUDirect は GPU とストレージ間のデータ転送を高速化するテクノロジーです。CPU を介さずローカル及びリモートのストレージ間で動作し、より高いスループットを実現します。

GPUDirect は GPU とストレージ間のデータ転送を高速化するテクノロジーです。CPU を介さずローカル及びリモートのストレージ間で動作し、より高いスループットを実現します。
1 MOUNTPOINT あたりの性能 (1 x DGX-A100 使用時)
1 MOUNTPOINT あたりの性能 (1 x DGX-A100 使用時)

ユースケース

AI・機械学習

GPU サーバーの RDMA アクセラレーションは通常の NAS の 4 倍高速です。VAST Data Platform は低コストかつ高性能なストレージを提供することで学習を加速させます。

コンテンツ作成

オールフラッシュ NAS は高パフォーマンスですが高コストという問題がありました。VAST Data Platform はアーカイブ ストレージと同等の価格帯で高速なワークフローを実現します。

コンテンツ配信

VAST DASE は障害発生時の復旧に時間を要しません。サービスの遅延なく、ペタバイト、エクサバイトのコンテンツを提供することができます。

データ保護

アーカイブストレージと同等の価格帯で利用できる VAST Data Platform は、バックアップの効率化を図ることができ、高速なフラッシュドライブから短時間でリカバリすることができるようになります。

HPC・ライフサイエンス

NAS プラットフォームのシンプルさで、ハイエンド並列ファイル システムのパフォーマンスを利用することができます。演算処理おいて生じるデータ I/O のボトルネックを解消させることで、処理全体の高速化を期待することができます。

対応バックアップソフトウェア・クラウドサービス例

Veeam logo
Commvault logo
Wasabi logo

VAST Data Platform のお見積もり・お問い合わせ

お客様のご要望に合わせてカスタマイズが可能です。システム構成などお気軽にご相談ください。