EMC Isilon OneFS オペレーティング・ システム › _cms › wp-content › uploads ›...

Preview:

Citation preview

ホワイト・ペーパー

要約

このホワイト・ペーパーでは、Isilon スケールアウト

NAS プラットフォームの基盤である EMC® Isilon® OneFS®

オペレーティング・システムの概要を説明します。

OneFS のアーキテクチャの概要と、スケールアウト NAS

プラットフォームのメリットをご覧いただけます。 2011 年 4 月

EMC Isilon OneFS オペレーティング・

システム Isilon スケールアウト NAS プラットフォームを動かす

2 EMC Isilon OneFS オペレーティング・システム

Copyright © 2011 EMC Corporation. All Rights Reserved. EMC は、この資料に記載される情報が、発行日時点で正

確であるとみなしています。この情報は予告なく変更さ

れることがあります。 この資料に記載される情報は、「現状有姿」の条件で提

供されています。EMC Corporation は、この資料に記載

される情報に関する、どのような内容についても表明保

証条項を設けず、特に、商品性や特定の目的に対する適

応性に対する黙示の保証はいたしません。 この資料に記載される、いかなる EMC ソフトウェアの

使用、複製、頒布も、当該ソフトウェア・ライセンスが

必要です。 最新の EMC 製品名については、japan.emc.com で EMC

Corporation の商標を参照してください。 他のすべての名称ならびに製品についての商標は、それ

ぞれの所有者の商標または登録商標です。 パーツ番号:h8202-J

3 EMC Isilon OneFS オペレーティング・システム

目次

エグゼクティブ・サマリー ...................................................................... 4

Isilon OneFS オペレーティング・システム ............................................... 6

拡張性 ................................................................................................................ 7

パフォーマンス ................................................................................................. 8

管理 .................................................................................................................... 9

データ保護 ....................................................................................................... 10

まとめ .................................................................................................... 12

4 EMC Isilon OneFS オペレーティング・システム

エグゼクティブ・サマリー

現在、通信の帯域幅とコンピュータの処理性能はかつてないほど高くなり、また

ムーアの法則のとおり、そのキャパシティは今後も 12~18 か月ごとに倍増し続ける

でしょう。テクノロジーはまさに進化の途中にあり、20 年前にあった多くのものは、

今では博物館に展示される歴史上物にすぎません。そして、今日の最先端テクノロ

ジーも 20 年後には同じ状況に追いやられるでしょう。この数年間のテクノロジーの

開発と発展にかかわってきた人にとって、進化の規模と早さは何が出てきたのか覚

えていられないほど進んでいます。

エンタープライズ・ストレージ以上にこの加速が顕著な分野はなく、この分野には

コンピューティングと帯域幅の変化が反映されています。ストレージを構成するス

ピニング・メディアと基本的なコンテナにはマイクロ・プロセッサと同じぐらい長

い歴史がありますが、状況は急速に変化しています。フラッシュ・ベースのメモ

リ・テクノロジー、高速で低遅延のネットワーク、ユビキタスに関する業界標準、

オープン・ソース・ソフトウェアの登場により、新しいパラダイムを作り出すツー

ルが手に入ります。高まり続ける企業や消費者の需要により、さらなる開発のニー

ズと動機が生まれます。

実際、現在のエンタープライズ・ストレージ・プラットフォームは、その目的で進

化してきました。NAS(ネットワーク接続型ストレージ)と SAN(ストレージ・エ

リア・ネットワーク)は、DAS(直接接続型ストレージ)をシンプルにする極めて重

要なステップとなっています。しかし、SAN と NAS のプラットフォームは、本質的

には DAS の進化の 1 ステップというだけで、結局のところ DAS ストレージにおける

テクノロジーの寿命を延ばしたにすぎません。エンタープライズ・ストレージの標

準としての DAS に SAN と NAS が取って代わり始めたのは 10 年前ですが、これらの

テクノロジーはいずれも、約 20 年前に設計されたものです。

基本的なストレージ・コンテナ(およびそれを拡張する SAN と NAS のテクノロジー)

は、アーキテクチャ上の根本的な弱点を抱えています。つまり、それはスタティッ

クであり、拡張に対応した設計にはなっていないということです。ミラーリングや

RAID など、従来のデータ保護の手法では、拡張性に限界があります。より大規模で

高性能な装置に置き換えていくというストレージ・モデルでは、高いコストやデー

タに対するリスクの増大を招くことなく、拡大する容量要件とパフォーマンス要件

を満たせません。最終的に、どんどん複雑になるストレージの管理は、現実的には

組織やスタッフの制約により、対応が不可能となります。

テクノロジーやボリュームにおけるもっとも基本的な部分で、ストレージの新しい

パラダイムの必要性が明らかになっているのです。純粋に組織上の目的からすれば、

データの保存場所を特定の場所に限定する理由はほとんどありません。適切なセ

キュリティと信頼性を前提として、どのような場所からでも、データがローカルに

ある場合と同じように簡単にアクセスできる必要があります。データの量や種類が

拡大するほど、ユーザーのニーズも高まるからです管理者は、コンテナ間のデータ

移動、ワークフローと共有の再配置、従来のストレージの技術的な制約によってま

すます複雑になる環境に対応するのに、これ以上貴重な時間を費やすことはできま

せん。

5 EMC Isilon OneFS オペレーティング・システム

SAN または NAS のストレージ環境における別の課題として、ディスクの無駄が挙げられます。多くのストレージ・ベンダーが、ストレージの使用率は多くても 50%程度であることを把握しています。これがストレージ・ベンダーの利益を支えている一方で、電力、冷却、管理の無駄になっています。信頼性に関する懸念、技術的な制約、パフォーマンス能力のいずれかによりボリュームのサイズが限られていることで、最終的に非効率性につながります。これらの限定されたリソース・セットは、継続的にチューニング、監視、ワークフローを変更しなければ、能力を最大限に発揮することができません。しかしこうした作業により、データセンターでのより戦略的で重要なタスクに費やすべきスタッフの時間を奪われてしまいます。

ミラーリングや RAID などのデータ保護テクノロジーは、ストレージ・メディアの複雑さを軽減し、冗長性によって信頼性を確保するように設計されています。従来のストレージにとって主要なこのコンポーネントは、現在では、メディアの容量とファイル・ベース・データの量がアクセス可能な速度よりもはるかに急速に増大していることにより、拡張性において高いハードルに直面しています。RAID が有効であるのは、2 度目の障害が発生する前にデータを再構築できる場合のみであり、現在のテクノロジーでは 2 つの障害の同時発生に対処するのが精一杯です。これらの障害の修正に要する時間が長引くほど、別の障害が発生する可能性も高まります。 3 TB(テラバイト)のドライブはすでに市場に存在し、4 TB のドライブがまもなく登場、6 TB のドライブも視野に入っている状況では、データ保護のための RAID に代わる、新しいアプローチが必要とされます。

ほとんどのエンタープライズ・ストレージ環境では、システム、データセンター、あるいは別の場所に組み込まれたミラーリング・テクノロジーによって RAID が補完されています。この単純で力業ともいえるデータ複製手法で可用性は向上しますが、拡張可能な設計にはなっていません。システム内またはデータセンター内でのデータのレプリケーションは、消費される容量の増加、処理のオーバーヘッド、ネットワークの帯域幅、運用コストの面で莫大なコストがかかります。また、ストレージ・システムに配置されるデータは本来ダイナミックなものであり、いま現在は重要でミッション・クリティカルなものでも、そのうちにそうでなくなる可能性があります。組織は、データの価値と保護のメカニズムを合わせ、優先度とニーズに応じて保護レベルを容易に調整できなければなりません。

ムーアの法則に支配される世界では、従来のストレージ・システムで高パフォー マンスを達成することも重要な課題の 1 つです。システム全体をリプレースすることでパフォーマンスを向上させるのはきわめて高コストであり、システム停止を伴います。将来におけるシステム拡張を避けるためだけに、最初から必要以上の機器を購入し、必要以上に電力を消費し、貴重なデータセンターのフロア面積を占有するのは理にかなった方法とはいえません。特定のボリュームを作成して継続的に微調整するというパフォーマンスの細かな管理は小規模であれば可能かもしれませんが、大規模になれば不可能な作業になります。このようなストレージの課題がある中で、最近のワークロードはダイナミックな性質を帯びているため、管理者は容易には求められるサービス・レベルを満たせません。

SAN や NAS のストレージ・システムの基盤となっている、20 年前のテクノロジーや設計は、現在の企業が直面する課題に対応できるだけの拡張性がありません。必要なときに拡張できるように設計された、新しいストレージ・プラットフォームが必要です。ストレージ・プラットフォームの拡張は、コスト・パフォーマンスに優れ、システム停止を伴わない、予測可能な方法で実施する必要があります。また、容量とパフォーマンスが増大しても引き続きシンプルに管理できる必要があります。このような拡張性を持たせた設計は、「スケールアウト」と呼ばれてきました。これにより、制限や複雑さを伴うことなくシームレスに環境を拡張できるようになります。今や、スケールアウトが必須となる時代なのです。

6 EMC Isilon OneFS オペレーティング・システム

Isilon OneFS オペレーティング・システム

従来のストレージ・アーキテクチャにおける課題と、ファイル・ベースのデータが増大するペースを目の当たりにした Isilon の創業者たちは、2000 年に、革新的な新しいストレージ・アーキテクチャである OneFS® オペレーティング・システムの開発

に取り組みました。EMC® Isilon® ストレージにおける最も重要な設計上の違いは、OneFS を搭載したストレージ・システムは、ストレージ・アーキテクチャの重要な部分としてハードウェアに依存しない点です。OneFS(図 1 を参照)では、その代わりに、従来のストレージ・アーキテクチャの 3 つのレイヤーであるファイル・システム、ボリューム・マネージャ、RAID を 1 つの統合ソフトウェア・レイヤーに統合し、ストレージ・システム内のすべてのノードを網羅する 1 つのインテリジェントなファイル・システムを実現しています。Isilon スケールアウト・ストレージは、OneFS が実行される、アプライアンス・ハードウェアの基盤となります。ハードウェアが、Intel、HITACHI、Super Micro などのメーカーが生産するエンタープライズ品質のコモディティ化したコンポーネントである一方で、ストレージ・システムのほぼすべての機能はソフトウェアである OneFS により提供されます。ハードウェアには高速なバッテリ・バックアップ NVRAM のジャーナルと、遅延がマイクロ秒レベルである 20 Gb/秒ポイント・ツー・ポイント相互接続の Infiniband が含まれます。このコモディティ化したハードウェアを基盤とする OneFS オペレーティング・システムは、データ保護、データの自動的な負荷分散、移行を提供するとともに、システムのダウンタイムを伴うことなくストレージ機能とパフォーマンス機能をシームレスに追加できるようにします。

図 1. OneFS オペレーティング・システム Isilon スケールアウト・

ストレージ・プラットフォームを動かす

OneFS は、「クラスタ」と呼ばれる Isilon スケールアウト・ストレージ・システムで

機能するように専用設計されています。1 つの Isilon クラスタは、複数のストレージ

「ノード」で構成されます。ノードは、メモリ、CPU、ネットワーク・インターファ

イス、NVRAM、Infiniband、ストレージ・メディアを搭載した、ラックマウント可能な

アプライアンスとして構成されています。Isilon クラスタは最小で 3 ノードから構成

され。最大で 144 ノードまで拡張できます。この資料の発行時点では、Isilon スケー

ルアウト・ストレージ・システムにおける単一ファイル・システムの総容量は、最小

6 TB から最大 15.5 PB(ペタバイト)となっています。クラスタにノードが 1 つ追加

されるごとに、ディスク、キャッシュ、CPU、ネットワーク容量の総量が増加します。

7 EMC Isilon OneFS オペレーティング・システム

総量が増加した結果、144 ノードのクラスタがアクセスできる、グローバルで一貫性

のある共有キャッシュは約 13.8 TB になります。単一のストレージ・システム、単一

のファイル・システム、単一のボリュームとして容量とパフォーマンスが提供される

ため、将来システムが拡張されても、システムの複雑さ、ストレージ管理者が費やす

管理負荷は増えません。

OneFS は、クラスタ内のすべてのストレージ・ノードにわたってデータをストライ

ピングします。クライアント・マシンからクラスタに(NFS や CIFS などの業界標準

プロトコル)データが送信されると、OneFS は自動的にそのデータを分割し、複数

のストレージ・ノードに並行して割り当てます。処理はプライベートな Infiniband

ネットワークを通じて実行されるため、不要なネットワーク・トラフィックが発生

しません。Isilon クラスタは単一のファイル・システムとして管理され、調整とデー

タ分散はエンド・ユーザーやクライアントからは完全に透過的に実行されます。ク

ライアントがファイルの読み取りを要求すると、OneFS が複数のストレージ・ノー

ドから並行して適切なブロックを取得し自動的にファイルに再統合し、要求元のク

ライアントに、書き込まれた時点の元どおりの内容が表示されます。複数のノード

に透過的にデータを自動分散する機能は、OneFS における拡張性、次世代のデータ

保護、きわめて高いパフォーマンスを提供するための基本的な機能です。

拡張性

パフォーマンスまたは容量の追加が必要なときには「スケールアップ」する以外に

方法がない従来のストレージ・システムと異なり、Isilon ストレージ・システムでは、

OneFS によって既存のファイル・システムまたはボリュームをペタバイト規模の容

量までシームレスに拡張する「スケールアウト」が可能で

す。また、SmartPools™アプリケーション・ソフトウェア

を追加することで、単一のクラスタまたは「プール」に種

類の異なるノードを混在させることが可能です。これによ

り、投資が保護され、さまざまなレベルの容量またはパ

フォーマンスが必要とされる場合の「フォークリフト・

アップグレード」が不要になります。SmartPools(図 2 を

参照)により、トレージ管理者は、パフォーマンスと容量

ごとに構成された複数ティアのストレージを単一のファイ

ル・システムとして容易に運用できます。この複数ティア

のファイル・システムは、時間の経過とともに、ビジネ

ス・データやアプリケーション・ワークフローに応じて自

動的に最適なストレージティアを適用していきます。

複数ノードにわたって自動的にデータを階層化するのに加

え、SmartPools では、メタデータおよびファイル・ベー

ス・ストレージのワークフロー向けのティアとして、SSD

(ソリッド・ステート・ドライブ)を使用できます。プー

ル内で SSD ティアを使用することで、メタデータやデー

タのアクセスのパフォーマンスを向上できます。または、

単一のティア内で使用している SSD に他のティアに保存

されているファイルのメタデータを保持することで、SSD

を使用しないノードでもパフォーマンスを向上できます。

図 2. 自動的で透過的なデータ

移動を実現する、単一のファ

イル・システムで複数ティア

に対応した SmartPools

8 EMC Isilon OneFS オペレーティング・システム

Isilon クラスタの容量を拡張したりパフォーマンスを追加するのは、他のストレージ・システムの場合よりもはるかに簡単です。ストレージ管理者が行うべき作業は、わずか 3 ステップです。それは、ラックへのノードの追加、Infiniband ネットワークへのノードの接続、クラスタに対するノード追加の指示です。各ノードには CPU、メモリ、ネットワークインターフェイスが搭載されているため、新しいノードを追加するだけで容量だけでなくパフォーマンスも同時に拡張されます。OneFS の Autobalance™機能によって、Infiniband ネットワーク経由で自動的にデータ移動が実行されます。これにより、自動的かつ一貫性を保った方法で、クラスタに存在する既存のデータが新しいストレージ・ノードに移動されます。この自動再配分によって、新しいノードに新しいデータが集中することがなくなり、既存のデータもより最高性能なストレージ・システムのメリットを享受できます。OneFS の Autobalance 機能もエンド・ユーザーからは完全に透過的で、高パフォーマンスなワークロードへの影響を最小限に抑えるように調整することも可能です。この機能だけでも、OneFS でシステム稼働中に 18 TB から 15.5 PB まで透過的に拡張可能なため、管理者の管理負荷が増えることも、ストレージ・システム内の複雑さが増大することもありません。

拡張性の高い 1 つのストレージ・プールを使用してデータを配分するメリットは広く理解されており、単一のファイル・システムの効率性の向上も知られています。必要な空き領域があるボリュームをユーザーに選択させなければならない、またはデータを手動で移動しなければならないとしたら、時間がかかるうえに非効率的です。ユーザーの選択が適切でない場合、特定のワークフローにおけるパフォーマンスのニーズをある特定のボリュームで満たせなくなります。また、特定のボリュームをアドレス指定できない場合や、ストレージ管理者がデータを透過的かつ迅速に移動できない場合、ストレージは効率的に運用できません。ストレージ導入に関する業界の分析では、こうした非効率性によってストレージ容量の平均 43%が無駄になっています。Isilonスケールアウト・ストレージ・システムにはこのような制約はなく、ストレージ効率は通常 80%を超えます。

パフォーマンス

大規模なストレージ・システムでは、シーケンシャル、コンカレント、ランダムのいずれの場合でも、さまざまなワークフローで求められるパフォーマンスを提供する必要があります。ワークフローは、アプリケーション間やあるいは個別のアプリケーション内に存在します。OneFS は、インテリジェントなソフトウェアによってそれらすべてのニーズに対応します。さらに重要な点として、OneFS(図 3 を参照)を使用した場合、スループットと IO/PS は、単一のシステム内に存在するノードの数に比例します。OneFS では、バランスのとれたデータ分散、自動再配分、分散処理により、システムを拡張する際に、追加された CPU、ネットワーク・ポート、メモリを活用することができます。

図 3. OneFS のリニアな拡張性

9 EMC Isilon OneFS オペレーティング・システム

ローカルであることを最大限に活用し、さまざまなワークフローのニーズに対応する

ために OneFS は、すべてのノードにわたってグローバルにアクセス可能であり一貫性

のあるキャッシュを提供します。各ストレージ・ノードには標準で 4 GB~96 GB の

DRAM が搭載されており、このメモリは主に、そのストレージ・ノードに配置されア

クティブにアクセスされているデータをキャッシュするのに使われています。クラ

スタにノードが追加されることでキャッシュが増えるため、増加する処理中のデー

タを継続的にキャッシュに残しておくことができます。単一のシステムに最大で

13.8 TB をキャッシュすることができます。さらに OneFS では、ストレージ・システ

ム管理者がファイル単位またはディレクトリ単位でワークロードのタイプを指定で

き、特定のファイル/ディレクトリへのアクセス・パターンが、ランダム、コンカ

レント、シーケンシャルのいずれであるかを示すことができます。クラスタにノード

が追加されることでキャッシュが増えるため、増加する処理中のデータを継続的に

キャッシュに残しておくことができます。単一のシステムに最大で 13.8 TB をキャッ

シュすることができます。

管理

組織がデータ量の増加や管理の複雑化の問題に直面するほど、提示されるソリュー

ションはますます多様化しています。次世代データセンターに重点を置くことは、

お客様の要件を、持続可能で拡張性が高く、効率的な方法で満たすことに他ならず、

その成功への鍵は、管理の複雑さを軽減することにあります。従来は「オペレー

ションコスト」(「OpEx」ともいいます)として見られてきた人的資本を、生産性、

即応力、そして究極的には利益を向上させるための企業の取り組みに重点的に活用

する必要があります。

従来のストレージ・システムでは、プランニング、アップグレード、メンテナンス

の作業に膨大な時間がかかります。容量の追加、パフォーマンスの拡張、ユーザー

の追加などの重要でないタスクでも、多くの場合、横断的に拡張してアプリケー

ションを再構成する必要が生じ、結果としてユーザーの作業が中断し、生産性と収

益が低下することになります。

OneFS は、管理作業がシンプルになるように設計されており、このシンプルさは、

図 4 に示すように、システム全体を拡張する場合でも維持されます。Isilon ノードを

使用すると 60 秒でパフォーマンスおよび容量を追加できます。SmartConnect™および

Autobalance によって手動でのデータや接続の再配分が不要となり、ハードウェアと

ソフトウェアのアップグレードの負荷を軽減できることは、OneFS で独自に実現され

ている機能です。

10 EMC Isilon OneFS オペレーティング・システム

図 4. OneFS のシンプルさと従来型 NAS の複雑さ

データ保護

従来のストレージ・システムを拡張すると、小規模な構成では適切な手法が大規模な

構成では適切でなくなることがあります。その最たる例が RAID です。RAID が有効で

あるのは、2 度目の障害が発生する前にデータを再構築できる場合のみです。しかし、

データ量が増える一方で、データへのアクセス速度は向上しないため、連続して障害

が発生する確率は高くなります。OneFS は、データ保護を提供するのにハードウェ

ア・ベースの RAID テクノロジーに依存していません。その代わりに、OneFS はコ

ア・テクノロジーである FlexProtect™を搭載しています。これは、安定した数学的な

概念に基づいており、Reed-Solomon 符号化を使用して冗長性と可用性を提供します。

FlexProtect は、ノード全体、または個別ドライブのいずれであっても、最大 4 つの障

害の同時発生に対するデータ保護を提供します。また、クラスタの規模が拡大したと

きは、個別の障害における再構築時間を最小にするニーズに対応します。

FlexProtect は OneFS の重要な革新性の 1 つであり、データ保護に関して、各ファイ

ルの保護情報を個別に保存するというファイル固有のアプローチを採用しています。

この個別保護により、ファイル・データとともに保護データをクラスタ全体に分散

させることが可能になり(図 5 を参照)、アクセスの並列処理、そして必要な場合

には再構築の並列処理を劇的に向上させます。Isilon ストレージ・システム内のノー

ドまたはドライブで障害が発生すると、障害によってファイルのどの部分が影響を

受けるかを FlexProtect が特定し、影響を受けたファイルのみの再構築処理に複数の

ノードを参加させます。OneFS の Autobalance 機能によってファイルはクラスタ内に

分散しているため、再構築に使用できるスピンドル数と CPU 数は、一般的なハード

ウェア RAID 方式よりもはるかに多くなります。さらに、FlexProtect ではスペア・ド

ライブにデータを再構築し直す必要がありません(RAID ではこのスペア・ドライブ

が回避不能なボトルネックとなります)。その代わりに、ファイル・データは空き

領域に再構築され、「仮想のホット・スペア」が提供されます。

11 EMC Isilon OneFS オペレーティング・システム

図 5. OneFS の N+4 のデータ保護

OneFS は、クラスタ内のすべてのファイルとディスクの稼働状態を継続的に監視し、

コンポーネントがリスクにさらされている場合には、問題のコンポーネントに対して

ファイル・システムが自動的に交換対象のフラグを付け、それらのファイルを正常な

コンポーネントに透過的に再配置します。また OneFS は、書き込み処理中にファイ

ル・システムに予期しない障害が発生した場合、データの整合性を確保します。ノー

ドまたはクラスタの障害から保護するため、個々の書き込み処理は逐次的に NVRAM

ジャーナルにコミットされます。書き込みが失敗した場合、ジャーナルがあることに

よって、ファイル・システムの整合性チェックを行わずに短時間でノードがクラスタ

に再び参加できます。単一障害点がないため、NVRAM の障害が発生した場合でも、

ファイル・システムはトランザクションの観点から安全です。

OneFS の FlexProtect 機能はファイルに対応しているため、ファイル固有の保護機能

も提供されます。個別のファイル(または通常はディレクトリ)に対して特定の保護

レベルを設定できるため、ファイル・システムのさまざまな部分を、データまたは

ワークフローの重要性に応じたレベルで保護できます。重要なデータは高いレベルで

保護し、比較的重要でないデータは低いレベルで保護することが可能です。これによ

り、ストレージ管理者は容量とのバランスを見て、クラスタの拡張やワークフローの

使用年数に応じてダイナミックに調整しながら非常にきめ細かい保護レベルを設定で

きます。

12 EMC Isilon OneFS オペレーティング・システム

まとめ

ストレージ・システムにとって、拡張性、パフォーマンス、管理の容易さ、データ保

護は、ムーアの法則に支配されるデータセンターにおけるデータセンター課題に対応

し、ユーザーのニーズを満たすうえで重要です。OneFS を使用することにより、組織

や管理者は、一元管理の下で単一のファイル・システム、ボリューム内で最小 18 TB

から最大 15.5 PB まで拡張できます。OneFS は、管理を複雑化することなく、高いパ

フォーマンス、高いスループット、その両方を実現します。

次世代データセンターは、持続可能な拡張性を持たせて構築する必要があります。そ

うしたデータセンターでは、自動化のメリットとハードウェアのコモディティ化を活

用し、ネットワーク・ファブリックを無駄なく使って変化し続ける要件を満たすとい

う組織の目的に合わせて柔軟性を最大限まで高めます。

OneFS は、これらの課題に対応するように設計された次世代のファイル・システムです。

図 6. OneFS オペレーティング・システムとスケールアウト・

ストレージのエンタープライズ・ソフトウェア・アプリケーション群

Recommended