Tintri を実際に利用した経験 第1回 “性能問題を解決”

Tintri の実経験を共有 Part1 「性能問題を解決」

以前一般企業でシステム管理者だった(後に管理職になりました)私は、今はTintriでSEをしています。実際のどちらも大変な仕事です。
前職でVMware Virtual Center/vSphereを導入し大成功を納めましたが、運用を始めて数年後、サーバーそのものではなく、バックアップ・ストレージのパフォーマンスという大きな問題に直面してしまいました。当時はフラッシュ・ドライブがエンタープライズ・ストレージの分野に参入し始めたばかりで、ハードディスクの古き良き時代。 ストレージ・アレイは、仮想化、特に仮想デスクトップのニーズについていけない状態でした。

仮想化は社内で大きな反響を呼び、ビジネス・チームはあらゆるクラスのワークロードの仮想化を次々と要求してきました。VMware環境がうまく機能しすぎたため、エンタープライズ・ストレージ・アレイが増え続けるI/Oのニーズについていけなくなったのです。 私たちは、有名なストレージ・ベンダーの何世代ものアレイを繰り返し使用し、さらに別の大手ベンダー(失礼にあたるのであえて名前は出しません)にも挑戦し、アドイン・ソリューションも検討しました。 しかし、私たちのニーズを満たすようなものはありませんでした。
仮想マシンのパフォーマンスも、私のチームやVMware環境の評判も落ち込んでしました。100ミリ秒を超える遅延が頻繁に発生し、ひどいときには1000ミリ秒を超えることもありました。これは実際の1秒を超える遅延なのです。
これらの問題に対処するため、私たちはVMをシャッフルし、LUNとボリュームの割り当てを最適化し、パフォーマンス・ポリシーを適用し、パフォーマンス・カウンターを細かく調べて、最適化を試みました。 しかし、”魔法の杖”はなく、徐々に、そして一時的に改善されるだけでした。

大手ストレージベンダーから得た結果に満足できなかった私は、上司の指示で新規参入のストレージの調査をすることになりました。 状況を把握し始めた頃、Tintriの営業から声がかかりました。 というのも、数年前に彼からディスクベースのバックアップソリューションを購入したことがあったからです。 その経験から経営陣の信頼を得ていたので、私はTintriのソリューションの検討を進めました。
正直なところ強い確信があったわけではありませんし、上司には「君のチームはすでに十分忙しい。複雑な新しいストレージ・システムを学ぶために、これ以上時間を割くのか?」といわれましたが、Tintriの営業いうことにも理があるはずです。

そこで、初めてTintri VMstoreを購入し、ワークロードの移行をためらいながら開始しました。最初の数回の非本番サーバーの移動が順調に進み、プライマリストレージアレイの負荷を減らしました。Tintriはまだまだ余裕です。
次には、仮想デスクトッププールを移動させるという試練が待っていました。 仮想デスクトップはしばしば最大の問題となり、大量のディスクトラフィックを発生させ、その多くが書き込み負荷となります。 このトラフィックは、仮想デスクトップが使用するストレージボリュームやストレージアレイ全体を破壊し、”うるさい隣人”というより、”集合住宅”全体がうるさいという状態になっていました。 当時は、ストレージボリュームをより多くのディスクに分散させることで補おうとしていましたが、パフォーマンス要求に追いつくのはやっとでした。

(技術的な余談ですが、ハードディスクベースの大規模アレイの管理に慣れていない人のために、「ショートストローク」と呼ばれるテクニックがあります。 私たちはこの手法を用いるとともに、入出力の負荷をできるだけ多くのディスクに分散させ、仮想化ワークロードに対応するよう努めました。 その結果、アレイ内のディスクの容量をはるかに下回る使用量ですが、十分な性能を確保することができました。)

VDIプールをVMstoreに移行すると、プライマリストレージアレイが安堵のため息をつくのが聞こえました。 Tintri のパフォーマンスリザーブが若干低下するのを確認しましたが、この課題には簡単に対応でき ました。最終的には、”うるさい隣人”の仮想マシンの大部分(仮想デスクトップの大部分を含む)をVMstoreに移行し、プライマリアレイのディスクを数十台空けることができました。 最も印象的な指標は、仮想デスクトッププールのアンチウィルススキャンが、メインアレイで毎週約12時間かかっていたのが、Tintri VMstoreでは1時間未満になったことです。

私たちは大手ベンダーのストレージアレイを購入したのですが、そこにはハードディスクの棚が12個ほどあり、データセンターのラック1つ分以上のスペースを占有していました。 しかし、TintriのVMstoreは、わずか2Uので、そのアレイに負荷を与えていたワークロードを容易に吸収することができたのです。 さらに、私のチームが問題を診断し解決するために費やしていた時間を取り戻すことができました。 SANストレージと私たちは安堵のため息をつき、別の仕事に取りかかりました。 その時点で、すべての仮想マシンをTintriに移行することを決定し、それ以降、振り返ることはありませんでした。

フラッシュストレージの時代には、この話は古めかしくて原始的なものに思えるかもしれませんが、今もTintri VMstoreはVMware、Hyper-Vなどで稼働する仮想化ワークロード、MS SQL Serverに対して業界トップレベルの性能とシンプルな管理を提供し続けているのです。
次回は、Tintriの比類なきシンプルさがいかにITリソースとあなたの時間を解放するかについてお話しします。第2回はこちら

本ブログはTintri by DDN, Inc. のSE、 Tom Maddoxのブログ https://tintri.com/blog/tintri-becming-a-believer-part-1/ の翻訳版です。