シンプロビジョニングと実際の使用サイズについて

Tintriのオートサポート機能で集まったデータを活用して、シンプロビジョニングと実際の使用サイズについて分析してみました。

Tintri VMstoreは、LUN全体の平均値や相関性だけでなく、VMや仮想ディスクの稼動状態も見ることができます。これにより、今まででは考えられなかった方法でデータセンター内の動作を確認することができます。


今回のポイント

  • Tintriのオートサポート機能から送られるデータを活用することで、現実世界における仮想マシンの動作に関する多くの情報を収集することができます。
  • Tintriのお客様のプロビジョニングされたVMのサイズは通常40GiBから80GiBあり、多くの場合40 GiB、80 GiB、64GiBとなっています。
  • Tintriのお客様は、シンプロビジョニングにより、シックプロビジョニングに比べて約2倍のスペースを節約できます。ただし、極端なサイズのVMに対しては、効果が小さくなります。

毎晩、Tintri VMstoreは健全性と動作に関するサマリーをアップロードしています。これによりTintriはシステム上の問題を特定し、注意すべきストレージ機器をお持ちのお客様に、サポートチームが能動的かつ積極的にサポートすることが可能になります。またTintriのエンジニアによって、製品が実際にどのように使用され、注意すべき領域はどこなのかということについて深く知ることができます。Tintri VMstoreのオートサポートから得た現実世界のデータは、これまでの「勘に基づく決断」から「根拠に基づく決断」へとエンジニアリングの意思決定を変えます。

仮想マシンサイズ

私たちは「仮想マシンの大きさは通常どのくらいだと思いますか?」というシンプルな質問を問いかけます。

およそ40万台もの仮想マシンや、Tintriのお客様から毎晩送信されるオートサポート機能での情報をもとに、仮想マシンのサイズについて匿名で情報収集をしました。最も重要なキャパシティ統計は以下の2つです。

  • プロビジョンニングサイズ:ユーザーはどのくらい大きな仮想ディスクを作ったのか?TintriのVM StoreはVMに書き込まれたvmdkファイルのサイズからこれらの情報を収集します。
  • 使用サイズ:実際使用されているサイズ、どのくらいの論理データが仮想ディスクに書き込まれ、Tintriに蓄積されているのか?

時には使用サイズがプロビジョニングサイズを上回ることがあります。VMwareスナップショットは-delta.vmdkファイルを作成し、これはプロビジョニングサイズではなく、使用サイズに追加されます。VMスナップショットや複製を示すシンセティックな仮想マシンのプロビジョニングサイズがゼロと報告されることもあります。特定の環境下では、リンククローンのプロビジョニングサイズは実際よりも小さく報告されることがあります。分析するにあたり、プロビジョニングサイズと使用サイズの双方がゼロとなった多くのVMを除外しました。これらはストレージからは除外されたものの、vCenterや他のコーナーケースからは除外されなかったVMである可能性があります。

VMサイズは様々です。今回収集した一連のデータの中で最小のプロビジョンニングサイズはわずか数百キロバイトで、最大のものは30TiBを超えました。VMサイズの分布を以下のグラフに示します。

上記のグラフから、ほとんどのVMが20GiBから160GiBでプロビジョニングされていることがわかります。最も多いサイズは40GiB(サンプルの3.81%)と80GiB(3.78%)です。このほか、10GiB、30GiB、42GiB、44GiB、50GiB、60GiB、64GiB、80GiB、100GiB、104GiBも多く見られました。これらに該当するケースを合計するとお客様のVMの30%に相当します。

20GiBのVMがそれほど多くない(18番人気で、収集サンプルのわずか1.29%)のには驚きでしたが、小さいVMは一般的でないといえます。 以下に、簡単に比較できるよう、VMサイズの割合をグラフで示します。

使用サイズの分布はおおむね均等ですが、小さいサイズにやや偏っています。使用サイズは圧縮や重複排除前に測定されているため、VMが書き込んだデータ量を正確に示しています。この測定では、TintriのネイティブクローンもしくはVAAIクローンの使用サイズは、クローンの作成後に書き込まれたデータ量のみを表し、OSイメージや既存データは含まれていません。

最も多かったプロビジョニング サイズは40~80GiBであるのに対し、使用サイズはその半分の20~40GiBでした。VMの約10%は1GiB未満のデータしか書き込んでいません。

Tintriが提供しているNFSデータストア等では、シンプロビジョニングがデフォルトです。ほとんどのVMは仮想ディスク全体に書き込んだりしません。シンプロビジョニングが各VMサイズに対して、どれだけのメリットをもたらしているのか調べることができます。全体的には、実際に書き込まれたVMのプロビジョニングサイズは全体の約40~50%ですが、若干の相違があります。

もちろん、非常に小さいVMはディスクを満杯にしようとします。しかし平均的には、大きいVMは標準サイズのVMと比べて、あまりシンプロビジョニングされていないようです。これはmonster VMに対してより慎重なキャパシティプランニングが行われている、もしくは容量に対する需要の高まりに応えてディスクを追加することで、必要に応じてVMを拡張しているためと思われます。

この調査はある時点におけるTintriのお客様の見解を示しているにすぎません。将来のストレージ製品の需要を予測する上で、時と共にVMサイズがどのように変化するか調べてみるのも興味深いでしょう。また今回は必要な物理ストレージ量をさらに効率よく利用できる、Tintriによる圧縮や重複排除の効果については調べませんでした。

仮想環境の規模に関しては、VMの全体の動作を理解するには、Tintriがすでに提供しているリアルタイムでのVM単位の分析からさらに一歩踏み込まなければなりません。ここで示されている集合的統計は、Tintriがエンジニアリングプライオリティや適切な作業量を決定する際に役立ちます。さらにストレージの使用を促しているものを理解し、異常値を見つけることにより、お客様も環境に対する理解を深めることができます。Tintri by DDNではこのような「ビックデータ」分析をお客様に示すために、数々の興味深いプロジェックトに積極的に取り組んでいます。