機械学習でインフラの将来予測を立ててみましょう

羽鳥 正明

ティントリジャパン合同会社 マーケティング本部 マーケティング本部長

Tintriアナリティクスは、機械学習アルゴリズムを利用して、ストレージとコンピューティングの将来的ニーズを洞察します。


ここで知っていただきたいこと

  • Tintriアナリティクスはストレージとコンピューティングの将来的なニーズを予測することができ、勘に頼らない的確な意思決定を行うことができます。
  • アンサンブル予測機能は、ストレージのパフォーマンスと容量、VMごとのサーバーCPUとメモリのニーズを予測することができます。
  • いくつかのリリースごとにTintriストレージを慎重にベンチマークすることで、より高い利用率を達成するためにシステムの機能を理解することができます。

昨年発表したTintriアナリティクス、皆さんはもうご存知ですか?簡単に言えば、Tintriアナリティクスは膨大なティントリのインストールベースから集めたデータをクラウドに蓄積して、それを機械学習に掛けることで、仮想環境で可動するアプリケーションのリソース消費傾向を掴むこと行います。その傾向値をTintriアナリティクスでお客様に活用していただくことで、インフラの将来的な傾向を的確に知ることができます。その傾向値を参照すれば、お客様はITインフラの将来的な投資を「勘に頼らない」的確な計画として意思決定するできるようになります。

ティントリのアナリティクスが他社のものと異なっているのは、ハードウェアからの視点ではなく、個々の仮想マシンに対しての将来的な予測を出すことができる点です。VMが最新のオールフラッシュアレイ、または古いシステムで実行されているかに関係なく、お客様が運用しているすべての仮想マシンにアナリティクスを掛けることです。TintriアナリティクスはVMレベルでのストレージメトリクスの洞察に加えて、コンピューティング(物理サーバー)についての洞察を提供します。Tintriアナリティクスは、洗練されたモデリングと実績のある機械学習アルゴリズムを使用して、ストレージとコンピューティングの将来を的確に予測します。また、シミュレーションも可能です。例えば新しいソフトウェア開発を行うために100台のの新しいVDIシート、新しいWebサーバー、運用および開発/テストインスタンスの追加を現在のITインフラ環境がリソース的にサポートできるかどうかを確認することができます。ここからは、Tintriアナリティクスの裏で何が動いているのかをご説明します。

パフォーマンス予測

ストレージのパフォーマンスを予測するには、次の2つのポイントを押さえましょう。

  • パフォーマンスがどのくらい必要になるかを把握すること
  • ストレージアレイのパフォーマンス特性を理解すること

Tintriアナリティクスがパフォーマンスニーズを予測するために使用するアプローチは、データセットの可変長テールセグメントの線形回帰を使用します。長期的かつ短期的な予測子を使用して、2つの結果を融合させます。また、解を導き出すまでの時間を短縮するために、ヒューリスティックに基づいたアプローチが使用されています。ストレージ全体のパフォーマンスがわかっていても、さまざまなワークロードのパフォーマンス要件を理解していないと、なかなか細かい予測を立てることはできないものです。ティントリはワークロードのパフォーマンス要件をモデル化するために、とても長期で膨大なデータを使用します。これには以下のことを理解する必要があります。

  • 大きなI/Oと小さなI/Oのコストはどれくらいですか?
  • 読み込みと書き込みのコストはどれくらいですか?
  • シーケンシャルとランダムのI/Oコストはどれくらいですか?

当然のことながら、これらの質問に対する回答はティントリのモデルごとに異なってきます。オールフラッシュとハイブリッドでは顕著に違いがあります。お客様はオールフラッシュもハイブリッドも可動していることが多いため、ワークロードをフラッシュからハイブリッドに、またはその逆に移動することによる影響をモデル化できなければなりません。いくつかのリリースでは、すべてのアプライアンスを一連のベンチマークで実行し、その結果を使用してモデルを更新し、予測は常に可能な限り正確です。

ストレージ容量の予測

ストレージ容量の予測はパフォーマンスよりも簡単だと思うかもしれませんが、圧縮と重複排除の効果により、これらのテクノロジが普及する前よりプロセスが少し複雑になります。異なるデータセットでは重複排除と圧縮が劇的に異なるため、圧縮と重複排除の比率をモデリングしています。重複排除は単なるワークロードの問題ではなく、アレイ上のワークロードの組み合わせが大きな影響を与える可能性があります。同じアレイを共有する2つのワークロードでは、同じ2つのワークロードを別々のアレイに配置するよりも重複排除に大きな影響を与える可能性があります。ハイブリッドアレイでは重複排除が行われず、ティントリのハイブリッド製品は、ハードディスクに格納するデータには重複排除を掛けないため、モデルが混在する環境ではさらに複雑になります。

コンピューティング要件の予測

挙動をモデリングするときのアプローチは、コンピューティング環境でも似ていますが少しわかりやすいかもしれません。I/Oパフォーマンスと容量の代わりに、計算に関連するメトリックはCPUとメモリーの使用率です。これらのリソースのニーズを予測するために、同様の機械学習アルゴリズムを使用します。Tintriアナリティクスではコンピュートノードの限界値を把握していますが、モデリングはストレージよりもしやすいですね。ストレージと同様に、VM単位で異なるワークロードのコンピューティングリソース消費をモデル化します。Tintriアナリティクを使用すると、すべてのパフォーマンス情報をVMレベルで直接見える化することができます。

機械学習型の分析機能により、ITオペレーションに競争力をもたらします

Tintriアナリティクスの将来予測例

よりスマートな分析手法

Tintriアナリティクスをどのように利用視するのが良いでしょうか?実行中のワークロードの実際の動作に基づいて、ストレージとコンピューティングのニーズをモデル化できますVMの粒度でモデリングすることにより、ティントリはより的確な予測情報を提供し、リソースの将来計画をよりしやすくします。Tintriアナリティクスは、環境への潜在的な変化をモデル化し、その影響を数秒で表示できるため、新しいITプロジェクトの展開を簡素化します。既存のインフラが今後のIT追加をサポートできるかを判断できるようになります。もし既存のインフラでサポートできないという分析結果になった場合は、いつ頃どのようなサーバーやストレージを増強するのが良いのかを予測してくれます。次年度の予算計画に盛り込むなど、勘に頼らない将来が見えてくるはずです。