2024年 AI: Inferenceが離陸、何が起きるか?

2024年 AI: Inferenceが離陸、何が起きるか?

今年2024年には、高度に洗練された推論アプリケーションが市場に溢れるだろう。そして、アプリケーション展開の状況を大きく変えようとしている。これらのイノベーションには、複雑なネットワークが実装された最適化されたプラットフォームが必要だ。適切に設計されれば、桁違いの効率化を実現でき、長期的な経済効果は計り知れない。

このため、2024年は、アプリケーション配信プラットフォームと進歩的な可用性スキーマの新たな進化が見られるなど、1990世代後半以来のプラットフォーム要件の劇的な変化が起こる年となるだろう。

TintriのCTO兼製品担当バイスプレジデントであるBrock Mowryは次のように述べている。

「2024年には、Generative AIアプリケーションに対するプラットフォーム需要が、革新的なエンタープライズ向けプラットフォームを牽引するでしょう。エンタープライズITプラットフォームは、本番環境、開発環境、およびプレイグラウンド環境をサポートするために、迅速かつ強力なインスタンスを提供しなければならなくなります。そして、これらの生成されたインスタンスによって、企業内のワークロードの無秩序な分散という新たな課題を生むでしょう。このような無秩序な分散をうまく回避できるかどうかが、ビジネスの勝敗を左右すると考えます。」

“より少ないリソースでより多くのことを行う” はビジネスの定石だ。これはAIの世界でも同様である。推論アプリケーションはリソースを大量に消費するが、成功するためには、巨大で高価格なシステムが必要だからとそのまま利用するのではなく、どのように対処するか検討しなければならない。

現在、AIのプロセスとアプリケーション管理には、高度に専門化されたオペレーター、複雑なネットワーキング、複雑な共同計算のニーズ、複雑なストレージ機能が必要とされている。そのため2024年は、現在のアプリケーションとデータ配信のグローバルな取り組みが驚くほど進化する年になると予測している。

本番アプリケーションの管理コストをコントロール

2024年、私たちは大きな変化に直面している。革新的なワークフローは、新しいI/Oパス、大規模な分散コンピューティング・ディストリビューション手法、スケールアップした帯域幅と大規模なストレージ管理の要件を必要とする。これは、実際のアプリケーション展開に入る前に検討しなければならない要件だ。

マイクロサービス・アーキテクチャは、目的を明確にして設計されたプラットフォーム上にデプロイされた場合、非常に効率的である。その逆も真で、きちんと設計されていない場合、混乱を招く可能性がある。早期にスコープを設定し賢く構築しなければならない。

Tintriの製品担当バイスプレジデントBrock Mowryは、さらに次のように述べている。

「高度に自律的で進化したコンテナ・プラットフォームは、2024年のAIインフラにおいて重要な役割を果たし、効率性と柔軟性を高め、アプリケーション全体のTCOを削減します。しかし、コンテナ・インフラストラクチャの複雑さは、多くの企業ITチームにとって大きな課題となるでしょう。この知識ギャップを埋めるために、AIプラットフォーム・ベンダーはユーザーフレンドリーなソリューションと教育リソースに投資しなければなりません。」

「2024年には、リソースの粒度を管理・提供する能力が最も重要になるでしょう。モノリシックでレガシーベースのプラットフォームは、“ワークロード” アーキテクチャのパブリックおよびプライベートAIプラットフォームソリューションに取って代わられるでしょう。これによって、レガシーと比較して膨大な効率性が得られるでしょう。」

VMがAIスタックの柔軟性とセグメント化を促進

2024年には、新しい「キラー」Generative AIと推論ベースの重要なアプリケーションが企業規模で加速される。多くの複雑なタスクを実行するためのニューラルネットワークの学習に10年以上が費やされてきた。学習モジュールは通常、本番アプリケーション環境の外で開発・実行される。多くの場合、「本番」ではないSLAが適用される。2024年のプライベートAIは、企業データを解き放ち、企業IPを漏洩から守る。

これは、企業がAIを幅広く採用するための、最も大きな阻害要因の上位3つのうちの1つである。

デプロイされたアプリはどこに置かれるのか?VM:仮想マシンである。推論ワークロードのAI導入フェーズを加速させるには、VMが重要になる。一度学習されれば、「学習済みアプリケーション」はVMトポロジー上に存在するが、一方「大型コンピュータ」では引き続きモデルを学習するためのホームを探すことになる。

TintriのEMEA担当バイスプレジデント、Mark Walshは次のように指摘する。

「ヨーロッパでは、本番ロールアウト、サンドボックス、CICDワークロードにVMが採用されています。VMを利用したトポロジーにより、データサイエンティストは、従来の本番アプリケーションのロールアウトと同じようにやり取りし、デプロイすることができます。顧客のワークフローは大幅に改善されました。あらゆる兆候は、2024年に大きく立ち上がることを示しています。」

進化するセキュリティ

新年をお祝いするように、新しく改良されたAIや新しいAIベースのツールセットを歓迎している。なぜならば、AI利用の可能性が高まれば高まるほど、その数は増え、さらに重要なことに、AIが手にする能力も高まるからである。

ただし、TintriのCTO兼製品担当バイスプレジデント Brock Mowryは次のように警告する。

「悪意ある集団も研究開発を進めています。2024年には、AIのインテリジェンスとパワーを活用した新たな攻撃ベクトルが出現し、企業のセキュリティチームの新たな敵になるだろう。」

古くからある猫とネズミのゲームはさらにパワーアップされ、私たちは2024年にフル稼働させられることになるだろう。まさに想像を絶する新世界だ。

January 2, 2024 収益担当シニア・バイスプレジデント Phil Trickovic 

オリジナル: https://tintri.com/blog/2024-inference-takes-flight-now-what/