複雑化するIT運用におけるオブザーバビリティの進化 - Dynatraceの取り組みとAIによるIT運用の展望
システム全体をリアルタイムで把握し、エラーやパフォーマンス低下の根本原因を特定するオブザーバビリティは、現代のITシステム運用において欠かせない要素です。技術の進化によりシステムが高度に分散化し、従来の監視ツールでは対応しきれない課題が増えています。特に、日本企業ではITエンジニア不足やレガシーシステムの存在もあり、効率的で安定したシステム運用が求められています。
そこで今回は、グローバルにオブザーバビリティプラットフォームを展開するDynatrace社に、複雑で多岐にわたるシステム運用の課題に対して
どのようなアプローチで取り組んでいるのか、またAIOpsを活用した自律的なIT運用の実現に向けたビジョンや今後の展望についてご寄稿頂きました。
ITシステム全体をリアルタイムで把握する「オブザーバビリティ」とは
変化が求められるシステム監視・観測の現場
日本でデジタルトランスフォーメーション(DX)が推進されてから、約10年が経とうとしています。
日々の生活にデジタルの力が欠かせなくなった現代において、企業は、安全かつ安定的なデジタルサービスを提供することが重要な競争要素となっています。「オンライン決済がうまくいかない」、「見たい動画が止まってしまった」、「知りたい情報にアクセスできない」といったデジタルサービスへの不満は、企業イメージの失墜にもつながりかねません。企業は、より魅力的なデジタルサービスを提供するだけでなく、それらを支えるシステム監視・観測方法を見直し、ダウンタイムを削減しながら顧客満足度を確保することが求められています。
オブザーバビリティは予測不能な問題にも柔軟に対応
そこで注目されるのがオブザーバビリティ(可観測性)です。オブザーバビリティとは、システムやアプリケーションが生成するログ、メトリクス、トレースといった多様なデータに基づき、システムの内部状態を正確に把握できる能力を指します。従来の監視では、あらかじめ定義された特定の指標やルールに基づいて問題を検知するのに対し、オブザーバビリティはシステム内でリアルタイムに起こっている予測不能な問題にも対応できる柔軟性を持っています。
クラウドを含むハイブリッド環境におけるオブザーバビリティの目的は、システムのエラーやパフォーマンス低下の根本原因を特定し適切な対処を行うことで、システムの信頼性を向上させることです。これにより、ユーザーに影響が及ぶ前に問題を検出し、迅速に解決策を講じることが可能となり、複雑なシステムでも信頼性とパフォーマンスの向上を実現します
オブザーバビリティへのニーズが高まる背景
クラウド環境への移行でシステムの複雑さが増している
企業がオブザーバビリティを必要とする背景には、DXの加速と、それに伴うITシステムの進化と複雑化があります。
かつて、ITシステムは主に単一の物理サーバーで運用されており、その監視は比較的シンプルでした。システムの稼働状況やパフォーマンスを把握するために、主にメトリクスやログを用いてシステム全体を監視し、異常が発生した場合はそれに対応するという手法が一般的でした。
しかし、現在ではクラウドコンピューティング、コンテナ、サーバーレスアーキテクチャといった技術が普及し、システムは高度に分散化、動的化しています。特にクラウド環境では、ITシステムは自由度と柔軟性が高まりつつも、複雑さが増し、扱うデータ量も爆発的に増加しています。さらに、システムはサイバー攻撃などの外部脅威にもさらされており、これらに対処するための高度な可視化が求められています。
このような環境では、従来のモニタリングツールではシステム全体の予測不能な問題や依存関係のトラブルを事前に把握するのが難しくなっています。
特にマイクロサービスのような小規模なコンポーネントが連携する現代のシステムでは、1つのサービスのエラーが全体に波及するリスクが高く、問題の根本原因を迅速に特定するには限界が生じています。
日本だけでなく欧米諸国でも効率的で安定した運用に課題が残っている
さらに、日本企業はITエンジニア不足やレガシーシステムの存在といった課題を抱えていますが、日本に比べてDXが進んでいるといわれる欧米企業でも、効率的で安定したシステム運用に課題が残されています。Dynatraceが企業のCIOを対象に行った調査によると、「システム全体の可視化(72%)」「手作業による監視の削減(74%)」「属人的な運用からの脱却(93%)」といった課題解決にニーズがあることがわかりました。またDevOps自動化調査によると、「エンジニアの時間の約40%しか生産的なタスクに費やされていない」という結果も示されており、効率的な運用が求められています。
こうした背景を踏まえ、開発、運用、セキュリティの担当者が膨大なデータをより効率的に扱うためには、エンドツーエンドのオブザーバビリティプラットフォームが必要不可欠です。従来の個別ツールによる監視だけでは対応しきれず、システム全体を観測・把握できるオブザーバビリティの導入が求められています。
また、オブザーバビリティは単なる技術的な可視化にとどまらず、ビジネスに与える影響を理解し、エンドユーザーの体験を最適化することも可能です。これにより、企業はユーザーのニーズに迅速に対応するなど、オブザーバビリティによって得られたデータを、ビジネス目標の達成にも活用できるようになります。
Dynatraceによるエンドツーエンドのプラットフォームの特徴
創業は難解なシステムトラブルに悩む日々から
Dynatraceは、2005年にオーストリアのリンツでBernd GreifenederとSok-Khengによって創業されました。
その背景には、創業者たちのある体験があります。eコマースが急速に普及し始めた頃、オンラインストアがクラッシュしても原因が分からず、システムの複雑さに圧倒される企業が多くありました。Bernd自身も、当時働いていた企業でこのような問題に直面し、1人では解決できないシステムトラブルに悩む日々を送っていました。この経験を基に、Berndは「システム全体を監視し、発生した問題の原因を特定できるソフトウェアを作りたい」という強い思いを抱き、Dynatraceの開発に着手しました。
以来、Dynatraceは「ソフトウェアが完璧に機能する世界」をビジョンに掲げ、最先端のソフトウェアインテリジェンスプラットフォームへの投資を積極的に行い、ダウンタイムゼロの環境を追求しています。
Dynatraceは、マイクロサービスやクラウド環境の複雑性を解決する唯一の方法がAIであると確信し、2014年にAIエンジンを発表しました。
それ以来、このAIエンジンは継続的に改善され、実績あるテクノロジーとして確立されました。現在、私たちは日々数兆の依存関係を分析し、導入企業のアラートの氾濫を削減するとともに、問題をより迅速かつ容易に発見し解決できるよう支援しています。この先進的なAI技術は、Dynatraceの成長を支える重要な要素となっています。
AI技術を取り入れ、非属人的なプラットフォームへ
Dynatraceのエンドツーエンドのプラットフォームは、さまざまな業界のデジタルサービスを支えています。プラットフォーム上に構成された複数のテクノロジー群によって、導入効果として運用工数の大幅な削減を実現しており、運用メンテナンス工数ゼロ、非属人的で効率的なシステム運用を実現できる点が、Dynatraceが強みの一つです。
例えば、「OneAgent
」はアプリケーションやインフラを自動的に検知し、手動設定を不要にします。さらにアプリケーションスタックを継続的に監視し、メトリクス、ログ、トレースをリアルタイムで収集します。
また、「Smartscape
」はシステムのトポロジーと依存関係をリアルタイムでマッピングし、IT環境の全体像を一目で把握できるようにします。
さらに、AIエンジンである「Davis AI
」は、OneAgentによって収集された豊富なデータとSmartscapeからのコンテキストに基づくインサイトから、問題の検知、根本原因の分析、影響範囲の特定などを自動で行います。これにより、複雑なシステム環境でも迅速かつ正確なトラブルシューティングが可能となります。
Dynatraceのもう一つの重要な特徴は、アプリケーション、インフラ、ユーザーエクスペリエンスを一元的に監視できる点です。
「PurePath
」分散トレーシングにより、ブラウザからデータベースに至る全てのトランザクションを詳細に追跡し、性能やボトルネックの問題を迅速に特定できます。これにより、開発者はコードレベルの問題を検出し、プログラムを停止することなくデバッグを進められます。この包括的な監視能力により、高品質な新製品や機能をスピーディーにリリースすることが可能です。
また、Dynatraceはセキュリティとオブザーバビリティの統合という点でも業界をリードしています。ランタイム脆弱性管理により、リアルタイムでアプリケーションのセキュリティを確保し、攻撃のリスクを最小化します。このセキュリティ機能は、クラウドネイティブ環境や大規模なマイクロサービスアーキテクチャにも適応するスケーラブルな設計となっています。
創業者のビジョンに基づいたプラットフォームは、現在も進化を続け、世界中の4,000社以上のデジタルサービスを支えると同時に、開発、運用、セキュリティ担当者の生産性向上とイノベーション促進に寄与しています。
AIOpsによってIT運用が自律化された未来を実現する
システム開発の内製化が進む現場において、AIOpsによるIT運用全体のアップデートがさらに重要に
オブザーバビリティがITシステムの運用における重要な基盤として注目される中、AIOps(Artificial Intelligence for IT Operations)の導入がさらにその価値を高めています。Dynatraceのプラットフォームは、システム全体の可視化とトラブルシューティングに優れているだけでなく、AIOps機能を統合することで、さらに高度な運用効率と信頼性を実現しています。
AIOpsは、IT運用の自動化と最適化を目的とし、膨大なデータをリアルタイムで分析し、問題の検知や予測、解決を支援します。これにより、従来の人手による監視や対応に比べ、圧倒的な速度と精度で運用上の課題に対応できるようになります。特に、ITシステムがますます複雑化し、マイクロサービスやクラウドネイティブ環境が普及する中で、AIOpsの意義はますます高まっています。
さらに、欧米企業と比較すると、日本企業ではIT運用業務を外部委託するケースが多い傾向にあります。従来のモノリシックなレガシーシステムの運用では、システム構築時に運用手順を策定し、それに従って外部委託先がオペレーションを行うことで問題なく運用が可能でした。しかし、モダンなITシステムでは、新たなサービスの提供やクラウドの活用により、システム変更の頻度が急増しています。このような状況においては、従来の運用方法では柔軟性や迅速性が求められるビジネスニーズに応えきれないことが課題となっています。
一般的なAIOpsソリューションは、主にデータ収集や分析の自動化、異常検知のアルゴリズム強化などに注力しており、特定の用途や業界に特化した製品も多く見られます。しかし、Dynatraceは真の意味でのAIOpsの実現に向けて、そうした個別のタスクの自動化ではなく、IT運用全体をAIで高度化できる統合運用プラットフォームを目指しています。
トラブルシューティングだけでなく、技術とビジネスの橋渡し役を担えるプラットフォームへ
先ほど紹介したDynatraceのAIエンジンである「Davis AI」は、業界初のハイパーモーダルAIとして、予測AI、因果AI、生成AIの3つを統合し、IT運用の全プロセスを自動化・高度化するプラットフォームです。予測AIは、多次元データを基にシステムの異常(=予兆)を検出し、事前に問題を予測して信頼性の高い運用をサポートします。因果AIは、トポロジー情報やセキュリティデータを分析し、異常の根本原因を特定すると同時に、そのビジネスインパクトを評価して優先順位付けを行います。生成AIはAICoPilotとして、ユーザーインターフェースの効率化を支援します。
さらに、DynatraceのAIOpsは、トラブルシューティングの迅速化だけでなく、システムのパフォーマンス向上や将来的な問題の予防にも貢献します。例えば、負荷が急増する可能性がある箇所を事前に特定し、対策を講じることで、ユーザー体験を維持しつつシステムの信頼性を向上させることができます。また、これらのインサイトは、IT運用だけでなく、ビジネス戦略の立案や意思決定にも役立つため、技術とビジネスの橋渡し役としても機能します。
日本市場では、IT運用の内製化が企業戦略の重要なテーマとなりつつあります。Dynatraceは、このような背景を受けて、企業がIT運用の内製化を進めるためのプラットフォームを提供しています。特に、AIを活用した運用自動化により、柔軟かつ迅速な対応を可能にし、日本企業がデジタルサービスを通じて競争力を高めることを支援しています。私たちは、この状況を変えるために、AIを活用した自動化ソリューションでIT運用を変革し、日本企業のデジタルサービスの成熟を促したいと考えています。
企画・編集:Findy Tools編集部