株式会社オープンロジのDatadog導入事例
株式会社オープンロジ / 林正紀
チームリーダー / SRE / 従業員規模: 101名〜300名 / エンジニア組織: 51名〜100名
利用プラン | 利用機能 | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|---|
Datadog Pro | ダッシュボード、APM、RUM、Monitor、SLO等 | 51名〜100名 | 2021年1月 | B to B |
利用プラン | Datadog Pro |
---|---|
利用機能 | ダッシュボード、APM、RUM、Monitor、SLO等 |
ツールの利用規模 | 51名〜100名 |
ツールの利用開始時期 | 2021年1月 |
事業形態 | B to B |
導入の背景・解決したかった問題
導入背景
監視基盤としては、それまでは New Relicを導入していました。
2020年8月に New Relicの価格体系の変更があり、あらたに利用ユーザ数による課金体系になりました。
弊社では、監視するサーバ台数はそこまで多くないのですが
開発に携わるエンジニア数は多いため
ユーザ数ベースの課金になると、コスト面で厳しいという状況がありました。
また、弊社でNew Relicを導入した頃のDatadogはまだ機能的に弊社の要件を満たしていなかったのですが
導入検討を始めた2020年10月ごろには
APM等の機能も充実しており、ユーザ数では制限が無い課金体系も弊社の利用状況にマッチしていました。
比較検討したサービス
- New Relic
導入の成果
コスト面での課題は、導入前の目論見通りでした。
ユーザ数で制限されないので、開発者全員が活用できています。
導入時の苦労・悩み
PHP/Laravel のWebアプリケーションとしての監視、という意味では
わりとドキュメント通りスムーズに導入できました。
一方、OPENLOGIでは、Laravelのジョブキューの仕組みを多用しているため
ジョブワーカーやcronで処理している箇所の監視は、追加の設定作業が必要でした。
このあたりのことは、こちらのブログで詳細を書いています。
導入に向けた社内への説明
上長・チームへの説明
チームには、「導入検討された背景と当時の状況」で記載した内容を、開発チーム全員が参加する会議で共有しました。
導入推進時には、当時毎日実施していた夕会で必要な情報や使い方を共有したり
Slackに専用チャンネルを作成して、ディスカッションできる場を作りました。
活用方法
よく使う機能
- ダッシュボード
- 目的別・システム別に俯瞰できるダッシュボードを作っています。
- リリース後のシステム監視などに利用しています。
- Monitor
- CPU使用率のようなシステム的なアラート、SLO違反のアラートなど、ビジネス上問題になりうる事象の検知に利用しています。
- APM
- アプリケーションパフォーマンス上問題ある場合にAPMのトレース情報から深堀り調査をしています
- 最近はProfilerも導入して、さらに詳細追跡できるようにもしています。
- RUM
- Core Web Vitalメトリクスの確認やフロントエンドでのエラー捕捉に利用しています。
- SLO
- 現在は主に Laravelの非同期実行ジョブの処理に対する処理遅延がないかをSLOを設定しています。
ツールの良い点
- 導入が容易
- 特にAWS Integrationが優秀
- 小さく始められる
- ユーザ数に制限が無い
- 監視基盤に必要な機能はひととおり揃っている
- Datadog社が標準で提供しているDashboardでも必要最低限の情報はとれる
- IaC (Terraform) で構築できる
- コミュニティが活発
ツールの課題点
- (いいことではあるのだが)新機能がどんどん追加されるのでキャッチアップが大変
- 上記にも関連するが、UI変更がわりと頻繁にある
- 社内のマニュアルとかスクショ多用すると陳腐化しがち
- サポートの日本語対応が少々弱い
- UIが英語
- 仕方ないと思いつつも少しMackerelがうらやましい…
ツールを検討されている方へ
Datadogはとても多機能なツールで圧倒されますが
まずはベーシックな機能(メトリクス、APMなど)から、スモールスタートで始めるといいと思います。
社内に1人推進係がいると浸透させやすいです。
株式会社オープンロジ / 林正紀
チームリーダー / SRE / 従業員規模: 101名〜300名 / エンジニア組織: 51名〜100名
ソーシャルゲーム開発運用、アーティスト等のファンクラブサービス開発運用、口コミサービス開発運用の会社を経て 2020年1月よりOPENLOGIにジョイン。 入社時からインフラをメインに担当、2022年からSREチームに所属。 嫁とMr.Childrenと麻雀を愛するエンジニア。 https://x.com/m_norii
よく見られているレビュー
株式会社オープンロジ / 林正紀
チームリーダー / SRE / 従業員規模: 101名〜300名 / エンジニア組織: 51名〜100名
ソーシャルゲーム開発運用、アーティスト等...
レビューしているツール
目次
- 導入の背景・解決したかった問題
- 活用方法