New Relicの導入効果をレビューでご紹介(Cut-株式会社エアークローゼット)
株式会社エアークローゼット / Cut
メンバー / SRE / 従業員規模: 51名〜100名 / エンジニア組織: 11名〜50名
利用プラン | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|
New Relic One Pro | 11名〜50名 | 2023年1月 | B to B B to C |
利用プラン | New Relic One Pro |
---|---|
ツールの利用規模 | 11名〜50名 |
ツールの利用開始時期 | 2023年1月 |
事業形態 | B to B B to C |
アーキテクチャ
アーキテクチャの意図・工夫
- 大きな工夫はありませんが、導入コストが最も小さい方法を選択しています。
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
- 監視ツールの分散
- ログ、メトリクス、トレース、イベントがさまざまなツール (Prometheus, Datadog, Sentry, CloudWatch, bigQuery...)に分散しており、認知負荷の増大、対応速度の低下を招いていました。
- システム全体のオブザーバビリティが低い状態
- 監視ツールが分散していたこともあり、あるプロダクトではできていることが別のプロダクトではできていない、プロダクトを跨いだ問題が起きた場合に問題箇所が見通しにくいといった課題がありました。
- 上記の課題を解決しようとしたとき、移行前のツールで試算すると利用料金が高額になりすぎることがわかっていました。
どのような状態を目指していたか
- 監視ツールが統合されており、認知負荷が少なく、迷いなく調査に入ることができる状態
- 全てのプロダクトでオブザーバビリティが確保されている状態
導入の成果
改善したかった課題はどれくらい解決されたか
- 監視ツール統合の観点では、導入のタイミングでほとんどの情報をNew Relicに集約できたため、課題は解決されています。
- オブザーバビリティ確保の観点では、強力なAPM機能により、アプリケーションレベルの原因特定が容易になったほか、統合したことで複数システムの情報を並行して観測できるようになり、課題の解消ができていると感じています。
どのような成果が得られたか
- New Relic移行後初のパフォーマンス改善PJでは、オンライン選定システムのパフォーマンスを改善し、年間2,520時間分の削減ができました。
導入時の苦労・悩み
- デプロイ用サーバのOSバージョンアップ
- 導入にあたり、デプロイ用サーバのOSをバージョンアップする必要がありました。
- New Relicへの移行期間中はそれぞれのバージョンで環境を用意していたため、一時的にリリースフローが複雑になりました。
- Nodeのバージョンアップ
- 特定のリポジトリでは、導入にあたってNodeのバージョンアップが必要になりました。
- 特に、バージョンアップが遅れていたアプリケーションにおいては、バージョンアップすることによって特定の機能が正常に動作しなくなり、プログラムの修正が必要になる場面もありました。
導入に向けた社内への説明
上長・チームへの説明
- 圧倒的に課題感が強く、むしろ上長 (CTO) からの声掛けでスタートしている背景があったので、特に上長への説明はしていません。
活用方法
- オペレーション担当者が、毎日のオペレーション業務の中で、問題を調査する目的で使用しています。
- SREが、週次のモニタリング業務の中で、大きなパフォーマンスの変化がないか確認するために使用しています。
- マーケティング部門が、モニタにNew Relicダッシュボードで作成したファネルを表示し、重要なページで問題が起きていないか確認しています。
よく使う機能
APM Transactions
- 特にパフォーマンス改善において、ボトルネックの特定に活用しています。
- どのセグメントにどの程度の時間がかかっているのか一目で確認できるため、よく使用しています。
New Relic Alerts
- Alert PolicyとWorkflowを組み合わせて、柔軟な通知管理ができます。
- 通知先としてSlackを選択している場合、各チャンネルに設定されている通知の管理がしやすく、レベルの変更も容易に行うことができます。
Change Tracking
- Errors Inboxと組み合わせて、直近のリリースが原因で発生したエラーのアラートに役立てています。
ツールの良い点
- サポートが手厚いため、ツールに慣れないメンバーがいてもトレーニングを通して習熟を図ることができます。
- 導入が非常に手軽で、データを見ることができる状態にするまでほとんど労力がかからないのは非常にありがたいポイントです。
- NRQLを書くことで、Logsからシームレスに影響範囲を特定できたり、ダッシュボードを作成できたりと自由度が高いです。
ツールの課題点
- 1アカウント3セッションの制限があるため、複数端末で使用する場合にログインとセッション切断を求められがちになります。
- 特にCodeStreamを使用する際は、CodeStreamを開くと他のセッションが切断されたりして体験として悪い場合があります。
- Full Platform User 1人当たりの料金は決して安くないため、アカウントマネジメントが必要になります。
今後の展望
エアークローゼットではイベント駆動アーキテクチャへの移行を進めていますが、まだ十分なオブザーバビリティを確保できていないため、今後はNew Relicを活用しながら強化を進めたいと考えています。また、お客様向けに提供しているモバイルアプリにもNew Relicを導入予定です。
株式会社エアークローゼット / Cut
メンバー / SRE / 従業員規模: 51名〜100名 / エンジニア組織: 11名〜50名
大学・病院向けのシステムを開発する企業でエンジニアとして1年ほど経験したのち、株式会社エアークローゼットにジョインし、ソフトウェアエンジニアを2年経験しました。 ソフトウェアエンジニアとしては、オンライン選定システムや倉庫マネジメントシステムといった領域で、フロントエンドからバックエンド、インフラ構築まで幅広く担当していました。 その後、同社にてSREに転向。SREとしては、1人目としてポジションの立ち上げからKPI設定および管理、外形監視ツールの導入推進や自動コードレビューツールの導入、SLI, SLOの設定、パフォーマンス改善、セキュリティ強化など幅広く担当しています。
よく見られているレビュー
株式会社エアークローゼット / Cut
メンバー / SRE / 従業員規模: 51名〜100名 / エンジニア組織: 11名〜50名
大学・病院向けのシステムを開発する企業で...
レビューしているツール
目次
- アーキテクチャ
- 導入の背景・解決したかった問題
- 活用方法