導入の障壁が低く始めやすいエラー監視の定番ツール
Ubie株式会社 / syucream
メンバー / バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
利用プラン | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|
Team | 11名〜50名 | 2019年 | B to C |
利用プラン | Team |
---|---|
ツールの利用規模 | 11名〜50名 |
ツールの利用開始時期 | 2019年 |
事業形態 | B to C |
導入の背景・解決したかった問題
導入背景
Sentry の導入以前は、基本的にエラーログが Cloud Logging に残る程度で、エラーを能動的に検知できない(ログを見に行かないと発見が難しい)点が状態でした。そのため、エラーログからあとでトラブルシュートしようにも、情報量が少なく使いにくい点が課題でした。
そこで、あまり特別なことをせずに、雑多なエラーをあとで見返して対応できる体制を構築するために、Sentry の導入の検討をしました。
比較した軸
- 実運用上で余分な作業があまり発生しないこと
- コストが高すぎないこと
導入の成果
Sentry の導入によって、エラー情報を蓄積するという目的は一定達成できました。一方で、蓄積したエラーをうまく対処するか無視するかなど適切にトリアージしたり、システム運用に活用したりという面ではまだ課題が残っている状態です。
また、エラー数が跳ねた時に異常を検知して、具体的にどのようなエラーが起こっているか調査する体制・文化が醸成されました。
参考記事:Sentry と上手く付き合ってエラー監視を改善しよう
(https://zenn.dev/ubie_dev/articles/e7dec1879bfb9c)
導入に向けた社内への説明
上長・チームへの説明
コストが大きくなかったため、あまり説明等は必要なかったです。導入することのリターンとして、エラーに対して能動的にアクションを取れる状態になることは説明しました。
活用方法
主要なマイクロサービスには基本的に SDK を導入してエラー情報を収集し、新着通知を Slack に対して行っています。
また、ユーザへの影響が大きい箇所についてはメトリクスベースアラートをかけてエラー数が跳ねた際に通知が来るようにもしています。
よく使う機能
- Alerts (Slack 通知が主)
- Issues (エラーをグルーピングしてタグ等の情報で検索できる)
- Performance (サービスのトラフィックとコストとの応相談で、限定的なシーンで活用)
ツールの良い点
- SDKと少しの実装・設定をすればとりあえず開始することができるため、始めるためのハードルが低い
- 日々エラーへの対応に向き合うのが理想だが、向き合えず割れ窓っぽくなっても、メトリクスベースアラートやグルーピング、検索による支援で活用ができる
ツールの課題点
- 蓄積したエラーに向き合っていく体制は結局必要なため、向き合うことができなければただ溜めているだけになる
- 最近になってエラー周り以外にも色んな機能が出てきているが生かせていない。フル活用するにはキャッチアップを頑張ることが必要そう
その他
一時期発生しているエラーと真面目に向き合おうとしていたが、向き合いすぎるのも困難を伴いました。
特にクライアントサイドから飛んでくるエラーは環境依存のものもあり、原因とインパクトが分かりにくいエラーも一定あり得たため、これらを精査しながら特に対応すべきエラーに立ち向かうトリアージが必要です。
ツールを検討されている方へ
初期導入のハードルは低く、頑張らなくても一定のリターンは得られるのでおすすめできると思います。
一方で、真面目にエラーに立ち向かうとその難易度は上がる感触があるので、やり方を工夫をしたり、エラーハンドリングの体制を考えたりする必要がありそうです。
Ubie株式会社 / syucream
メンバー / バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
ヤフーやメルペイにてプラットフォーム開発運用に従事。2021年にUbieに入社してからはフルスタックエンジニアとしてプロダクト開発の 0->1 や 1->10 のフェーズにおいてコミット。最近は事業が拡大してきたUbieにおいてスケールに必要な仕込みをすべくEnabling SREや開発生産性改善基盤の構築を目指している。
よく見られているレビュー
Ubie株式会社 / syucream
メンバー / バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
ヤフーやメルペイにてプラットフォーム開発...
レビューしているツール
目次
- 導入の背景・解決したかった問題
- 活用方法