メタバースプラットフォームにおけるSentryの導入と活用
カバー株式会社 / sugar cat
メンバー / SRE / 従業員規模: 501名〜1,000名 / エンジニア組織: 301名〜500名
利用プラン | 利用機能 | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|---|
ビジネスプラン | エラートラッキング | 51名〜100名 | 2024年11月 | B to C |
利用プラン | ビジネスプラン |
---|---|
利用機能 | エラートラッキング |
ツールの利用規模 | 51名〜100名 |
ツールの利用開始時期 | 2024年11月 |
事業形態 | B to C |
アーキテクチャ

アーキテクチャの意図・工夫
Sentryはクライアント、Datadogはサーバー側を責務としてアプリケーション全体の監視基盤を構築しています。
導入の背景・解決したかった問題
導入背景
導入検討された背景
メタバースプロジェクトの「ホロアース」ではサービスの品質向上のため、クライアントのエラー監視ツールを見直すことになりました。
当時の状況
プロジェクトの規模が大きくなるにつれ、エラーの発生頻度も増加し、ユーザーからの問い合わせも増えてきたため、エンジニアが能動的にエラーを監視し改善できる仕組みを作る必要がありました。
しかし当時クライアント側に導入していたエラー監視ツールでは、コストや機能面での制約があり、サービスの品質改善に活かすことが難しくなっていました。
技術的な課題
Unity/Web Frontend/Backendの統一的なエラートラッキングを行うために、現状サーバーのテレメトリデータを集約しているDatadogを使用したいと考えていましたが、以下の技術的制約がありました:
- Desktop UnityのSDKの対応状況:Datadogはモバイル版Unity向けのRUMを提供していますが、デスクトップ版や、WebGLのUnityビルドには対応していません
- Cloudflareにおける問題:Webフロントエンドの実行環境との互換性に課題がありました
そのため、クライアントのエラートラッキングに対してSentryを使用し、Datadog Integrationでエラーを集約することでエラー監視基盤を実現する方針としました。
比較検討したサービス
- Backtrace
- Datadog
- New Relic
- Embrace
詳しくは以下の記事をご覧ください: https://zenn.dev/cover_corp/articles/fa3be55ecb1d78
比較した軸
以下の2点を重視して比較しました。
- 複数の動作環境で統合的にエラー監視ができること
- 管理者側のユーザー数が増えてもコストを抑えられること
選定理由
- Unity向けのSDK/WebのCloudflare対応が公式に対応されており、動作環境が広いこと
- 管理者側のユーザー数に応じた課金がなく、純粋なエラー数の従量課金であること
- 各種IntegrationやTerraform等のIaC化が可能、他SaaSとの連携が容易であること
導入の成果
どのような成果が得られたか
現在では実際にユーザーが使用する環境にSentryが導入され、全てのクライアントエンジニアがSentryのエラーログを確認することができるようになりました。 これにより、リリースに対してSentryで検知したエラー修正が含まれるようになり、リリースの品質向上に寄与することができています。 鋭意改善中ではありますが、エラー情報のユーザー情報(端末など)と問い合わせとの紐付けやエラーのトリアージ運用を進めています。
導入時の苦労・悩み
コスト試算の難しさ
Sentryはエラー数に応じた従量課金制のため、単純に導入するとコストが想定を超える懸念がありました。そこで、既存ツールで取得していたエラー数を参考に、Sentry導入後のエラー発生数を予測し、コストを試算しました。
Unity実装の知見不足
UnityでのSentryの利用実績の情報が少なかったため、Unityエンジニアと協力しつつ、各種ビルドに組み込んでもらいテストを行いつつ進める必要がありました。
エラー通知設計
大量のエラーが発生することが予想されていたため、fingerprintによる集約と頻度別の通知設計を行い本当に必要なエラーのみをSlackへ通知するようにする必要がありました。
導入に向けた社内への説明
上長・チームへの説明
既に利用している他の監視ツールとの運用上の責務の定義・運用上でかかる年間コストを算出し、十分にエラー監視ツールを置き換える価値があることを説明しました。
具体的には以下の点を説明しました:
- 既存ツールから移行することでのコスト削減効果
- 全てのクライアントエンジニアがエラー監視を行えるようになる運用面でのメリット
- DatadogとのIntegrationにより将来的に統一的なエラー監視基盤を構築できること
活用方法
- エラーが起きたタイミングでクライアントエンジニアが確認
- リリースのタイミングで、特にエラー数の大きいエラーの改善をリリースに含める
よく使う機能
- エラートラッキング: 基本的なエラー収集と分析
- Issue検索機能: 特定の条件でのエラー絞り込み
- Issue Grouping: 類似エラーの自動分類
- Integration機能: DatadogやSlackとの連携
ツールの良い点
- 広範な対応環境: Desktop Unity、WebGL、Web Frontendすべてに対応
- 柔軟な課金体系: ユーザー数制限がなく、エラー数ベースの従量課金
- 豊富なIntegration: DatadogやSlackとの連携が容易
ツールの課題点
- Unityのノウハウが少ない
ツールを検討されている方へ
コストと機能のバランスが取れた非常に使いやすいツールです。WebのみならずUnityクライアントにも利用ができます。
今後の展望
エラー情報のユーザー情報(端末など)と問い合わせとの紐付けやエラーのトリアージ運用、クライアント・サーバを横断したSLI定義にも利用できるように監視基盤との統合を目指しています。
カバー株式会社 / sugar cat
メンバー / SRE / 従業員規模: 501名〜1,000名 / エンジニア組織: 301名〜500名
よく見られているレビュー
カバー株式会社 / sugar cat
メンバー / SRE / 従業員規模: 501名〜1,000名 / エンジニア組織: 301名〜500名
レビューしているツール
目次
- アーキテクチャ
- 導入の背景・解決したかった問題
- 活用方法