BigQuery で実現する、サービスの成長をリードするデータ基盤
株式会社Belong / tomoyukik
メンバー / データエンジニア / 従業員規模: 51名〜100名
利用プラン | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|
オンデマンド | 11名〜50名 | 2022年 | B to B B to C |
利用プラン | オンデマンド |
---|---|
ツールの利用規模 | 11名〜50名 |
ツールの利用開始時期 | 2022年 |
事業形態 | B to B B to C |
アーキテクチャ

アーキテクチャの意図・工夫
Data as a Product の考え方に則ったデータメッシュ型の構成を目指し、
- データ品質の向上
- データチームへの管理負荷の軽減
を実現させようとしている。 データのドメインに詳しいプロダクトチームにデータのオーナーシップを任せ、責任範囲を分けることで、データチームに集中していたデータ管理コストの分散とデータ品質を向上する狙いがある。
また、Data Contract の考え方を参考に、Application DB と DWH の間で連携用のインターフェースを定めている。 これにより、プロダクトの開発における DB のスキーマ変更によるデータパイプラインへの影響を最小限にしている。
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
事業規模の拡大に伴い、調達・販売が最適化された取引を目指していたが、下記のような課題を抱えていた。
- 属人化
- IT リテラシーの高い経営陣や事業責任者が Google Sheets や BI ツールを使いこなしており、データの集計・分析作業が属人化していた
- データ連携の手間
- 自動でのデータ収集・加工・集計する仕組みがなかったため、データ利用までに手間がかかっていた
どのような状態を目指していたか
データ収集・加工・集計の自動化により、
- 調達・販売価格の最適化
- ユーザ行動の分析
を行い、データを活用した効率的な事業運営を行える状態を目指していた
比較検討したサービス
- Snowflake
比較した軸
- 運用負荷の低さ
- チームが少数であったため、運用コストの低いサーバレスプロダクトである必要があった
- 大規模なデータへの処理耐性
- 将来的なデータ量の増加に対し、スケーラブルな対応が必要だった
- ビジネスインパクトを早期創出できること
- ユーザの望むユースケースを素早く実現し、ビジネス価値への貢献までの速度を求めていた
選定理由
- データソースとのシームレスな連携
- データソースとなる Service 及び、その DB が Google Cloud 上にあるため、Federated Query の利用によりシームレスな連携が実現可能だった点
- フルマネージドかつサーバレスである点
- この特性により、インフラ運用から解放され、少ない人数でも高い運用効率が実現できると判断した
- スケーラビリティ
- BigQuery ではデータ量の増加に対する懸念がほとんどない
- SQL で対応可能なデータ加工ニーズがほとんどだった点
- 取り扱うデータが SQL で十分加工可能なものがほとんどだったため、BigQuery 上で処理が可能で、シンプルにデータ変換プロセスを構築できる
導入の成果
- データ収集・加工・集計の効率化
- BigQuery にデータを集約し、dbt を用いてデータ加工プロセスを構築したことにより、データの蓄積・加工・集計作業が自動化され、データ活用までのリードタイム削減に繋がった
- データ活用プロセス・ロジックの集約による属人性の解消
- Google Sheets などに散っていたデータ分析上のロジックが BigQuery 上に集約されることで、属人かされていたロジックの共有が進んだ
- データ種類の増加
- DWH の活用が進んだことにより、蓄積されるデータ種類も増え、横断的な分析が可能になった
導入時の苦労・悩み
- Application との連携における、データソースの DB のスキーマ変更の影響
Application の DB との連携では、DB のスキーマ変更の影響により、データ連携プロセスが停止してしまうリスクがある。 この影響を最小限とするため、Data Contract の考え方を参考にし、DWH と Application の間で連携用のインターフェースを定めた。 また、Data as a Product の考え方を参考に、プロダクトの文脈と中央 DWH の間で責任範囲を分けることで、Application DB の変更を素早く取り入れられるようにした。
導入に向けた社内への説明
上長・チームへの説明
- 運用負荷の少なさ
- 少数のチームで長期的に持続可能な運用体制を確立するため、BigQuery のフルマネージド特性が不可欠であること。インフラの管理にかかる工数を削減し、本質的なデータ分析・活用に集中できる点
- ビジネス価値の早期提供
- シンプルで迅速に分析基盤を立ち上げることができ、スピーディーな意思決定や事業成長に直結する点
- 費用対効果
- 運用負荷軽減による人件費や管理コストの削減に加え、毎月の無料枠や従量課金制により、初期コストの最小化が可能だった
活用方法
BigQuery 上で計算された値を GoogleSheets や Looker Studio に接続し、部門ごとに必要なデータを可視化している
よく使う機能
- BigQuery Console 上での SQL 実行
- External Query を利用した CloudSQL との連携
- External Table や BigLake Table による GCS や GoogleSheets との連携
- Connected Sheets や Looker Studio などの BI ツールとの連携
ツールの良い点
- 低価格からの導入が可能な点
- フルマネージドかつサーバレス特性による運用負荷の低さ
- データ量の増加を気にする必要がないほどの卓越したスケーラビリティ
ツールの課題点
- データの実態を持たない View の利用状況の把握が難しいこと
今後の展望
- Universal Catalog 利用によるデータ利活用の推進
- BigQuery Pipeline や Data Canvas、各種 Agent の活用
- データ基盤の Agent 化
株式会社Belong / tomoyukik
メンバー / データエンジニア / 従業員規模: 51名〜100名
よく見られているレビュー
株式会社Belong / tomoyukik
メンバー / データエンジニア / 従業員規模: 51名〜100名
レビューしているツール
目次
- アーキテクチャ
- 導入の背景・解決したかった問題
- 活用方法