ピクシブにおけるBigQueryの活用事例
ピクシブ株式会社 / kashira
メンバー / データエンジニア / 従業員規模: 301名〜500名 / エンジニア組織: 101名〜300名
利用プラン | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|
オンデマンドとEnterprise Edition | 101名〜300名 | 2014年 | B to B B to C C to C |
利用プラン | オンデマンドとEnterprise Edition |
---|---|
ツールの利用規模 | 101名〜300名 |
ツールの利用開始時期 | 2014年 |
事業形態 | B to B B to C C to C |
アーキテクチャ
アーキテクチャの意図・工夫
データ基盤が最大限の価値を発揮するには、全てのデータを一箇所に集約し、様々なデータを掛け合わせることが重要だと考えています。もし新たにデータウェアハウスを採用する場合、既存のデータ基盤からデータをすべて移行するコストが発生すると考えておりますが、現時点では、そのコストを支払う価値がある製品が見つかっていません。
導入の背景・解決したかった問題
導入背景
非公開
導入の成果
BigQueryにアドホックにクエリを実行するユーザーのMAU(月間アクティブユーザー数)は150人に達し、正社員の40%が利用しています。さらに、LookerやLooker Studioなどのツールを介してBigQueryのデータに触れるユーザーを含めると、全社員の65%が何らかの形でBigQueryのデータにアクセスしているという状況です。
導入に向けた社内への説明
上長・チームへの説明
非公開
活用方法
弊社では、従来のデータエンジニアやデータアナリストだけでなく、バックエンド、フロントエンド、インフラなど、幅広い分野のエンジニアがデータ連携、データ加工、LookML作成、そしてダッシュボード作成までを担う、ユニークなデータ活用体制を構築しています。
これは、弊社の抱えるプロダクトの多さとプロダクトあたりの運営人数が理由です。(2025年3月時点で、正社員約370人に対して20プロダクト)
データ分析・データ活用において一番重要なのはビジネスドメインへの理解であり、それ無しには効果的なデータ分析ができないと考えています。ただし、弊社の抱えるプロダクトはイラストコミュニケーションサービス、EC、広告、VRとクリエイターを軸にしたサービス展開ではありますが、ドメインが全く別であるケースが多いです。
これを中央集権的にデータチームで処理するのは不可能だと考えて、データチーム以外が利活用できるための整備を進めています。詳しくはこちらをご覧ください。
チームによって利活用の頻度や、レベルは異なりますが以下のような一般的なケースから
- 施策の効果見積もり
- ABテストの効果検証
- 機械学習モデルの学習
以下のような分析以外のデータ利活用用途でも使われています。
- スパム・不正決済等のモニタリング
- 社内システムのDB
- 財務システム
よく使う機能
- BigQuery Studio (UI画面)
- ストレージ
- クエリエンジン
ツールの良い点
- オンデマンド料金モデルが非常に便利
- BigQueryの専門知識がないユーザーでも、スキャンしたデータ量のみを考慮すれば、裏側のシステムが自動的にリソースを最適化する
- 複雑なクエリ最適化を意識せずに、高速な結果を得られるため、利用者の負担を大幅に軽減できる
- サーバーレス・オートスケール
- Google系の製品との相性の良さ
- スプレッドシートの接続のネイティブサポート
- Looker / Looker Studioの相性が良い
- Google Analyticsのexportサポート
ツールの課題点
- リージョン間のデータ移動が複雑
- オンデマンド課金とEditions課金の違いが大きい
- 導入初期はオンデマンドで運用するが、利用規模が拡大するとスロット(仮想CPU)の制限に引っかかるためEdtitions課金への移行が発生する
- オンデマンドとEditionsでは料金体系も、最適なクエリも大きく違うので移行コストが発生する
ツールを検討されている方へ
他のツール全般でもそうですが、権限設計やストレージの3層構造など、後から変更することが難しい要素については、初期段階でしっかりと設計しておくことを強くお勧めします。これらの設計が不十分な場合、運用開始後に様々な問題が発生し、大きな手戻りや運用コストの増加につながる可能性があります。
とは言うものの、最初から詳細に詰めようとすると何も進まないうえに、手戻りの発生も高くなるので、まずは大枠を決めた上でデータ利活用を重点的に進める、利用パターンが見えてきたタイミングで見直しを行うと上手くいくと考えています。
今後の展望
現在、弊社のデータ基盤には主に二つの課題が存在します。
1. 権限設定の複雑化と管理の甘さが顕著になってきた
組織の成長に伴い、弊社のデータ利用のニーズは多様化しています。設立当初は少数精鋭で始まったため、権限管理が比較的緩やかでしたが、メンバーの増加と利用ケースの拡大に伴い、権限設定の複雑化と管理の甘さが顕著になってきました。この状況を改善するため、現在、私たちは権限管理の見直しと最適化に積極的に取り組んでいます。
2. データが乱雑に蓄積され、必要な情報を見つけるのに時間がかかる
AIによるデータ分析の自動化によって、データ分析の試行回数を増やす事で、豊富なインサイトを得る、意思決定を早めることが今後重要になってくると考えています。 このAIによるデータ分析の自動化には、メタデータ管理とデータ品質が重要です。
例えば、簡単なSQLの作成エージェントを想定すると「今月のMAUを知りたい」とAIに聞いた時に、AIエージェントは
- 該当するテーブルを探索・決定する
- 該当するテーブルのメタデータを見る
- SQLを作成する
というステップを踏むことが想定されます。SQLの作成自体は十分に出来るのですが課題になっているのが、どのテーブルを使うべきか?、このテーブルに関する注意事項は何か?といった部分になります。
今は、このようなメタデータが十分に整備されておらず、自動化への準備が不十分です。
結果として、人間の分析者が見ても他のプロダクトのデータが見づらい・把握しにくいので横断的なデータ分析がやりにくいという課題もあります。
このデータカタログの強化やビジネスメタデータ拡充で、人間が作成する分析とAIが作成する分析の両方で精度の向上と、作成時間の削減を狙っていきたいと考えています。
ピクシブ株式会社 / kashira
メンバー / データエンジニア / 従業員規模: 301名〜500名 / エンジニア組織: 101名〜300名
よく見られているレビュー
ピクシブ株式会社 / kashira
メンバー / データエンジニア / 従業員規模: 301名〜500名 / エンジニア組織: 101名〜300名
レビューしているツール
目次
- アーキテクチャ
- 導入の背景・解決したかった問題
- 活用方法