Superset導入事例
株式会社Luup / 河野匠真
メンバー / データエンジニア
ツールの利用規模 | ツールの利用開始時期 |
---|---|
51名〜100名 | 2024年9月 |
ツールの利用規模 | 51名〜100名 |
---|---|
ツールの利用開始時期 | 2024年9月 |
アーキテクチャ
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
BIツールにはRedashを採用しており、データ抽出にSQLが必須になっていました。 Redashは基本、SQLを書いてデータを抽出し、Dashboardを作っていくツールであるため、SQLを書けないメンバーはデータチームもしくはSQLをかけるメンバーに依頼しないといけません。これまではデータチームが依頼ベースで対応することでなんとかなっていましたが、人が増えてくるとそうはいきません。 データチームの工数の多くをデータ抽出にかけてしまうと、データアナリストが本質的に取り組むべき分析やビジネス支援、データエンジニアが本質的に取り組むべきデータパイプライン、データマネジメント、データプロダクト開発等に時間を割けなくなってしまいます。
どのような状態を目指していたか
データ活用の促進が主です。 SQLに依存したデータ抽出、BIツールでの正しいデータがどれかわからない、位置情報データの可視化ができない等、活用側の課題を全て仕組み化で解消することです。
比較検討したサービス
特になし
比較した軸
特に無し
選定理由
コストをかけず現状の課題を解決できることにプラスして、位置情報データを一緒にダッシュボード化できることが決断の決め手です。
導入の成果
改善したかった課題はどれくらい解決されたか
まだ走り始めで、既存のBIからのReplace期間なので、課題が全て解決したわけではないですが、MapVisualizationのDashboard化、SQLが書けないメンバーでもデータ抽出ができるといった環境ができ、今までデータチームに依頼が来ていたデータ抽出も少しづつSupersetを用いてGUIで自分でデータを出してもらえるようになってきています。
導入時の苦労・悩み
他のossのBIツールに比べるとインフラ周りの設定が複雑で癖が強いです。(苦労したまではいかないですが)
導入に向けた社内への説明
上長・チームへの説明
ちょうど社内でMapVisualizationのdashboard化をしたいという話が上がっており、そのタイミングに合わせてSupersetの提案をチームの定例で行いました。 現状のデータ活用周りの課題解決+既存のRedashのインフラ周りの課題諸々導入により解決できることが多く、導入におけるデメリットも特にないことを説明し、承認を得ました。
活用方法
よく使う機能
- データレポートのDashboard、Chartの作成
- sqlを直接書き(sql lab)、datasetの作成
- slackへのreport機能
ツールの良い点
- GUI操作によるデータ抽出
- 可視化表現が豊富
- semantic layer toolと互換性がある
- 高度なMap Visualization表現ができる
- 細かいアクセス管理ができる
- 認証されたデータにCertifiedマークが付けられる
ツールの課題点
- MapVisualizationのdeck.gl Multiple Layersのfilterが機能しない
- H3表現ができない
- 日本語の表現が微妙
ツールを検討されている方へ
特に位置情報データを扱っており、データをCoreにしている事業を行なっている会社様は検討してみるといいかと思います。
今後の展望
RedashからSupersetへ完全Replaceを行いつつ、データのlayer層、modelingの再設計を行い、Supersetがより生きる環境を作っていく予定です。
株式会社Luup / 河野匠真
メンバー / データエンジニア
株式会社Luup / 河野匠真
メンバー / データエンジニア
レビューしているツール
目次
- アーキテクチャ
- 導入の背景・解決したかった問題
- 活用方法