Findy Tools
開発ツールのレビューサイト
目次
Xのツイートボタン
このエントリーをはてなブックマークに追加
Xのツイートボタン
このエントリーをはてなブックマークに追加
全社レベルで経営指標を可視化 - ユーザベースのSnowflake導入・データ基盤統合とその後
公開日 更新日

全社レベルで経営指標を可視化 - ユーザベースのSnowflake導入・データ基盤統合とその後

複数事業のデータをまとめて活用すると、一気にビジネスを加速させる大きなチャンスに。データ基盤の再構築やデータカルチャーの醸成に関する興味は日々高まっています。その一方で、データが事業ごとにサイロ化していて一元管理が難しい、データガバナンスやセキュリティ基準の統一が難しいといった課題を抱える企業は少なくありません。

そこでFindy Toolsではユーザベース社でデータ分析基盤の導入を推進した張替さんと、現在データ分析基盤の責任者を務める高山さんに取材を実施しました

本記事では、同社のデータ基盤リアーキテクチャにおける技術選定の背景やポイント、そしてカルチャー醸成のための具体的な取り組みを紹介します。複数事業を横断するデータ活用やデータ基盤の整備を検討している方は、ぜひご一読ください。




◆プロフィール
張替 誠司(写真 右)
上席執行役員 オペレーション統括
東京大学大学院理学系研究科およびテキサス大学経営学修士課程(MBA)修了。三菱UFJモルガン・スタンレー証券に入社し、クオンツ業務、内部統制統括業務、およびM&Aアドバイザリー業務に従事。2019年にユーザベースに参画。FORCAS事業コーポレート業務に従事した後、B2B SaaS事業コーポレート担当執行役員、執行役員COOを経て、2025年1月から現職。

高山 温(写真 左)
Data Enablement Team リーダー / UB Research 所長 / NewsPicks エンジニアリングマネージャー
イギリス・カナダで物理を学び、イリノイ大学でコンピュータサイエンス修士を取得。2012年にピクシブ株式会社に入社し、福岡オフィスの立ち上げやCTOを歴任。2020年からNewsPicksにおいて執行役員CTOとして入社し、主に開発生産性、セキュリティ、データ基盤、機械学習分野、テックブランディングを担当。その後NewsPicksでVP of Data Engineering、ユーザベースグループでUB Research研究所を所長として立ち上げ、全社横断データ基盤の開発責任者を担当。


ユーザベースが取り組む「データカルチャーの推進」

高山 ユーザベースでは、経済情報の力で、誰もがビジネスを楽しめる世界の実現を目指しています。代表的なサービスに、企業・業界情報を包括的に提供する「スピーダ」や、国内最大級のソーシャル経済メディア「NewsPicks」があります。

スピーダはもともとSPEEDA、FORCAS、INITIALとブランドや事業部が分かれており、それぞれ独自の成長を遂げてきました。しかし、顧客のニーズに迅速に応えるためには横断的なデータ活用が欠かせないと考え、営業組織やブランドを統合する方針にシフト。そうした組織改編と同時に、全社的なデータ基盤の見直しが大きな課題となっています。

張替 横断的なデータ活用を推進するには、まず社内で「データを見て行動する」カルチャーを根づかせることが重要です。もし最初からデータ分析基盤を構築して複数の事業を横串で分析しようとした場合、事業ごとに別々に管理されていたデータを集約し、共通の基盤で扱えるようにしなければなりません。それだとカルチャーの浸透までに非常に時間がかかっていたでしょう。

そこで最初の一手として、データを「見える化」するTableauを導入し、エンジニア以外のメンバーにも気軽にGoogle SheetやSalesforceやCSVデータを分析できる仕組みを整えました。Snowflakeの導入はそれと並行して進めて、個別データ分析ニーズを一つひとつ実現する形で発展させてきました。

さらに、データを扱う社員のロールモデルを設定し、SQL研修や勉強会を実施しています。メンバーのリテラシーを底上げすると同時に、誰もが気軽にデータにアクセスできる基盤を整えるのが目標です。


2023年以前のデータ基盤アーキテクチャが抱えていた課題

張替 2023年以前のユーザベースでは、事業部ごとにデータ基盤が分断されていました。



NewsPicks事業はこの点では最も進んでおり、長年にわたりAmazon Redshiftを中心とする環境を構築し、大量の行動ログや顧客情報を蓄積していました。一方、スピーダ事業ではごく一部のデータについてBigQueryを利用していましたが、あらゆるデータを格納するデータ分析基盤のようなものはありませんでした。

さらにコーポレート部門では、スプレッドシートやExcelなどの表計算ソフトを使い、事業部ごとに異なるシステムからダウンロードしたCSVを手作業で突合する運用を続けていました。

このような状況が生じた背景としては、従来はプロダクトごとに独立した開発体制を敷いており、全社横断のデータ管理に取り組む機会が限られていたことが挙げられます。
データカルチャーを推進するうえでまず問題になっていたのは、事業部間の連携不足によって、同じ取引先が複数のデータベースに重複登録されるなどデータの不一致が頻発していた点です。事業を横断して分析を行おうとしても、共通のマスタが存在しないまま別々の基盤にデータを格納していたため、指標をそろえるだけでも修正に時間がかかっていました。

また、経営上重要なMRR(月次経常収益)を算出する際は、複数事業のデータを担当者がスプレッドシートで集計・加工するしか方法がなく、属人的な運用に頼りがちな状況が続いていました。加えて、組織改編や人事異動のタイミングで分析手順が引き継ぎにくく、同じ調査を一からやり直す非効率も目立ちました。

セキュリティ面では、表計算ソフトを使って個別にデータを管理・共有しやすい風土が残っており、誰がどの情報にアクセスしているのかを管理しにくいリスクがありました。経営としても、「全社的に統合されたデータ基盤があれば、ガバナンスが強化できるうえに、確認作業に要する時間も大幅に削減できる」という意見が強まっていたため、早期に対策を講じる必要性が高まっていたのです。



張替 誠司さん

Snowflakeを中核に据えた新データ基盤アーキテクチャの全体像

張替 複数事業に分散していたデータ基盤を全社的に統合するうえで、ユーザベースが採用したのは、Snowflake を中心とする構成です。


2025年2月時点のデータ基盤アーキテクチャ図

まず、Fivetranを活用してSalesforceや社内で使われている他の業務システムなどからデータを取得し、Snowflakeに集約します。ここで蓄積されたデータに対する変換やテスト、モデル化のパイプラインを担うのがdbtです。SQLベースで変換処理を管理できるため、非エンジニアのメンバーでも扱いやすい点が特徴で、コミットごとにテストを走らせるなど品質管理がしやすい仕組みを備えています。

可視化と分析をするためのBIツールには、前述のように全社でTableauを導入しました。ダッシュボードを通じて、事業やコーポレートのメンバーが同じ指標を参照できるようになり、特別なスキルがなくてもデータを使った意思決定が進めやすくなっています。

さらに、Snowflake上のアクセス制御をシンプルに管理するため、Oktaとの連携も行いました。組織情報をもとに Snowflakeのロールや権限を割り当てる仕組みをつくることで、入社・異動などに合わせた権限調整をスムーズに行えるようにしています。



データガバナンスのアーキテクチャ図

全社横断のデータ基盤を短期で立ち上げるための技術選定

張替 ここからは、新アーキテクチャにおける技術選定の背景や狙いについて解説します。

Tableauの先行導入

前述のように、データカルチャーを作るうえでBIツールは必須だと考えてSnowflakeよりも先にTableauを導入しました。社内ではSQLが使える人向けのMetabaseというOSSの導入事例もありましたが、Tableauの全社活用を進めて、高度なライセンス管理や契約の一元化によってコストも抑えられると考えました。初期に社内のニーズをヒアリングしてデータ分析基盤のチームで作成したTableauダッシュボードを、後になって利用者が自分で拡張してくれるところなどはGUIの使いやすさのおかげだと思います。

また、Tableau PrepというGUIツールで簡易的なデータの変換を構築するための支援もチームでおこなっています。このような点においても、エンジニア以外も含めたデータカルチャー作りに適したツール選定だと思っています。

Snowflake

データウェアハウスの選定にあたり、BigQuery、Redshift、Snowflakeの比較検証を実施しました。実のところ、当初からデータウェアハウスをデータ分析の用途のみに限定して使っていくつもりではなく、行単位での参照も念頭に置いていました。検証の結果、Snowflakeは列指向だけでなく行指向の処理でも優れたパフォーマンスを発揮したため、大きな優位性がありました。

さらに、タイムトラベル機能など、後発ながら機能拡充のスピードが速いのも特長でした。運用のしやすさとコストパフォーマンスのバランスも考慮した結果、長期的な活用を見据えてSnowflakeの採用を決定しました。

Fivetran

複数のSaaSや業務システムからSnowflakeにデータを取り込むためにFivetranを導入しました。もともと社内のエンジニアだけでETLを構築する余裕がなく、短期間で立ち上げることが優先だったため、ノーコードに近い形で連携を設定できる点は大きな魅力でした。

Troccoなどの国内製品も検討しましたが、Fivetranは海外のSaaS製品との連携実績が豊富で、最初期段階で必要なデータをすぐに利用できることが決め手になりました。導入支援のパートナーと組み合わせることで、よりスムーズに初期セットアップを行いやすかったという背景もあります。

dbt

Snowflakeにデータを集めたあと、そのデータを変換して使いやすくするためのdbtという定番ツールがありますが、ユーザベースではそのマネージドサービスであるdbt Cloudを採用しています。これについてはこだわりを持って選択したというよりは、データ基盤を立ち上げて業務要件を実現する上では、Snowflake×Fivetran×dbtという定番の組み合わせと、そこに知見があるパートナー企業に支援してもらうことが最適解だったのです。

結果的に、dbt Cloudにはとても満足しています。コミット単位でテストを回したり、データの品質保証の仕組みがあり、GUIが充実しているので少しのリテラシーがあれば開発に参加できます。これにより、dbtのプロジェクト構成などはパートナーに設計してもらい、データ変換は業務に詳しい社内のメンバーがおこなうような分担が無理なく実現できました。

その他、データガバナンス系のツール(Alation や Immuta など)も価格や機能面で大がかりになるため、今回は導入を見送り。必要最小限の機能を自社開発で補う方針をとっています。



高山 温さん

統合後はデータの横断分析が可能に。ガバナンスの強化も

張替 データを統合してから、短期間で4つほどの大きな変化を生み出すことができました。

まず1つ目は、経営指標として重要なMRR(月次経常収益)などの指標の把握が全社レベルで容易になったことです。
これまでは各事業で基盤が分かれていたため、それぞれから集計された数値を取締役会に持ち込むぐらいしかできなかったんです。でも今は、Salesforceなどの取引先データをまとめてSnowflakeに集約しているので、取引先ごとに「スピーダでの売上はいくら、NewsPicksでの売上はいくら」といった数字を一元的に計算できます。今では例えば全社連結ベースのARPU(平均売上単価)を出したいとCFOがいえばいえばすぐに出せるようになったのは大きな進歩ですね。

2つ目は、アクセスログや経費情報など、複数のデータを横断的に紐づけられるようになったことです。どの取引先がどんな行動をしているか、どのくらい利用しているかをリアルタイムで見やすくなりました。解約リスクが高まっている顧客を早めに発見して対策するなど、CS チームが積極的に活用しています。営業組織も同じデータを共有できるので、大企業向けのアプローチにも役立っています。

3つ目が、HR系のデータ活用です。勤怠や人事システムなど複数のソースを Snowflake へ集約して、「HRスコア」と呼んでいる指標を可視化しています。最近は人的資本経営の開示指標が増えてきています。離職率や勤怠情報を横断的に見られるようになったおかげで、組織改善に向けた施策も打ちやすくなりました。

最後の4つ目は、システム統合によるデータの物理統合ではなく、データ連携・共有によるデータの論理統合が可能になったことで、組織や営業を柔軟に動かせるようになったこと。実際、まだ各事業でMarketoやSalesforceなどの管理システムがバラバラに存在するケースはあるんですが、SnowflakeとTableauならデータを横串で先に見られる状態を作れます。システムの完全な一本化には数年かかるとしても、それまで業務効率を落とさずに営業組織を再編できるので、経営面から見ても大きなメリットがあると思っています。


複数事業がデータ基盤でつながり、シナジーが生まれる未来へ

高山 ここ半年ほどでSnowflakeのデータガバナンスの仕組みを急速に整えてきました。それまでも必要に応じた権限付与で対応していましたが、ある人に必要以上に広い権限を与えてしまっていたり、またあるデータが社内の広い範囲に見えるようになっていたということがありました。今では組織図上の役割に応じて、自動的に必要十分なデータにアクセス権が付いているという状態になっています。

具体的には、先ほど張替が挙げたHRデータ活用のために、会社の人事マスターデータであるHRMOS COREのデータをSnowflakeに定期的に取り込んでいます。それを使って部署の増減や人事異動に合わせて自動的に「部署ロール」というものを作って、ユーザーと「部署ロール」の割り当てを作成。また、データの種類ごとに、どの部署の人なら見ても良いかという対応表をデータ分析基盤のチームで責任を持ってメンテナンスしています。まだまだ改良の余地はありますが、今の仕組みを拡張していけばデータガバナンスは十分良い物になるでしょう。

次の大きな目標は、データのセルフサービス化の強化です。今はまだデータの中身についての質問が特定の人に集中する状況ですが、そのサポートが追いついていません。利用者が自分で調べられる、あるいはAIに質問できるように整えていきたいです。

また、これまでは「データ分析基盤」として発展させてきましたが、今後は「データ基盤」として多くのニーズを叶えていきたいです。社内のさまざまなデータに同じインターフェイスでアクセスできる便利なデータベースになったわけですから、分析だけに留めておくのはもったいない。データの状態に応じて社内のリマインドを自動化するとか、日々の業務の一部として使う基盤を目指しています。ちょうど、Snowflakeに入っているデータを使ってSlack通知を作りたいなどのニーズが社内から多く挙がり始めています。当初から分析などの列指向のアクセスだけでなく行指向のアクセスも想定してSnowflakeを選定したメリットが今後活きてくると思います。

いわば会社の心臓部としてSnowflakeを中心に置き、どんな仕事でもデータを通じて素早くできるような未来を目指しています。


撮影はユーザベース社 丸の内オフィスにて行いました


取材・編集:Findy Tools編集部
執筆:河原崎 亜矢
撮影:山辺 恵美子

関連した特集記事

関連ツール