朝日新聞デジタルのデータアーキテクチャ
アーキテクチャの工夫ポイント
これまでは、朝日新聞デジタル(朝デジ)のサービス開発・運用において、データを収集する基盤が存在せず業務ごとに Adobe Analytics や AWS QuickSight、 内製のツールなど様々なBIツールが乱立している状態でした。そこで、複数のシステムのデータソースを統合的に可視化・分析を可能にするために、分析基盤の構築に着手しました。
まず、データを集積・加工するETLとしては以下の点で TROCCO を選択しました。
1. データエンジニアが不足しているため、データアナリストでもデータソース連携やワークフローの構築が容易であること
2. 既存および今後増加する可能性のある多様なデータソースに対応していること
データウェアハウスとしては、データエンジニアのリソースが限られていることを考慮し、インフラ管理の負荷が少なくスケーラビリティが高い Google Cloud BigQuery を選択しました。
BIツールとしては、ダッシュボードの階層管理の要件や社内セキュリティ要件などを満たしていた Tableau を選択しました。ただし、アカウントコストなどを考慮して一部のダッシュボードについては LookerStudio を併用しています。
現在の課題と今後の改善予定
BigQuery に蓄積されたデータは、朝デジの様々な分析やサービス提供にも活用されています。
ただし、現状では TROCCO のワークフローをスケジュールで実行しているため、加工後のデータが利用可能になるまでにタイムラグがあります。すべてのデータをリアルタイムで同期する必要はありませんが、たとえば、パーソナライズされたオンボーディング施策を、契約直後にリアルタイムに実施していくために、リアルタイムでデータを同期する仕組みを整えたいと考えています。
また、分析やダッシュボードの用途においてBigQueryを最大限に利用しています。今後は複雑なビジネスロジックの組み込みも視野に入れ、データ基盤がどこまでの責務を持つべきかを含めて設計を検討していきます。
◆執筆:朝デジ事業センター開発部 前田隼輔 @duck8823
【サービス公式サイト】
https://www.asahi.com/
アーキテクチャを構成するツール
会社情報
株式会社 朝日新聞社
従業員規模 1,001〜5,000名
エンジニア組織規模 51名〜100名
朝日新聞社は1879年に創刊し、国内外に約200カ所の取材拠点を構える新聞社。「つながれば、見えてくる。」というパーパスのもと、新聞・デジタルメディアによるコンテンツ事業、展覧会などのイベント事業、不動産事業などを展開している。