Datastreamとは?機能や特徴・製品の概要まとめ
Datastreamのプロダクト概要
Datastreamとは
Datastream は、サーバーレスで使いやすい変更データ キャプチャ(CDC)およびレプリケーション サービスです。このサービスを利用することで、データを最小限のレイテンシで確実に同期できます。
Datastream を使用すると、運用データベースから BigQuery にデータをシームレスに複製できます。さらに、Datastream では変更イベント ストリームの Cloud Storage への書き込みがサポートされており、Dataflow テンプレートとの統合を効率化して、Cloud SQL や Spanner などの幅広い宛先にデータを読み込むカスタム ワークフローを構築できます。また、Datastream を使用して Cloud Storage から直接イベント ストリームを利用し、イベント ドリブン アーキテクチャを実現することもできます。Datastream は、Oracle、MySQL、SQL Server、PostgreSQL(AlloyDB for PostgreSQL を含む)の各ソースをサポートしています。
Datastreamの特徴
1. サーバーレス
ストリームを構成すると、データが移動し始めます。インストール、リソースの割り当て、メンテナンス オーバーヘッドは発生しません。データ量は増減するため、Datastream の自動スケーリング機能により、データがニア リアルタイムで自動的に移動し続けるようにリソースが割り当てられます。
2. 統合 Avro ベース型スキーマ
Datastream は、すべてのソース固有のデータ型を Avro 型に基づいて統合。
Datastream 型スキーマに変換することで、ソースに依存しない簡単な処理を実現します。
3. BigQuery の宛先
ソースの変更は、ニア リアルタイムで BigQuery テーブルに継続的に複製されます。BigQuery のデータは、ほぼ即時に分析に利用できます。