データレイクのツール - 製品一覧から機能の違いや活用事例を紹介
データレイクの活用事例

機械学習、ストリーミング、アドホック分析のためのシンプルでオープン、セキュアなデータレイクプラットフォーム。クラウドデータレイクコストを50%以上削減しつつ、エンドツーエンドサービスを提供。

オンプレミスとクラウド間でデータ、アプリケーション、ユーザーを双方向に移動できる、業界唯一の真のハイブリッドデータ、分析、AIプラットフォーム。

非構造化データを保存するためのマネージドオブジェクトストレージサービス。あらゆる量のデータを保存し、好きな頻度で取得可能。

TrinoとApache Icebergに基づくデータレイクハウスアーキテクチャ上に構築された、アプリとAIのためのデータプラットフォーム。全てのデータへの統一アクセスを提供し、AI開発を加速。

AIと分析を加速するデータレイクハウスプラットフォーム。ETL不要でデータソースを統合し、高品質なデータセット作成を簡素化。自律的なパフォーマンス最適化でAIを加速する。

データベース機能をデータレイクにもたらす、高性能なオープンテーブルフォーマットに基づいたオープンデータレイクハウスプラットフォーム。低レイテンシ分析のためのインクリメンタル処理を提供。

大規模な分析データセット向けの高性能なオープンテーブルフォーマット。SQLテーブルの信頼性とシンプルさをビッグデータにもたらし、複数エンジンでの安全な同時利用を可能にする。

Lakehouseアーキテクチャ構築を可能にするオープンソースのストレージフレームワーク。Spark等多くのエンジンと互換性があり、UniFormでIceberg/Hudiからも読取可能。

大規模データセットの分散処理を可能にするオープンソースフレームワーク。単一サーバーから数千台のマシンにスケールアップ可能で、高い可用性を持つ。

データプラットフォーム全体で、データやAI関連の成果物を一箇所で検出、管理し、監視し、制御できるようにします。これにより、信頼性のあるデータへのアクセスが可能になり、大規模な分析やAIの活用が促進されます。

AWS OutpostsラックにAmazon S3のオブジェクトストレージ機能を提供するサービス。ローカルデータ処理やデータレジデンシー要件に対応。

Amazon S3の正式名称。あらゆる種類のデータをインターネット経由で保存・取得できるオブジェクトストレージサービス。高いスケーラビリティ、データ可用性、セキュリティ、パフォーマンスを提供。

安全なデータレイクを数日で簡単にセットアップできるフルマネージドサービス。S3上のデータの収集、カタログ化、クレンジング、変換、保護を一元管理。

(S3 Glacier) データアーカイブと長期バックアップのための、安全で耐久性があり、非常に低コストなAmazon S3ストレージクラス。

(Simple Storage Service) あらゆる量のデータを保存・取得できる、業界をリードするスケーラビリティ、データ可用性、セキュリティ、パフォーマンスを提供するオブジェクトストレージサービス。

ペタバイト規模のデータが存在する場所で簡単かつ柔軟に分析できるサーバーレスクエリサービス。標準SQLを使用してAmazon S3内のデータを直接分析できます。

ヘルスケアプロバイダー、製薬会社、研究機関などが、ペタバイト規模の医療データを安全に保存、変換、クエリ、分析できるHIPAA適格サービス。

金融サービス業界(FSI)の顧客が、大量のデータを容易に保存、カタログ化、分析準備できるデータ管理および分析サービス。

認定されたサードパーティプロバイダーのデータ(金融、ヘルスケア、小売など)をAWS上で簡単に検索、購読、利用できるサービス。
Databricks のデータインテリジェンスプラットフォームは、組織全体でのデータと AI の活用を促進させます。
レイクハウスを基盤とするプラットフォームが、あらゆるデータとガバナンス要件をサポートするオープンな統合環境を提供。インテリジェンスエンジンが、ビジネスの特性に即したデータ処理を可能にします。
従来の方法では分断されていた分析、データサイエンス、機械学習を統合することで、データのサイロ化を解消し、最新のデータスタックをシンプルにします。
また、オープンソース、オープンスタンダードが基盤となっており、最大限の柔軟性を提供します。
更に、一貫したデータ管理、セキュリティ、ガバナンスが、業務の効率化と革新を支援します。