AWS Glue の利点
仕組み
AWS Glue は、サーバーレスなデータ統合サービスで、分析、機械学習 (ML)、アプリケーション開発用に、複数のソースからデータを検出、準備、移動、統合することをより容易にします。
-
データ統合エンジンオプション
-
イベント駆動型 ETL
-
AWS Glue データカタログ
-
ノーコード ETL ジョブ
-
データ品質の管理とモニタリング
-
データ準備
-
データ統合エンジンオプション
-
AWS Glue でお好みのデータ統合エンジンを選択し、ユーザーとワークロードをサポートします。
-
イベント駆動型 ETL
-
AWS Glue は、新しいデータが到着すると、抽出、変換、ロード (ETL) ジョブを実行できます。例えば、AWS Glue を設定して、Amazon Simple Storage Service (S3) で新しいデータが利用可能になり次第、ETL ジョブの実行を開始できます。
-
AWS Glue データカタログ
-
データを移動させることなく、AWS の複数のデータセットを迅速に検出および検索を行うには、データカタログを使用します。カタログ化されたデータは、すぐに Amazon Athena、Amazon EMR、Amazon Redshift Spectrum を使用した検索やクエリで利用できるようになります。
-
ノーコード ETL ジョブ
-
AWS Glue Studio を使用すると、AWS Glue ETL ジョブを視覚的に作成、実行、モニタリングするのがより簡単になります。ドラッグアンドドロップエディタを使用してデータを移動および変換する ETL ジョブを構築できます。また、AWS Glue は自動的にそのコードを生成します。
-
データ品質の管理とモニタリング
-
AWS Glue Data Quality は、データ品質ルールの作成、管理、モニタリングを自動化し、データレイクやパイプライン全体で高品質なデータを確保できるよう支援します。
-
データ準備
-
AWS Glue DataBrew を使用することで、データレイク、データウェアハウス、および Amazon S3、Amazon Redshift、AWS Lake Formation、Amazon Aurora、Amazon Relational Database Service (RDS) などのデータベースから直接データを探索して実験できます。DataBrew の 250 を超える構築済みトランスフォーメーションから選択して、異常のフィルタリング、フォーマットの標準化、無効な値の修正などのデータ準備タスクを自動化できます。
さらに、AWS Glue Studio にはデータ準備ツールが用意されており、コードを記述することなく、インタラクティブなポイントアンドクリックのビジュアルインターフェイスでデータを準備できます。
ユースケース
データを効率的に検出する
ETL パイプラインの開発を簡素化する
データをインタラクティブに探索、実験、処理する
さまざまな処理フレームワークとワークロードをサポートする
最新情報
AWS Glue の使用を開始する
今日お探しの情報は見つかりましたか?
ぜひご意見をお寄せください。ページのコンテンツ品質の向上のために役立てさせていただきます。