Amazon EMR

Apache Spark、Hive、Presto、その他のビッグデータワークロードを簡単に実行してスケールする

ビッグデータアプリケーションやペタバイトスケールのデータ分析を、オンプレミス型ソリューションの半分以下のコストで高速に実行できます。

カスタマイズされた Amazon EC2 クラスター、Amazon EKSAWS Outposts、または Amazon EMR Serverless で実行するオプションを備えた、最新のオープンソースフレームワークを使用してアプリケーションを構築します。

パフォーマンスが最適化されたオープンソースの API 互換バージョンで Spark、Hive、および Presto を使用して、インサイトを導き出すまでかかる時間を最大 2 倍高速化します。

EMR Notebooks と EMR Studio の使い慣れたオープンソースツールを使用して、アプリケーションを簡単に開発、視覚化、およびデバッグします。

仕組み

Amazon EMR とは、Apache SparkApache HivePresto などのオープンソースフレームワークを使用して、ペタバイトスケールのデータ処理、相互分析、機械学習を行なう業界をリードするクラウドビッグデータソリューションです。

EMR Serverless のご紹介 (2:02)
Amazon EMR Serverless のご紹介
Amazon EMR Serverless は、データエンジニアやアナリストが、Apache Spark、Hive、Presto などのオープンソースのビッグデータフレームワークを使用して構築したアプリケーションを、調整、運用、最適化、セキュリティ確保、クラスター管理をすることなく、簡単かつコスト効率よく実行できる Amazon EMR の新オプションです。
Amazon EMR Serverless のご紹介
Amazon EMR Serverless は、データエンジニアやアナリストが、Apache Spark、Hive、Presto などのオープンソースのビッグデータフレームワークを使用して構築したアプリケーションを、調整、運用、最適化、セキュリティ確保、クラスター管理をすることなく、簡単かつコスト効率よく実行できる Amazon EMR の新オプションです。EMR Serverless は、アプリケーションの必要に応じてコンピューティングおよびメモリリソースをスケールし、アプリケーションで使用されたリソースに対してのみ支払いを行います。

ユースケース

ビッグデータ分析を実行する

統計アルゴリズムと予測モデルを使用して大規模なデータ処理と what-if 分析を実行し、隠されたパターン、相関関係、市場動向、および顧客の好みを明確にします。

スケーラブルなデータパイプラインの構築

さまざまなソースからデータを抽出し、大規模に処理して、アプリケーションとユーザーが利用できるようにします。

リアルタイムデータストリームの処理

ストリーミングデータソースされるイベントをリアルタイムで分析する、高い可用性、耐障害性を備えた長時間の実行に対応するストリーミングデータパイプラインを構築できます。

データサイエンスと機械学習の採用を加速する

Apache Spark MLlib、TensorFlow、Apache MXNet などのオープンソースの機械学習フレームワークを使用してデータを分析します。Amazon SageMaker Studio に接続して、大規模なモデルトレーニング、分析、およびレポートを作成します。

開始方法

Amazon EMR の仕組みを確認する

クラスターのプロビジョニング、リソースのスケーリング、高可用性の設定などの詳細をご覧ください。

Amazon EMR の特徴を探る »

Amazon EMR の料金について

Amazon EC2、Amazon EKS、AWS Outposts、または Amazon EMR Serverless で EMR クラスターを実行するオプションを使用して 1 秒単位の料金をお支払いいただきます。

Amazon EMR の料金の詳細はこちら »

Amazon EMR の使用を開始する

EMR を使ったリアルタイムストリーム処理、大規模機械学習などについてご紹介します。

Amazon EMR のチュートリアルをチェックする »

AWS の詳細を見る