ビッグデータアプリケーションやペタバイトスケールのデータ分析を、オンプレミス型ソリューションの半分以下のコストで高速に実行できます。
カスタマイズされた Amazon EC2 クラスター、Amazon EKS、AWS Outposts、または Amazon EMR Serverless で実行するオプションを備えた、最新のオープンソースフレームワークを使用してアプリケーションを構築します。
パフォーマンスが最適化されたオープンソースの API 互換バージョンで Spark、Hive、および Presto を使用して、インサイトを導き出すまでかかる時間を最大 2 倍高速化します。
EMR Notebooks と EMR Studio の使い慣れたオープンソースツールを使用して、アプリケーションを簡単に開発、視覚化、およびデバッグします。
仕組み
Amazon EMR とは、Apache Spark、Apache Hive、Presto などのオープンソースフレームワークを使用して、ペタバイトスケールのデータ処理、相互分析、機械学習を行なう業界をリードするクラウドビッグデータソリューションです。
ユースケース
ビッグデータ分析を実行する
統計アルゴリズムと予測モデルを使用して大規模なデータ処理と what-if 分析を実行し、隠されたパターン、相関関係、市場動向、および顧客の好みを明確にします。
スケーラブルなデータパイプラインの構築
さまざまなソースからデータを抽出し、大規模に処理して、アプリケーションとユーザーが利用できるようにします。
リアルタイムデータストリームの処理
ストリーミングデータソースされるイベントをリアルタイムで分析する、高い可用性、耐障害性を備えた長時間の実行に対応するストリーミングデータパイプラインを構築できます。
データサイエンスと機械学習の採用を加速する
Apache Spark MLlib、TensorFlow、Apache MXNet などのオープンソースの機械学習フレームワークを使用してデータを分析します。Amazon SageMaker Studio に接続して、大規模なモデルトレーニング、分析、およびレポートを作成します。
開始方法
Amazon EMR の料金について
Amazon EC2、Amazon EKS、AWS Outposts、または Amazon EMR Serverless で EMR クラスターを実行するオプションを使用して 1 秒単位の料金をお支払いいただきます。