AWS Glue
Khám phá, chuẩn bị và tích hợp tất cả dữ liệu của bạn ở mọi quy môLợi ích của AWS Glue
Cách thức hoạt động
AWS Glue là một dịch vụ tích hợp dữ liệu phi máy chủ, giúp người dùng dễ dàng khám phá, chuẩn bị, di chuyển và tích hợp dữ liệu từ nhiều nguồn cho hoạt động phân tích, máy học (ML) và phát triển ứng dụng.
-
Các tùy chọn về công cụ tích hợp dữ liệu
-
ETL định hướng theo sự kiện
-
Danh mục dữ liệu AWS Glue
-
Tác vụ ETL không cần mã
-
Quản lý và giám sát chất lượng dữ liệu
-
Chuẩn bị dữ liệu
-
Các tùy chọn về công cụ tích hợp dữ liệu
-
Chọn công cụ tích hợp dữ liệu bạn muốn trong AWS Glue để hỗ trợ người dùng và khối lượng công việc.
-
ETL định hướng theo sự kiện
-
AWS Glue có thể chạy các tác vụ trích xuất, chuyển đổi và tải (ETL) của bạn khi có dữ liệu mới. Ví dụ: bạn có thể cấu hình AWS Glue để khởi chạy các tác vụ ETL ngay khi dữ liệu mới xuất hiện trong Dịch vụ lưu trữ đơn giản (S3) của Amazon.
-
Danh mục dữ liệu AWS Glue
-
Bạn có thể sử dụng Danh mục dữ liệu để khám phá nhanh và tìm kiếm nhiều tập dữ liệu AWS mà không phải di chuyển dữ liệu. Một khi đã được lập danh mục, dữ liệu sẽ ngay lập tức có sẵn để tìm kiếm và truy vấn bằng Amazon Athena, Amazon EMR và Amazon Redshift Spectrum.
-
Tác vụ ETL không cần mã
-
AWS Glue Studio giúp bạn dễ dàng tạo, chạy và theo dõi các tác vụ ETL của AWS Glue một cách trực quan. Bạn có thể dùng trình biên tập dạng kéo và thả để xây dựng các tác vụ ETL nhằm di chuyển cũng như chuyển đổi dữ liệu và AWS Glue sẽ tự động tạo mã cho bạn.
-
Quản lý và giám sát chất lượng dữ liệu
-
Chất lượng dữ liệu AWS Glue tự động hóa việc thiết lập quy tắc, quản lý và giám sát chất lượng dữ liệu để giúp đảm bảo dữ liệu có chất lượng cao trên các hồ dữ liệu và quy trình của bạn.
-
Chuẩn bị dữ liệu
-
Với AWS Glue DataBrew, bạn có thể khám phá và thí nghiệm dữ liệu ngay từ chính hồ dữ liệu, kho dữ liệu và cơ sở dữ liệu của mình, bao gồm Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora và Dịch vụ cơ sở dữ liệu quan hệ (RDS) của Amazon. Bạn có thể lựa chọn từ hơn 250 phép chuyển đổi tạo sẵn trong DataBrew để tự động hóa các tác vụ chuẩn bị dữ liệu, chẳng hạn như lọc điểm bất thường, tiêu chuẩn hóa định dạng và sửa đổi các giá trị không hợp lệ.
Ngoài ra, AWS Glue Studio mang lại công cụ chuẩn bị dữ liệu cho phép bạn chuẩn bị dữ liệu với giao diện trực quan, tương tác trỏ và nhấp mà không cần viết mã.
Trường hợp sử dụng
Hỗ trợ nhiều khung xử lý và khối lượng công việc
Tương tác khám phá, thử nghiệm và xử lý dữ liệu
Đơn giản hóa việc phát triển quy trình ETL
Khám phá dữ liệu hiệu quả
Có gì mới
Bắt đầu với AWS Glue
Hôm nay, bạn đã tìm thấy nội dung mình cần chưa?
Chia sẻ với chúng tôi để chúng tôi có thể cải thiện chất lượng nội dung trên trang.