glue-engines","metadata":{}},{"id":"GLOBAL#pattern#overview","name":"Overview","namespaceId":"GLOBAL#pattern","description":"Overview","metadata":{}},{"id":"GLOBAL#product#glue","name":"AWS Glue","namespaceId":"GLOBAL#product","description":"AWS Glue","metadata":{}}]}}]},"metadata":{"auth":{},"pagination":{"empty":false,"present":true},"testAttributes":{}},"context":{"page":{"locale":null,"site":null,"pageUrl":"https://aws.amazon.com/jp/glue/engines/","targetName":null,"pageSlotId":null,"organizationId":null,"availableLocales":null},"environment":{"stage":"prod","region":"us-east-1"},"sdkVersion":"1.0.117"},"refMap":{"manifest.js":"0a0328ab4e","rt-hero.rtl.css":"425afa641b","rt-hero.js":"b65ef31b71","rt-hero.css.js":"87555f3c0e","rt-hero.css":"f1599f0bed","rt-hero.rtl.css.js":"73a1a6d9d1"},"settings":{"templateMappings":{"hasSubnav":"hasSubnav","heading":"headline","subheading":"subheading","button1CTA":"heroCtaOne","button1URL":"heroCtaOneUrl","button2CTA":"heroCtaTwo","button2URL":"heroCtaTwoUrl","breadcrumbs":"breadcrumbs","freeTierContent":"freeTierContent","freeTierURL":"freeTierURL","dark":"dark"}}}
AWS Glue は、ユーザーとワークロードをサポートするために複数のデータ統合エンジンを提供するサーバーレスデータ統合サービスです。AWS Glue では、ワークロードの特性、およびデベロッパーとアナリストの希望に基づいて、あらゆるワークロードに適切なエンジンを使用できます。
主な特徴
AWS Glue for Apache Spark
AWS Glue は、データ統合、および抽出、変換、ロード (ETL) ジョブに対して Apache Spark を実行するために、パフォーマンスが最適化されたサーバーレスインフラストラクチャを提供します。AWS Glue for Apache Spark は、バッチおよびストリーム処理をサポートし、データインジェスト、処理、および統合を加速化します。そうすることで、データレイクとデータウェアハウスの作成と更新を行って、データからより迅速に洞察を引き出せるようになります。
AWS Glue for Ray
AWS Glue for Ray では、データエンジニアとデベロッパーが Python と一般的な Python ライブラリを使用して大規模なデータセットを処理することができます。AWS Glue は、Python ワークロードをスケールするために使用されるオープンソースの統合コンピューティングフレームワーク、Ray (Ray.io) を使用します。AWS Glue for Ray には一般的な Python データ処理ライブラリが含まれているため、独自のライブラリを使用してデータ統合ジョブをカスタマイズできます。
AWS Glue for Python Shell
AWS Glue for Python Shell では、AWS Glue で Python スクリプトを実行するために Python Shell ジョブを使用することができます。これらのジョブを使用することで、複雑なデータ統合や分析ジョブを Python で作成できます。AWS Glue for Python Shell のジョブは、Pandas、NumPy、および Amazon SageMaker Data Wrangler など、設定なしで使用できる一般的な分析ライブラリを提供します。ユーザーは、バンドルされた機能を使用して、さまざまなデータベース、データウェアハウス、および AWS サービスに接続することができます。