AWS Glueでジョブを作成しhello wroldを行うサンプル
環境
AWS Glue
概要
AWS Glue は、分析を行うユーザーが複数のソースからのデータを簡単に検出、準備、移動、統合できるようにするサーバーレスのデータ統合サービスです。 AWS Glue を使用すれば、70 を超える多様なデータソースを検出して接続し、一元化されたデータカタログでデータを管理できます。 AWSのGlueは、ETL(Extract, Transform, Load)サービスの機能を持っています。 ETLとは、異なるデータソースからデータを抽出して変換し、別のデータストアにロードします。
操作方法
1.ETL jobsを作成する
1).検索入力欄で「Glue」と入力し、表示されたサービス「Glue」をクリックします。
2).左側の「ETL jobs」をクリックします。
3).「Python Shell script editor」にチェックを選択し、右上にある「Create」をクリックします。
4).ジョブ名を入力します。例test-hello
Scriptのタブをクリックし、コードを入力します。
import sys print("hello world")
5).「Job details」タブをクリックします。
6).IAM Roleを選択します。
Pythonのバージョンを選択します。
7).Advanced propertiesをクリックしてファイル名を入力します。
例test-hello.py
8).Saveボタンをクリックします。
9).問題ない場合Runボタンが押せるようになります。
2.ジョブを実行する
1).画面右側のRunボタンをクリックします。
2).「Runs」タブをクリックします。ジョブが成功するとRun statusがSucceededになります。
3).画面右下にある「Output logs」をクリックします。