Talend Data Integration でのジョブ作成方法
Talend Open Studio for Data Integration を使って実際にジョブを作成する手順を紹介します。Talend でのジョブは1つの作業単位を表しており、何か1つあるいは複数の処理をひとまとめにしたものです。例えば EXCEL ファイルからデータを読み取り列の順番を入れ替えてデータを昇順でソートし、そのデータをデータベースに登録する、というような一連の作業を1つのジョブとして登録したりします。
[関連記事]
Talend Open Studio for Data Integration でのジョブ作成方法Talend Open Studio for Data Integration で Oracle 接続が失敗あるいは遅い
まずジョブを作成しないことには始まりませんので実際にジョブを作成してみましょう。
最初は何もジョブがありませんが、下図の通り「ジョブ」の上で右クリックして「ジョブの作成」を選んで下さい。
すると次のような画面が表示されますので、ジョブに名前を付けてジョブの目的も設定しましょう。なおジョブの名前の「名」には Talend Open Studio for Data Integration 6.4.1 時点で日本語のジョブ名は使えませんので、英語でジョブ名をつけてあげましょう。ジョブの目的「目的」には日本語が使えます。入力したら「Finish」ボタンを押します。
ジョブを作成し終わると下図の赤丸部分のように「Test」ジョブが作成されているのがわかります。
では実際に簡単なジョブを実際に作ってみましょう。ジョブを作成するには、画面右端にある「Palette」という部分にたくさん並んでいる部品をジョブ画面に貼り付けて(ドラッグ&ドロップ)実現したい処理を作成していくことになります。
ここでは非常にかんたんな「tSystem」という部品を使ってジョブの動作を確認しましょう。
画面右側の「Palette」の「システム」の中に「tSystem」という部品があります(下図の一番右下)ので、これをドラッグ&ドロップで貼り付けてあげます。すると以下の画面のようになります。
次に「tSystem」部品のアイコンをダブルクリックしてみましょう。すると下図のように部品の設定画面が表示されます。「tSystem」部品は最初から "Hello" という文字を表示するようになっています。
"cmd /c echo HELLO" という処理は、Windows のコマンドプロンプトを開いてコマンドを打つ処理を実行してくれるもので、実際に上記コマンドをコマンドプロンプトで実行すると次のようになります。
これを実際に Talend Open Studio for Data Integration の中で実行する、ということになります。
ではこれでジョブを作成できましたので、ジョブを保存します。メニューの「ファイル」の「Save」ボタンを押すか、キーボードショートカットで「CTRL - S (コントロールキーを押しながら S キーを押す)」を押すとジョブが保存されます。この保存処理を行わないとジョブは実行できません。
ジョブの変更を保存したら、次にジョブを実行します。実行するには下記2つの赤丸ボタンのいずれかを押せばジョブの実行が開始されます。それでは実際にどちらかのボタンを押してみましょう。
実行ボタンを押すと下図のようにジョブをビルドし始めます。ビルドというのは貼り付けた部品やその設定を Java ソースコードに変換する処理です。
ジョブのビルド処理が終わると、以下のように結果が表示されます。
実行結果画面には最初にジョブの開始日時と最後に終了日時、そして結果が表示されます。「statistics」という部分はジョブの統計情報を取得するためのポートに接続しているという情報ですので無視して構いません。
これで作成したジョブが無事実行されて「Hello」という結果が表示されましたね。また最後に「終了コード=0」と出力されており、ジョブが正常終了したことが分かります。
以上、簡単なジョブの作成方法を紹介しました。