Big Data Quality SDKがコンピュータ上にインストールされていることを確認します。
-
必要に応じて、次の方法のいずれかを使用して、SDK を使用するための Java プロジェクトを作成します。
-
必要なデータ品質操作を実行するための、特定の Java プロジェクトを作成する。
この方法では、実行するデータ品質ジョブごとに、個別の Java プロジェクトを作成する必要があります。
-
必要なあらゆるデータ品質操作を実行するための共通の Java プロジェクトを、対応する実行時引数を使用して作成する。
この方法では、必要なデータ品質操作に対応する実行時引数を受け入れる Java プロジェクトを、1 つのみ作成する必要があります。
-
SDK を使用するプロジェクトにBig Data Quality SDKモジュール固有の JAR ファイルをインポートします。モジュール固有の JAR ファイルの一覧については、SDK Java API のコンポーネントを参照してください。
-
必要な Hadoop JAR ファイルをプロジェクトにインポートします。
-
必要なデータ品質ジョブを実行するためのアプリケーションを、適切な設定を用いて作成します。
-
Maven や Ant など、任意のビルド ツールを使用してプロジェクトを構築します。
これにより、プロジェクトの JAR ファイルが作成されます。
例えば、MatchKeyGeneratorClient-with-dependencies.jar
が作成されます。
-
プロジェクトの JAR ファイルを Hadoop プラットフォームに配置します。
-
Hadoop プラットフォーム上で、コマンド プロンプトを使用して、JAR ファイルを置いた場所のパスにディレクトリを移動します。
-
次のコマンドを使用して、プロジェクトの JAR を実行します。
hadoop jar <name of the JAR of your client project> <fully qualified name of the main class>
例:
hadoop jar MatchKeyGeneratorClient-with-dependencies.jar com.company.bdq.amm.mr.MatchKeyGeneratorJob
Hadoop プラットフォーム上で必要なジョブが作成され、実行されました。 Java アプリケーションは、Hadoop プラットフォーム上の指定されたパスからの入力データにアクセスし、Hadoop プラットフォーム上にジョブを作成して実行します。ジョブの出力は、Hadoop プラットフォーム上の指定された出力パスのファイルに書き出されます。