Java アプリケーションの作成

Big Data Quality SDKがコンピュータ上にインストールされていることを確認します。

SDK を使用するには

  1. 必要に応じて、次の方法のいずれかを使用して、SDK を使用するための Java プロジェクトを作成します。
    1. 必要なデータ品質操作を実行するための、特定の Java プロジェクトを作成する。
      この方法では、実行するデータ品質ジョブごとに、個別の Java プロジェクトを作成する必要があります。
    2. 必要なあらゆるデータ品質操作を実行するための共通の Java プロジェクトを、対応する実行時引数を使用して作成する。
      この方法では、必要なデータ品質操作に対応する実行時引数を受け入れる Java プロジェクトを、1 つのみ作成する必要があります。
  2. SDK を使用するプロジェクトにBig Data Quality SDKモジュール固有の JAR ファイルをインポートします。モジュール固有の JAR ファイルの一覧については、SDK Java API のコンポーネントを参照してください。
  3. 必要な Hadoop JAR ファイルをプロジェクトにインポートします。
  4. 必要なデータ品質ジョブを実行するためのアプリケーションを、適切な設定を用いて作成します。
  5. Maven や Ant など、任意のビルド ツールを使用してプロジェクトを構築します。
    これにより、プロジェクトの JAR ファイルが作成されます。

    例えば、MatchKeyGeneratorClient-with-dependencies.jarが作成されます。

  6. プロジェクトの JAR ファイルを Hadoop プラットフォームに配置します。
  7. Hadoop プラットフォーム上で、コマンド プロンプトを使用して、JAR ファイルを置いた場所のパスにディレクトリを移動します。
  8. 次のコマンドを使用して、プロジェクトの JAR を実行します。
    hadoop jar <name of the JAR of your client project> <fully qualified name of the main class>
    例:
    hadoop jar MatchKeyGeneratorClient-with-dependencies.jar com.company.bdq.amm.mr.MatchKeyGeneratorJob
Hadoop プラットフォーム上で必要なジョブが作成され、実行されました。

Java アプリケーションは、Hadoop プラットフォーム上の指定されたパスからの入力データにアクセスし、Hadoop プラットフォーム上にジョブを作成して実行します。ジョブの出力は、Hadoop プラットフォーム上の指定された出力パスのファイルに書き出されます。