Validate Address MapReduce ジョブの使用

注: 最初の Validate Address ジョブを作成および実行する前に、Acushare サービスが実行されていることを確認します。手順については、Acushare サービスの実行を参照してください。
  1. UAMAddressingFactory のインスタンスを、その静的メソッド getInstance() を使用して作成します。
  2. ProcessType を指定する UAMAddressingDetail のインスタンスを作成して、Validate Address ジョブの入力と出力の詳細を指定します。このインスタンスは、MRProcessType タイプを使用する必要があります。これを行うには、次の手順に従います。
    1. このジョブの入力設定を行うには、UniversalAddressValidateInputConfiguration のインスタンスを作成します。
      列挙体 列挙 PreferredCity列挙 CasingType列挙 CityNameFormat列挙 OutputCountryFormat列挙 StandardAddressFormat列挙 StandardAddressPMBLine列挙 StreetMatchingStrictness列挙 FirmMatchingStrictness列挙 DirectionalMatchingStrictness列挙 DualAddressLogic と該当する場合は 列挙 DPVSuccessStatusCondition を使用して、さまざまな必須フィールドの値を設定します。
      重要: Validate Address を CASS 認定™モードで実行するには、このインスタンスのフィールド outputReport3553outputCASSDetail、および outputReportSummarytrue に設定します。CASS レポートにはジョブを CASS 認定™ モードで実行した場合にのみ有効なコンテンツが含められます。それ以外の場合は、空白のレポート PDF が生成されます。
    2. ReferenceDataPath のインスタンスを作成することによって、リファレンス データ パスの詳細を設定します。列挙 ReferenceDataPathLocation を参照してください。
    3. 各種ジョブ実行設定を行うために、上で作成した ReferenceDataPath インスタンスと、COBOL ランタイム パスおよびモジュール ディレクトリ パス (String 値) を引数としてコンストラクタに渡して、UAMUSAddressingEngineConfiguration のインスタンスを作成します。
      UAMUSAddressingEngineConfiguration インスタンスを作成した後、その各種必須フィールドの値を設定します。
    4. JVM 設定を構成するには、UniversalAddressGeneralConfiguration のインスタンスを作成します。
    5. UAMAddressingDetail のインスタンスを作成します。JobConfig タイプのインスタンスと、上で作成した UAMUSAddressingEngineConfigurationUniversalAddressGeneralConfiguration、および UniversalAddressValidateInputConfiguration のインスタンスを引数としてコンストラクタに渡します。
      JobConfig パラメータは、MRJobConfig タイプのインスタンスである必要があります。
      1. inputPath インスタンスの UAMAddressingDetail フィールドを使用して、入力ファイルの詳細を設定します。
        注:
        • テキスト入力ファイルの場合は、適切なコンストラクタを呼び出して、関連する詳細な入力ファイル情報を指定してFilePath のインスタンスを作成します。
        • ORC 入力ファイルの場合、ORC 入力ファイルのパスを引数に指定して OrcFilePath のインスタンスを作成します。
        • PARQUET 入力ファイルの場合、PARQUET 入力ファイルのパスを引数に指定して ParquetFilePath のインスタンスを作成します。
      2. UAMAddressingDetail インスタンスの outputPath フィールドを使用して、出力ファイルの詳細を設定します。
        注:
        • テキスト出力ファイルの場合は、適切なコンストラクタを呼び出して、関連する詳細な出力ファイル情報を指定してFilePath のインスタンスを作成します。
        • ORC 出力ファイルの場合、ORC 出力ファイルのパスを引数に指定して OrcFilePath のインスタンスを作成します。
        • PARQUET 出力ファイルの場合、PARQUET 出力ファイルのパスを引数に指定して ParquetFilePath のインスタンスを作成します。

      3. jobName インスタンスの UAMAddressingDetail フィールドを使用して、ジョブの名前を設定します。
      4. UAMAddressingDetail インスタンスの compressOutput フラグを true に設定して、ジョブの出力を圧縮します。
  3. MapReduce ジョブを作成するには、先ほど作成した UAMAddressingFactory のインスタンスを使用してそのメソッド createJob() を呼び出します。ここで、上の UAMAddressingDetail のインスタンスを引数として渡します。
    createJob() メソッドは、List のインスタンスの ControlledJob を返します。
  4. JobControl のインスタンスを使用して、作成したジョブを実行します。
  5. ジョブの正常実行後にレポート カウンタを表示するには、先ほど作成した UAMAddressingFactory のインスタンスを使用して、そのメソッド getCounters() を呼び出します。作成したジョブを引数として渡します。
    カウンタの Map が返されます。
  6. ジョブの正常実行後に CASS レポートを生成するには、先ほど作成した UAMAddressingFactory のインスタンスを使用して generateCASSReport() メソッドを呼び出します。多重定義されている generateCASSReport() メソッドのどのバージョンを呼び出しても構いません。
    使用される generateCASSReport() メソッド シグネチャによって、1 つ前の手順で得られたレポート カウンタの MapjobName、生成された CASS レポートを格納する path、作成する reportType を引数として渡します。
    path は、SDK ジョブがクラスタ環境で実行している場合はクラスタ上、クライアント コンピュータ上で実行している場合はクライアント コンピュータ上の場所である必要があります。
    注: path が指定されていない場合は、現在の作業ディレクトリに新しい CASS レポートが配置されます。

    reportType パラメータの値は、列挙 UAMCASSReportTypeに記載された値でなければなりません。1 つ以上のレポート タイプをこのパラメータに指定できます。