Validate Address Spark ジョブの使用

UAMAddressingFactory のインスタンスを、その静的メソッド getInstance() を使用して作成します。

ProcessType を指定する UAMAddressingDetail のインスタンスを作成して、Validate Address ジョブの入力と出力の詳細を指定します。このインスタンスは、SparkProcessType タイプを使用する必要があります。これを行うには、次の手順に従います。

このジョブの入力設定を行うには、UniversalAddressValidateInputConfiguration のインスタンスを作成します。
列挙体列挙 PreferredCity、列挙 CasingType、列挙 CityNameFormat、列挙 OutputCountryFormat、列挙 StandardAddressFormat、列挙 StandardAddressPMBLine、列挙 StreetMatchingStrictness、列挙 FirmMatchingStrictness、列挙 DirectionalMatchingStrictness、列挙 DualAddressLogic と該当する場合は列挙 DPVSuccessStatusCondition を使用して、さまざまな必須フィールドの値を設定します。
重要: Validate Address を CASS 認定™モードで実行するには、このインスタンスのフィールド outputReport3553、outputCASSDetail、および outputReportSummary を true に設定します。CASS レポートにはジョブを CASS 認定™ モードで実行した場合にのみ有効なコンテンツが含められます。それ以外の場合は、空白のレポート PDF が生成されます。
ReferenceDataPath のインスタンスを作成することによって、リファレンスデータパスの詳細を設定します。列挙 ReferenceDataPathLocation を参照してください。
各種ジョブ実行設定を行うために、上で作成した ReferenceDataPath インスタンスと、COBOL ランタイムパスおよびモジュールディレクトリパス (String 値) を引数としてコンストラクタに渡して、UAMUSAddressingEngineConfiguration のインスタンスを作成します。
UAMUSAddressingEngineConfiguration インスタンスを作成した後、その各種必須フィールドの値を設定します。
JVM 設定を構成するには、UniversalAddressGeneralConfiguration のインスタンスを作成します。
列挙体列挙 DPVFileType、列挙 DPVMemoryModel、列挙 LacsLinkMemoryModel、および列挙 SuiteLinkMemoryModel を使用します。
UAMAddressingDetail のインスタンスを作成します。JobConfig タイプのインスタンスと、上で作成した UAMUSAddressingEngineConfiguration、UniversalAddressGeneralConfiguration、および UniversalAddressValidateInputConfiguration のインスタンスを引数としてコンストラクタに渡します。
JobConfig パラメータは、SparkJobConfig タイプのインスタンスである必要があります。
1. inputPath インスタンスの UAMAddressingDetail フィールドを使用して、入力ファイルの詳細を設定します。
  注:
  
  テキスト入力ファイルの場合は、適切なコンストラクタを呼び出して、関連する詳細な入力ファイル情報を指定してFilePath のインスタンスを作成します。
  
  ORC 入力ファイルの場合、ORC 入力ファイルのパスを引数に指定して OrcFilePath のインスタンスを作成します。
  
  PARQUET 入力ファイルの場合、PARQUET 入力ファイルのパスを引数に指定して ParquetFilePath のインスタンスを作成します。
2. UAMAddressingDetail インスタンスの outputPath フィールドを使用して、出力ファイルの詳細を設定します。
  注:
  
  テキスト出力ファイルの場合は、適切なコンストラクタを呼び出して、関連する詳細な出力ファイル情報を指定してFilePath のインスタンスを作成します。
  
  ORC 出力ファイルの場合、ORC 出力ファイルのパスを引数に指定して OrcFilePath のインスタンスを作成します。
  
  PARQUET 出力ファイルの場合、PARQUET 出力ファイルのパスを引数に指定して ParquetFilePath のインスタンスを作成します。
3. jobName インスタンスの UAMAddressingDetail フィールドを使用して、ジョブの名前を設定します。
4. UAMAddressingDetail インスタンスの compressOutput フラグを true に設定して、ジョブの出力を圧縮します。

Spark ジョブを作成して実行するには、先ほど作成した UAMAddressingFactory のインスタンスを使用してそのメソッド runSparkJob() を呼び出します。ここで、上の UAMAddressingDetail のインスタンスを引数として渡します。

runSparkJob() メソッドはジョブを実行し、ジョブのレポートカウンタの Map を返します。

ジョブの正常実行後にレポートカウンタを表示するには、先ほど作成した UAMAddressingFactory のインスタンスを使用して、そのメソッド getCounters() を呼び出します。作成したジョブを引数として渡します。

カウンタの Map が返されます。

ジョブの正常実行後に CASS レポートを生成するには、先ほど作成した UAMAddressingFactory のインスタンスを使用して generateCASSReport() メソッドを呼び出します。多重定義されている generateCASSReport() メソッドのどのバージョンを呼び出しても構いません。

使用される generateCASSReport() メソッドシグネチャによって、1 つ前の手順で得られたレポートカウンタの Map、jobName、生成された CASS レポートを格納する path、作成する reportType を引数として渡します。

path は、SDK ジョブがクラスタ環境で実行している場合はクラスタ上、クライアントコンピュータ上で実行している場合はクライアントコンピュータ上の場所である必要があります。

注: path が指定されていない場合は、現在の作業ディレクトリに新しい CASS レポートが配置されます。

reportType パラメータの値は、列挙 UAMCASSReportTypeに記載された値でなければなりません。1 つ以上のレポートタイプをこのパラメータに指定できます。