入力パラメータ

パラメータ 説明
Address Validation のエンジン設定 製品データベース情報のリストを設定します。
Address Validation の入力オプション 入力設定を指定します。
  1. 出力の大文字と小文字の区別
  2. マッチ モード
  3. デフォルトの国
  4. 結果の最大数
  5. 入力アドレスを返す
  6. Return Parsed Address
  7. 精度コードを返す
  8. マッチ スコアを返す
  9. 住所番号が必ず一致
  10. 通りが一致
  11. 都市が一致
  12. 地方が一致
  13. 州が一致
  14. 州/省が一致
  15. 郵便番号が一致
  16. 複数の一致を保持
  17. 都市名よりも郵便番号を優先
  18. 都市へのフォールバック
  19. 郵便番号へのフォールバック
  20. バリデーション レベル
製品データベース情報 以下を設定します。
  1. 国コード
  2. データベース パス
  3. プロセス タイプ
Job Configurations ジョブ用の Hadoop 設定

MapReduce ジョブの場合、インスタンスのタイプは MRJobConfig である必要があります。Spark ジョブの場合、インスタンスのタイプは SparkJobConfig である必要があります。

Input File テキスト ファイルの場合:
File Path
Hadoop プラットフォーム上の入力テキスト ファイルのパス。
レコード区切り文字
入力ファイル内で使用されるレコード区切り文字。
Field Separator
入力ファイルで、レコード内の連続する 2 つのフィールドの間に使用される区切り文字。
Text Qualifier
区切り記号付きファイル内のテキスト値を囲むのに使用する文字。
Header Row Fields
入力ファイルのヘッダー フィールドの配列。
Skip First Row
入力ファイル レコードの読み取り時に、先頭行をスキップするかどうかを示すフラグ。

先頭行がヘッダー行である場合は、これを true にする必要があります。

注: FilePath の適切なコンストラクタを呼び出します。
ORC 形式ファイル:
ORC File Path
Hadoop プラットフォーム上の入力 ORC 形式ファイルのパス。
PARQUET 形式ファイル:
Parquet File Path
Hadoop プラットフォーム上の入力 PARQUET 形式ファイルのパス。
共通パラメータ:
Field Mappings
キー値ペアのマップ。既存の列名をキーとし、対応する出力列名を値としてマッピングします。
Output File テキスト ファイルの場合:
File Path
Hadoop プラットフォーム上の出力テキスト ファイルのパス。
Field Separator
出力ファイルで、レコード内の連続する 2 つのフィールドの間に使用される区切り文字。
注: FilePath の適切なコンストラクタを呼び出します。
ORC 形式ファイル:
ORC File Path
Hadoop プラットフォーム上の出力 ORC 形式ファイルのパス。
PARQUET 形式ファイル:
Parquet File Path
Hadoop プラットフォーム上の出力 PARQUET 形式ファイルのパス。
共通パラメータ:
Overwrite
出力ファイルと同じ名前のファイルが既に存在する場合に、上書きするかどうかを示すフラグ。
Create Output Header
ヘッダー ファイルを Hadoop サーバー上に作成するかどうかを示すフラグ。
Job Name ジョブの名前。
Compress Output 出力を圧縮するかどうかを示すフラグ。

出力を圧縮する場合は true を設定します。