ジオコーディングのシナリオ

Enterprise Manager を使用することによって、ビジネス要件や、データの性質と品質に適したデータフローを作成できます。

Geocode Address World を最終ジオコーディング パスとして使用した複数国ステージ

入力を複数のパスでジオコーディングすることによって、結果を最適化できる場合があります。一般的に、最初のパスにはより厳しいマッチング条件を適用できます。続くジオコーディング パスでは、前のパスで近似一致候補を返すことのできなかった住所に対して、より緩和されたマッチング条件を適用できます。この方法によって、品質の高い住所に対しては正確な一致を返し、正確さに欠ける住所や、対象範囲のレベルが包括的ではない国の住所に対しては、できる限り最良の結果を返すことができます。

以下のシナリオを例として考えます。
  • 入力ファイルに、6 カ国の住所が含まれているとします。6 カ国とは、アルゼンチン (ARG)、ブラジル (BRA)、メキシコ (MEX)、チリ (CHL)、ベネズエラ (VEN)、パナマ (PAN) です。
  • これらの国のうちの 3 カ国 (ARG、BRA、MEX) のジオコーダは、複数国ステージで展開されています。
  • Geocode Address World は、国固有のジオコーダによって特定できなかった住所をジオコーディングするための別個のステージに展開されています。
  • ステージでは、Conditional Router (と、場合によっては Stream Combiner) を使用して、ジオコーディング フローを管理します。
  1. 入力を複数国ステージに読み込みます。ジオコーディングされた住所は、ファイルに書き出すか、Stream Combiner に送信することもできます。
  2. 一部の住所は、ステップ 1 ではジオコーディングできません。こうした状況が起こり得る理由は、住所が CHL、VEN、または PAN のものであり、これらの国のジオコーダが最初のステージにないためです。あるいは、住所の入力に誤りやあいまいな部分があるために、最初のステージでは近似一致候補を返すことができなかったという場合もあり得ます。ジオコーディングされなかったこれらの住所は、Geocode Address World ステージへと送られます。
  3. 住所は、Geocode Address World によって郵便番号の精度または地理的な精度にジオコーディングできます。正しくジオコーディングされた住所は、ファイルに書き出すか、Stream Combiner に送信することもできます。

    郵便ジオコーディングされた候補は、結果コードが Z1 になります。郵便ジオコーディングの結果は、郵便番号システムが確実に定められている国においては非常に正確である可能性があります。郵便番号ジオコーディングを参照してください。地理的候補には、G 結果コードが付与されます (例えば、町/都市が一致した場合は G3)。地理的ジオコーディングを参照してください。

  4. Stream Combiner (データフローにおいて使用した場合) は、ジオコーディングされたすべての住所を結合し、ファイルに書き出すか、または、さらなる処理に向けて送ることができます。
これは、シナリオの 1 つです。Enterprise Manager を使用することによって、ニーズに適した、より複雑なデータフローを設計することができます。

最初のジオコーディング パスとしての Geocode Address World の使用

Geocode Address World を最初のジオコーディング パスとする方法を利用することもできます。

次のような状況を想定します。

  • 通常、住所に国が指定されていません (ただし、なかには指定されているものもあります)。
  • 一部の住所にはストリートと都市の住所情報のみが含まれています。
  • 一部の国については国固有のジオコーダがありますが、すべての国のものが揃っているわけではありません。
  • ジオコーディング プロセスを管理するためにメイン データフローにサブフローを組み合わせて使用します。

以下の動作を実行するデータフロー (場合によってはサブフローが付属するもの) を使用します。以下の手順は、サンプル データフローを簡単に説明したものです。

  1. 入力を複数国ステージ内に読み込みます。このステージには Geocode Address World も含まれています。都市名 (および場合によっては米国住所の州名) に基づき、各住所について、可能性のある 1 つ以上の近似一致候補を複数の異なる国から生成できます。ここで、入力住所に国が含まれていない場合であっても、各候補に国が関連付けられます。
  2. 国固有のジオコーダが利用できる場合、候補はそのジオコーダに送られます。この処理には、Conditional Router、Stream Combiner をはじめとする他のSpectrum™ Technology Platform制御ステージが必要です。入力住所の完全性と国固有のジオコーダの機能に応じて、各候補はストリート (S 結果コード)、地理的 (G 結果コード)、または郵便番号 (Z 結果コード) レベルにジオコーディングされます。
  3. 国固有のジオコーダが利用できない場合、候補は Geocode Address World にルーティングされ、そこで地理的レベルまたは郵便番号レベルにジオコーディングできます。
  4. すべてのサブフローからの候補が組み合わされ、数々の基準を使用してランク付けされます。ランク付けは、都市の人口 (都市ランク)、一致の精度 (ストリート、地理的、郵便番号)、ユーザの地域からの近さなどの基準に従って行うことができます。