予測の精度を高めるガイドライン

住所コンポーネントの予測精度を最大にするには、次のパターンに従った入力住所文字列にする必要があります。

英国の住所のガイドライン

非住所コンポーネントを避ける

入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。

住所コンポーネント内のシーケンスを維持する

住所コンポーネントは次の順に配置します。[組織] > [Unit] > [場所の名前] > [住所番号] > [通り] > [近隣] > [都市/郊外/郡] > [郵便番号] > [国]。

例:

ユニット番号は、ユニット説明の隣に配置する

パーサーは、数字をユニットのコンポーネントと見なします。ユニット説明のない番号は出力精度を低下させます。次の例では、63 の係る先がないため、ユニットと見なされません。

例:

冗長な住所コンポーネントを削除する

入力住所文字列には住所コンポーネントが重複しないようにします。例えば、１つの文字列に 2 つの異なる組織名がある、または組織名が繰り返されているなどです。

例:

Pitney Bowes Limited Pitney Bowes Limited Unit 10 Logix Cyber Park 10 Manor Street London AB10 3DF GBR

組織タイプのある単一トークンの組織名にする

単一トークンの組織名に、Ltd、Inc、および Reg などの組織タイプが続くようにします。以下の例では、Adrian が単一トークンの組織名ですが、その後にタイプ、この例では、"Limited" が続かない場合、結果の精度が低下する傾向があります。

例:

次のような文字列が住所にあると、住所パーサーの予測が不正確になる傾向があります。このような文字列が住所文字列にないか注意します。

組織名に別の住所コンポーネントが含まれる: 組織名前に、Floor、Flat、および House などのそのほかの住所コンポーネントがあると、予測精度が影響を受けることがあります。; 例: Flat Seasons 632 Kings Road London Middlesex SW6 2DU GBR

組織名に数字が含まれる: 組織名に数字があると、誤った予測になる傾向があります。; 例: 123 Limited ABC Street AB10 3DF GBR

非住所コンポーネントを避ける

住所コンポーネント内のシーケンスを維持する

住所コンポーネントは次の順に配置します。[組織] > [Unit] > [場所の名前] > [住所番号] > [通り] > [近隣] > [都市/郊外/郡] > [郵便番号] > [国]。

例:

冗長な住所コンポーネントを削除する: 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、１つの文字列に 2 つの異なる組織名がある、または組織名が繰り返されているなどです。; 例: Weseler Strasse 3 Weseler Strasse 46514 Schermbeck DEU

HNR および通り名が含まれるようにする

住所文字列には、HNR および通り名が含まれる必要があります。このような不可欠の住所文字列コンポーネントがない場合は、結果の精度が影響を受けます。

例:

結合されたコンポーネントを住所文字列に含めない

結合された住所コンポーネントは不正確な予測につながります。

例:

文字列に宛名を含めない

ドイツの住所の場合、文字列に宛名があると不正確な予測となります。

例:

住所コンポーネントに丸括弧 "()" を含めない: "()" で囲まれた住所コンポーネントはどれも、パースされません。; 例: Weseler Strasse 3 46514 (Schermbeck) DEU