予測の精度を高めるガイドライン
住所コンポーネントの予測精度を最大にするには、次のパターンに従った入力住所文字列にする必要があります。
英国の住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。 。
- ユニット番号は、ユニット説明の隣に配置する
- パーサーは、数字をユニットのコンポーネントと見なします。ユニット説明のない番号は出力精度を低下させます。次の例では、63 の係る先がないため、ユニットと見なされません。
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織名が繰り返されているなどです。
- 組織タイプのある単一トークンの組織名にする
- 単一トークンの組織名に、Ltd、Inc、および Reg などの組織タイプが続くようにします。以下の例では、Adrian が単一トークンの組織名ですが、その後にタイプ、この例では、"Limited" が続かない場合、 結果の精度が低下する傾向があります。
英国の住所での制約
次のような文字列が住所にあると、住所パーサーの予測が不正確になる傾向があります。このような文字列が住所文字列にないか注意します。
- 組織名に別の住所コンポーネントが含まれる
- 組織名前に、Floor、Flat、および House などのそのほかの住所コンポーネントがあると、予測精度が影響を受けることがあります。
- 組織名に数字が含まれる
- 組織名に数字があると、誤った予測になる傾向があります。
ドイツの住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。 。
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織名が繰り返されているなどです。
- HNR および通り名が含まれるようにする
- 住所文字列には、HNR および通り名が含まれる必要があります。このような不可欠の住所文字列コンポーネントがない場合は、結果の精度が影響を受けます。
- 結合されたコンポーネントを住所文字列に含めない
- 結合された住所コンポーネントは不正確な予測につながります。
- 文字列に宛名を含めない
- ドイツの住所の場合、文字列に宛名があると不正確な予測となります。
- 住所コンポーネントに丸括弧 "()" を含めない
- "()" で囲まれた住所コンポーネントはどれも、パースされません。