予測の精度を高めるガイドライン
住所コンポーネントの予測精度を最大にするには、次のパターンに従った入力住所文字列にする必要があります。
オーストラリアの住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織に繰り返されている名前があるなどです。
- 結合されたコンポーネントを住所文字列に含めない
- 結合された住所コンポーネントは不正確な予測につながります。
- 文字列に宛名を含めない
- オーストラリアの住所の場合、文字列に宛名があると予測が不正確になります。
- 住所コンポーネントに丸括弧 "()" を含めない
- "()" で囲まれた住所コンポーネントはどれも、パースされません。
オーストラリアの住所での制約事項
オーストラリアの住所では、住所パーサーに制約があります。
- 私書箱の住所はサポートされていません。
- センテンス固有の住所 ("~に近い"、"~の間の"、"~のそばの" などが含まれる住所) には対応していません。
例: Tourquay Road Close To Butcher Shop Hervey Bay QLD 4655 AUS
- 道路名に "および" ("and" または "&") が含まれる住所はサポートされていません。
例: Corner Farrall Road and O'Connor Road Stratton 6056 AUS
- 通り名の形式が複雑な住所 (例えば、タワー、公園、ビルディングといった、通りの追加情報) はサポートされていません。
例: Wesfarmers Limited Level 14 Brookfield Place Tower 2 123 St Georges Terrace Perth 6000 AUS
- 文字形式のユニット/通りのコンポーネントはサポートされていません。
例: Ground Floor 46 Charlotte St Brisbane 4000 AUS
- 住所内で、組織、州、国を繰り返さないでください (Australia または QLD など)。
例: DOF Subsea Australia Pty Ltd 5th FL 181 St Georges TCE Perth Western Australia 6000 AUS
カナダの住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織に繰り返されている名前があるなどです。
- 結合されたコンポーネントを住所文字列に含めない
- 結合された住所コンポーネントは不正確な予測につながります。
- 文字列に宛名を含めない
- カナダの住所の場合、文字列に宛名があると不正確な予測となります。
- 住所コンポーネントに丸括弧 "()" を含めない
- "()" で囲まれた住所コンポーネントはどれも、パースされません。
カナダの住所での制約事項
カナダの住所では、住所パーサーに制約があります。
- ユニットまたはアパートの情報はサポートされていません。
- 住所にフランス語の文字が存在すると正しく表示されません。
フランスの住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織に繰り返されている名前があるなどです。
- 結合されたコンポーネントを住所文字列に含めない
- 結合された住所コンポーネントは不正確な予測につながります。
- 文字列に宛名を含めない
- カナダの住所の場合、文字列に宛名があると予測が不正確になります。
- 住所コンポーネントに丸括弧 "()" を含めない
- "()" で囲まれた住所コンポーネントはどれも、パースされません。
フランスの住所での制約事項
フランスの住所では、住所パーサーに制約があります。
- 都市名が含まれる通り名はサポートされていません。
例: 14 Rue de Maule 78870 Bailly France
- フランスの海外県は正確にパースされません (例えば、Martinique、Réunion、Guadeloupe)。
ドイツの住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。 .
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織に繰り返されている名前があるなどです。
- 住所番号および通り名が含まれるようにする
- 住所文字列には、住所番号および通り名が含まれる必要があります。このような不可欠の住所文字列コンポーネントがない場合は、結果の精度が影響を受けます。
- 結合されたコンポーネントを住所文字列に含めない
- 結合された住所コンポーネントは不正確な予測につながります。
- 文字列に宛名を含めない
- ドイツの住所の場合、文字列に宛名があると予測が不正確になります。
- 住所コンポーネントに丸括弧 "()" を含めない
- "()" で囲まれた住所コンポーネントはどれも、パースされません。
スペインの住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織に繰り返されている名前があるなどです。
- 結合されたコンポーネントを住所文字列に含めない
- 結合された住所コンポーネントは不正確な予測につながります。
- 文字列に宛名を含めない
- スペインの住所の場合、文字列に宛名があると予測が不正確になります。
- 住所コンポーネントに丸括弧 "()" を含めない
- "()" で囲まれた住所コンポーネントはどれも、パースされません。
スペインの住所での制約事項
スペインの住所では、住所パーサーに制約があります。
- 略語 (例: PL. (場所)、Av.、BL. (大通りや並木道)、C. (通り)) で始まる住所はサポートされていません。
- ランドマーク情報 (例: ~にある、~の近くの、~との間にある) が含まれる通り名はサポートされていません。
英国の住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。 .
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織に繰り返されている名前があるなどです。
- 組織タイプのある単一トークンの組織名にする
- 単一トークンの組織名に、Ltd、Inc、および Reg などの組織タイプが続くようにします。以下の例では、Ardian が単一トークン組織名です。この場合、組織名の後に「Limited」というタイプがないため、結果が不正確になる可能性があります。
英国の住所での制約事項
次のような文字列が住所にあると、住所パーサーの予測が不正確になる傾向があります。このような文字列が住所文字列にないか注意します。
- 組織名に別の住所コンポーネントが含まれる
- 組織名に、Floor、Flat、および House などのそのほかの住所コンポーネントがあると、予測精度が影響を受けることがあります。
- 組織名に数字が含まれる
- 組織名に数字があると、誤った予測になる傾向があります。
米国の住所のガイドライン
- 非住所コンポーネントを避ける
- 入力文字列内の非住所コンポーネントは、誤った予測をもたらすことがあります。予測用に文字列を読み込ませる前にそうしたコンポーネントを削除します。
- 住所コンポーネント内のシーケンスを維持する
- 住所コンポーネントは次の順に配置します。
- 冗長な住所コンポーネントを削除する
- 入力住所文字列には住所コンポーネントが重複しないようにします。例えば、1つの文字列に 2 つの異なる組織名がある、または組織に繰り返されている名前があるなどです。
- 結合されたコンポーネントを住所文字列に含めない
- 結合された住所コンポーネントは不正確な予測につながります。
- 文字列に宛名を含めない
- 米国の住所の場合、文字列に宛名があると予測が不正確になります。
- 住所コンポーネントに丸括弧 "()" を含めない
- "()" で囲まれた住所コンポーネントはどれも、パースされません。
米国の住所での制約事項
米国の住所では、住所パーサーに制約があります。
- 私書箱の住所はサポートされていません。
- 様方 (In Care) の略号である (C/O) の住所はサポートされていません。
- [住所番号] がない場合、[通り番号] が [住所番号] として返る場合があります (上付き文字がない数字の桁の場合にのみ、この状況が発生します)。
- いくつかの定義済み住所の場合、[方向] が [州/省] で返る場合があります (特に [方向] が 2 文字の場合に、この状況が発生します)。