簡易検索インデックス オプション

表 1. Candidate Finder オプション

オプション名

説明 / 有効な値

Finder タイプ

検索インデックスを選択します。

名前

Enterprise Designer の Advanced Matching 展開済みステージの下で Write to Search Index ステージを使用して作成された適切なインデックスを選択します。

開始レコード

検索結果の最初のレコード番号を入力します。デフォルト値は 1 です。

結果の最大数

インデックス検索で返す応答の最大数を入力します。デフォルトは 10 です。

マッチ数を返す

マッチ総数を返します。例えば、上の [結果の最大数] フィールドをデフォルトの "10" のままにしている場合、結果は 10 件しか返されません。しかし、このチェック ボックスをオンにすれば、処理中に得られたマッチ総数が出力フィールド TotalMatchCount に返されます。

インデックス検索タイプ 実行するインデックス検索のタイプを決定します。[簡易検索] を選択します。

インデックス フィールド

簡易検索による照合に使うインデックス フィールドを選択します。

入力フィールド

簡易検索による照合に使う入力フィールドを選択します。

入力アナライザ

入力文字列のトークン化に使用するアナライザを指定します。次のいずれかです。

  • [標準] — 空白分析とストップ ワード分析のスーパーセットを含むグラマーベースのトークン化機能を提供します。英単語を分割する英語の句読文字を理解すると、(ストップ ワード分析で) 無視する単語がわかり、小文字比較を実行することで、大文字と小文字を区別しない検索を技術的に実行できます例えば、文字列 "Pitney Bowes Software" の場合、3 つのトークン "Pitney"、"Bowes"、および "Software" が返されます。
  • [空白] — トークンを空白で区切ります。英語テキストの単語分割点を空白と改行に基づいて理解するという点で、どちらかというと、標準分析のサブセットです。
  • [ストップ ワード] — "the"、"and"、"a" などの冠詞を削除して、インデックスのサイズを減らし、パフォーマンスを高めます。
  • [キーワード] — データのストリームから 1 つのトークンを作成します。例えば、文字列 "Pitney Bowes Software" の場合、1 つのトークン "Pitney Bowes Software" だけが返されます。
  • [ロシア語] — ロシア語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"and"、"I"、"you" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ドイツ語] — ドイツ語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [デンマーク語] — デンマーク語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"at"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [オランダ語] — オランダ語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [フィンランド語] — フィンランド語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"is"、"and"、"of" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [フランス語] — フランス語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ハンガリー語] — ハンガリー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [イタリア語] — イタリア語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ノルウェー語] — ノルウェー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ポルトガル語] — ポルトガル語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [スペイン語] — スペイン語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [スウェーデン語] — スウェーデン語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ヒンディー語] — ヒンディー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"by"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。

[出力フィールド] タブ

[含める] ボックスをオンにすると、出力に含める必要がある保存済みフィールドを選択できます。
注: 入力フィールドがデータフローの以前のステージのもので、検索インデックスの保存フィールド名と同じ名前を持つ場合、入力フィールドの値によって出力フィールドの値は上書きされます。
以下に、簡易インデックス検索を使用した Candidate Finder オプション ステージの完成例を示します。
  • 検索インデックスの [名前] は "CF_Index"
  • [開始レコード] は 100 で、検索結果は 100 番目のレコードから開始
  • [結果の最大数] は 25 で、結果は 25 件しか返されない
  • [合計マッチ数を返す] のオプションが選択されており、これには表示上限の 25 件だけでなくすべてのレコードが含まれる
  • 簡易インデックス検索タイプ
  • 入力フィールド "City" との照合に使用される "City" の [インデックス フィールド]
  • インデックス フィールド "City" との照合に使用される "City" [入力フィールド]
  • フィールドを照合するドイツ語の入力アナライザ
  • すべてのフィールドが出力に返されることを示すフィールド マップ。