簡易検索インデックス オプション

表 1. Candidate Finder オプション

オプション名

説明 / 有効な値

Finder タイプ

検索インデックスを選択します。

名前

Enterprise Designer の Advanced Matching 展開済みステージの下で Write to Search Index ステージを使用して作成された適切なインデックスを選択します。

開始レコード

検索結果の最初のレコード番号を入力します。デフォルトは 1 です。

結果の最大数

検索インデックスで返す結果の最大数を入力します。デフォルト値は 10 です。
注: 結果の最大数が任意に大きい場合は、[フェッチ バッチ サイズ] フィールドを使用して、結果をバッチで処理します。

フェッチ バッチ サイズ

結果の最大数が任意に大きい場合は、結果を処理するバッチのサイズを入力します。これにより、多数のレコードの処理が最適化されます。デフォルトは 10000 です。

[フェッチ バッチ サイズ] には、[結果の最大数] 未満の値を指定することをお勧めします。[フェッチ バッチ サイズ][結果の最大数] より大きい場合、レコードは単一のバッチで処理されます。

注: このフィールドは、クラスタがサポートされる検索エンジンのみに適用されます。従来の検索エンジンには適用されません。

マッチ数を返す

マッチ総数を返します。例えば、上の [結果の最大数] フィールドをデフォルトの "10" のままにしている場合、結果は 10 件しか返されません。しかし、このチェック ボックスをオンにすれば、処理中に得られたマッチ総数が出力フィールド TotalMatchCount に返されます。

インデックス検索タイプ 実行するインデックス検索のタイプを決定します。[簡易検索] を選択します。

インデックス フィールド

簡易検索による照合に使うインデックス フィールドを選択します。

入力フィールド

簡易検索による照合に使う入力フィールドを選択します。

入力アナライザ

入力文字列のトークン化に使用するアナライザを指定します。以下のいずれか:

  • [標準] — 空白分析とストップ ワード分析のスーパーセットを含むグラマーベースのトークン化機能を提供します。英単語を分割する英語の句読文字を理解すると、(ストップ ワード分析で) 無視する単語がわかり、小文字比較を実行することで、大文字と小文字を区別しない検索を技術的に実行できます例えば、文字列 "Pitney Bowes Software" の場合、3 つのトークン "Pitney"、"Bowes"、および "Software" が返されます。
  • [空白] — トークンを空白で区切ります。英語テキストの単語分割点を空白と改行に基づいて理解するという点で、どちらかというと、標準分析のサブセットです。
  • [ストップ ワード] — "the"、"and"、"a" などの冠詞を削除して、インデックスのサイズを減らし、パフォーマンスを高めます。
  • [キーワード] — データのストリームから 1 つのトークンを作成します。例えば、文字列 "Pitney Bowes Software" の場合、1 つのトークン "Pitney Bowes Software" だけが返されます。
  • [ロシア語] — ロシア語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"and"、"I"、"you" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ドイツ語] — ドイツ語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [デンマーク語] — デンマーク語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"at"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [オランダ語] — オランダ語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [フィンランド語] — フィンランド語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"is"、"and"、"of" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [フランス語] — フランス語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ハンガリー語] — ハンガリー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [イタリア語] — イタリア語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ノルウェー語] — ノルウェー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ポルトガル語] — ポルトガル語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [スペイン語] — スペイン語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [スウェーデン語] — スウェーデン語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  • [ヒンディー語] — ヒンディー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"by"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。

[出力フィールド] タブ

[含める] ボックスをオンにすると、出力に含める必要がある保存済みフィールドを選択できます。
注: 入力フィールドがデータフローの以前のステージのもので、検索インデックスの保存フィールド名と同じ名前を持つ場合、入力フィールドの値によって出力フィールドの値は上書きされます。