オプション

  1. Enterprise Designer で、キャンバスの Write to Search Index ステージをダブルクリックします。
  2. インデックスの [名前] を入力します。
  3. [書き出しモード] を選択します。インデックスを再生成する際に、新しいデータが既存のデータに与える影響について、オプションを使用して指定できます。
    • 作成または上書き — 新しいデータが既存のデータを上書きし、既存のデータはインデックスに存在しなくなります。
    • 更新または追加 — 新しいデータが既存のデータを上書きし、以前は存在しなかった新しいデータがインデックスに追加されます。
    • 追加 — 新しいデータが既存のデータに追加され、既存のデータはそのまま残されます。
    • 削除 — 選択されたフィールドのデータが、検索インデックスから削除されます。
  4. キー フィールドを、レコードに対して行う操作が更新または追加削除のどちらかに基づいて選択します。
    • [作成または上書き] モードの場合は、キー フィールドを (分散環境で使用される) Elastic 検索インデックスに対してユニークなものにする必要があります。このフィールドを空白のままにしている場合は、重複の有無に関係なく、すべてのレコードがインデックスに保存されます。ただし、このインデックス上では更新、追加、削除など、どのような書き込み操作も行えなくなります。次の表は、キー フィールドが Lucene および Elastic 検索インデックスに対して非ユニークである場合のインデックス作成動作を説明したものです。
      書き込みモード キー フィールド Lucene 検索インデックス Elastic 検索インデックス

      Create or Overwrite

      同じキー フィールドを持つ重複レコード すべてのレコードが保存されています。
      注: 同じキー フィールドを持つ重複レコードは、更新操作を行うとすぐに上書きされます。
      同じキー フィールドを持つすべての重複レコードが上書きされます。
      更新または追加 同じキー フィールドを持つ重複レコード 重複するものは上書きされます。 重複するものは上書きされます。
  5. 検索インデックスの作成時に一括で確定するレコード数を指定するには、[一括確定] ボックスをオンにします。次に、[バッチ サイズ] フィールドにレコード数を入力します。デフォルト値は 5000 です。
  6. 作成する [分析] を選択します。
    • [標準] — 空白分析とストップ ワード分析のスーパーセットを含むグラマーベースのトークン化機能を提供します。英単語を分割する英語の句読文字を理解すると、(ストップ ワード分析で) 無視する単語がわかり、小文字比較を実行することで、大文字と小文字を区別しない検索を技術的に実行できます例えば、文字列 "Pitney Bowes Software" の場合、3 つのトークン "pitney"、"bowes"、および "software" が返されます。標準分析とキーワード分析の比較については、標準分析とキーワード分析を参照してください。
    • [空白] — トークンを空白で区切ります。英語テキストの単語分割点を空白と改行に基づいて理解するという点で、どちらかというと、標準分析のサブセットです。
    • [ストップ ワード] — "the"、"and"、"a" などの冠詞を削除して、インデックスのサイズを減らし、パフォーマンスを高めます。
    • [キーワード] — データのストリームから 1 つのトークンを作成し、そのままの状態を維持します。例えば、文字列 "Pitney Bowes Software" の場合、1 つのトークン "Pitney Bowes Software" だけが返されます。標準分析とキーワード分析の比較については、標準分析とキーワード分析を参照してください。
    • [ロシア語] — ロシア語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"and"、"I"、"you" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [ドイツ語] — ドイツ語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [デンマーク語] — デンマーク語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"at"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [オランダ語] — オランダ語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [フィンランド語] — フィンランド語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"is"、"and"、"of" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [フランス語] — フランス語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [ハンガリー語] — ハンガリー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [イタリア語] — イタリア語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [ノルウェー語] — ノルウェー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [ポルトガル語] — ポルトガル語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [スペイン語] — スペイン語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [スウェーデン語] — スウェーデン語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"the"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
    • [ヒンディー語] — ヒンディー語のインデックスと先行入力サービスをサポートします。多くのストップ ワードもサポートし、"by"、"and"、"a" などを除外してインデックスのサイズを減らし、パフォーマンスを高めます。
  7. リストにあるすべてのフィールドのアナライザを更新するには、[アナライザを更新...] ドロップダウンからアナライザを選択します。
  8. スキーマをサーバーから再ロードするには、[スキーマを再ロード] をクリックします。
    注: フィールド名を変更するには、[フィールド] 列に新しい名前を直接入力します。ただし、[ステージ フィールド] の名前や [タイプ] は変更できません。
  9. 入力ソースからのフィールドの追加/削除を選択的に行うには、[クイック追加] をクリックします。[クイック追加] ポップアップ ウィンドウに、入力ソースからのすべてのフィールドのリストが表示されます。追加するフィールドを選択し、[OK] をクリックします。
  10. データを保存するフィールドを選択します。例えば、住所の入力ファイルを使用して、[郵便番号] フィールドのみにインデックスを作成し、残りのフィールド ([住所 1]、[都市]、[州] など) を保存すると、インデックス検索でマッチが見つかったときに住所全体が返されます。
  11. 検索クエリのインデックスにデータを追加するフィールドを選択します。
    注: 特定のフィールドを削除する場合は、それらのフィールドを選択し、[削除] をクリックします。
  12. 必要に応じて、フィールドに適用する分析を変更して、[分析] フィールドで選択した項目とは別のものを使用してください。
  13. [OK] をクリックします。