カルチャー RegEx タグの定義

このトピックでは、カルチャー固有のパーシング グラマーの定義時にカルチャー Regex タグを定義する方法について説明します。

  1. Enterprise Designer で、[ツール] > [Open Parser ドメインエディタ] を選択します。
  2. [カルチャー] タブをクリックします。サポートされているカルチャーの一覧が [カルチャー] タブに表示されます。サポートされている全カルチャーの一覧は、レコードへのパーシング カルチャーの割り当てを参照してください。
  3. リストからカルチャーを選択し、[プロパティ] をクリックします。[カルチャー プロパティ] ダイアログ ボックスが表示されます。
  4. [Regex タグ] タブをクリックします。表示される情報には、選択したカルチャーおよび関連付けられたソース カルチャー用に定義された Regex タグ名や、Regex タグの値、説明などがあります。
  5. [追加] または [変更] をクリックします。
  6. [名前] テキスト ボックスに Regex タグの名前を入力します。

    選択したカルチャーに既に存在する名前を入力した場合は、警告アイコンが点滅します。別の名前を入力するか、このダイアログ ボックスを閉じて、既存の Regex タグを削除してから、[追加] を再度クリックしてください。

  7. [説明] テキスト ボックスに Regex タグの説明を入力します。
  8. [値] テキスト ボックスに Regex タグの値を入力します。

    値には任意の有効な正規表現を指定できますが、空の文字列とのマッチングはできません。

    ドメインエディタにはいくつかの Regex タグが定義済みで、これを使用してカルチャー プロパティを定義できます。パーシング グラマーのトークン化文字の定義にも、これらの Regex タグを使用できます。

    定義済みの Regex タグを変更するか、それをコピーして独自の Regex タグを作成することができます。オーバーライド プロパティを使用して、特定の言語用に特殊な Regex タグを作成することもできます。

    • 文字: 任意の言語の任意の文字。この Regex タグには、キリル文字のスクリプト、アジア言語のスクリプト、タイ語のスクリプトなど、使用するスクリプトの違いによって、複数の言語用のオーバーライドが含まれます。
    • 小文字: 対応する大文字がある小文字。
    • 番号: 任意のスクリプトの任意の数字。
    • 句読文字: 任意の句読文字。
    • 大文字: 対応する小文字がある大文字。
    • 空白: 任意の空白または非表示の区切り文字。
  9. [OK] をクリックします。