RegEx

@RegEx ("expression"[,IgnoreCase|NoIgnoreCase]) 

このコマンドはオプションです。

トークンを正規表現にマッチングし、大文字小文字区別のオプションを設定します。パーシング グラマーにはグローバルな大文字小文字区別のオプション (%IgnoreCase) を使用してください。大文字と小文字の区別については、IgnoreCaseを参照してください。

<GivenName> = @RegEx("[A-Z]+",IgnoreCase)

このルールが真になるには、トークンが A-Z の文字を 1 回以上含まなければなりません。それらの文字の大文字と小文字の区別は無視されます。

正規表現は、文字列セット内の各文字列が共有する共通パターンに基づいて、文字列セットを記述します。Open Parser では、正規表現を使用して入力データを検索し、OutputFields として指定した形式でデータを出力します。正規表現の複雑さはさまざまです。正規表現の作成方法の基礎を理解したら、正規表現を作成できるようになります。サポートされている正規表現の構文は、Java のドキュメントで定義されている構文と次の点で異なります。

  • Java で定義されている捕捉グループと後方参照はサポートされていません。
  • POSIX スタイルの文字セット クラスは、ドメインエディタの RegEx タグを使用して定義されている場合にサポートされます。
  • 正規表現は、空の文字列にマッチしてはいけません。例えば、@RegEx("[A-Z]?") or @RegEx("[A-Z]?") は、空の文字列が無効になるため許可されません。

? または * の使用は制限されていませんが、これらの数量詞を使用できるのは、正規表現が空の文字列にマッチしない場合のみです。例えば、@RegEx("[A-Z]+\.?") は、正規表現の一部のみがオプションなので有効です。

* または ? を使用して、@RegEx コマンド自体が出現する頻度を制御することができます。この制限は、@RegEx コマンド内部の正規表現のみを対象としています。

このコマンドを使用するには、次の手順に従います。

  1. コマンドを挿入する場所にカーソルを位置付けます。
  2. [コマンド] リストの [@RegEx] をダブルクリックします。
  3. リストから式名を選択するか、正規表現を入力します。
  4. 大文字と小文字区別のオプションを選択します。
    • [グローバル オプションの使用] は、Regex タグがグラマー ルールで定義された大文字と小文字の区別の設定を使用することを意味します。グラマー ルールで、%IgnoreCase が定義されている場合、RegEx コマンドは大文字と小文字を区別します。グラマー ルールで %IgnoreCase が定義されていない場合、RegEx コマンドは大文字と小文字を区別しません。
    • [大文字と小文字を区別しない] は、Regex タグが英字をマッチングする際に大文字と小文字の違いを無視することを意味します。
    • [大文字と小文字を区別] は、Regex タグが英字をマッチングする際に大文字と小文字の違いを評価することを意味します。
  5. [OK] をクリックします。