Field Parser

[Field Parser] ステージは、指定された入力列の XML データおよび区切り記号付きデータからフィールドを抽出します。[Field Parser] のオプションを設定するには、以下の操作を実行します。

  1. [ソース] フィールドから、パースする XML データまたは区切り記号付きデータのある列を選択します。
    注: ドロップダウンにすべての文字列入力列が表示されます。
  2. パースするデータのタイプに応じて XML または区切り記号付き形式を選択し、以下のオプションを選択します。

XML データ用の Field Parser オプション

オプション名 説明
サーバ名 スキーマの推定用に選択されたファイルが Enterprise Designer を実行しているコンピュータ上にあるか、またはサーバー上にあるかを示します。ローカル コンピュータ上のファイルを選択した場合、サーバー名はマイ コンピュータになります。サーバー上のファイルを選択した場合、サーバー名は Spectrum™ Technology Platform になります。
スキーマ ファイル

XSD スキーマ ファイルへのパスを指定します。省略希望ボタン ([...]) をクリックして、ファイルの場所を参照します。サーバーまたはローカル システムにあるスキーマ ファイルを使用できます。

また、XSD ファイルの代わりに XML ファイルを指定することもできます。XML ファイルを指定した場合は、その XML ファイルの構造に基づいてスキーマが推定されます。XSD ファイルの代わりに XML ファイルを使用する場合は、次のような制限があります。

  • XML ファイルは 1 MB 以下でなければなりません。XML ファイルのサイズが 1 MB を越える場合は、XML の構造を維持しつつ、データの一部の削除を試みてください。
  • データ ファイルは推定されるスキーマに照らして検証されません。
注: なお、Spectrum™ Technology Platform サーバーを実行しているプラットフォームが Unix または Linux の場合、これらのプラットフォームでファイル名およびパスの大文字と小文字が区別されることに注意してください。
出力フィールド

このセクションに、選択したスキーマの詳細情報が表示されます。ルート要素と子要素が順番に表示され、さらにそれらの属性が表示されます。

デフォルトでは、スキーマのすべてのノードが選択されています。ただし、次のステージに渡さないノードのチェックボックスはオフにすることができます。
  • [Search node (検索ノード)]: スキーマ ツリー内のナビゲート先のノードの名前を入力します。入力したフィールドは、このフィールドの下のプレビュー ウィンドウで強調表示されます。
  • XPath: このフィールド内の任意の場所をクリックすると、スキーマ ツリーでハイライト表示されているノードの要素の XML パス (XPath) と属性が表示されます。以前に表示したすべての XPaths を確認するには、右端のフィールドの下矢印をクリックします。
    注: XPath は、XML ドキュメント内で情報を検索するための言語です。この詳細については www.w3schools.com/xpath/ を参照してください。

区切り記号付きデータ用の Field Parser オプション

オプション名 説明
フィールド区切り文字 ドロップダウン リストから、パースする区切り記号付きの列で使われているフィールド区切り文字を選択します。

これ以外の文字がフィールド区切り文字として使われている区切り記号付きの列については、省略記号ボタン (...) をクリックし、別の文字をフィールド区切り文字として選択してください。

Text qualifier

ドロップダウン リストから、パースする区切り記号付きの列で使われているテキスト修飾子を選択します。

注: テキスト修飾子は、区切り記号付きデータ内のテキスト値を囲むために使われる文字です。

これ以外の文字がテキスト修飾子として使われている区切り記号付きの列については、省略記号ボタン (...) をクリックし、別の文字をテキスト修飾子として選択してください。

名前

パース済み出力を [リスト] (値が階層的に表示される) と [フィールド] のどちらの形式にするかを選択します。

注: 出力タイプとして [リスト] を選択した場合は、1 つの出力フィールドのみを追加できます。一方、[フィールド] オプションを選択した場合は、複数のフィールドを追加し、パース時に分離された値をそこに取得できます。
出力フィールド

このセクションでは、区切り記号付きの列から詳細なデータを分離するための各種のフィールドを追加または変更することができます。追加した出力フィールドを削除することもできます。

パース済み出力を表示する新しいフィールドを追加するには、[追加] ボタンをクリックし、表示される [フィールド設定] ポップアップで以下の手順を実行します。
  1. フィールドの [名前] を入力します。
  2. [タイプ] ドロップダウンで、追加するフィールドのデータ タイプを選択します。選択するタイプに基づいて、さらに追加のフィールドを定義できます。例えば [日付] の場合に設定できる形式は、M/d/yyMMM d.yyyy、または MMMM d.yyyy です。データ タイプとその詳細の定義方法については、区切り記号付き入力ファイルのフィールドの定義を参照してください。
    注: データ タイプとして [String] を選択すると、あらゆるタイプの区切り記号付きデータがパースされます。ただし、フィールド内でパースしたいデータに基づいて、特定のタイプを使用することもできます。
  3. [位置] フィールドに、このフィールドにパースされる (入力ファイル内の) データ タイプの位置を入力します。例えば、次のファイル スニペットで、追加するフィールドに日付/時刻値をパースしたい場合は、[位置]3 を入力します。
    true;"02/02/2022";"10/2/92 5:05 AM";598985994665542.25634;1;
    "Arjun";74785.155;5:05PM,1,Deepak,65152
    false;"15/03/1923";"3/23/90 11:55 AM";3425699466554.2563;2;
    "sharma";5.1;5:45AM,2,Arjun,365273          
  4. [フィールドの追加] をクリックし、[閉じる] をクリックします。
追加したフィールドとその詳細がボックスに表示されます。
注: フィールドの値文字列の先頭と末尾から余分なスペース文字を削除するには、[トリム] チェック ボックスをオンにします。

[変更]: 追加した出力フィールドの詳細を変更するには、このボタンをクリックします。

[削除]: 追加した出力フィールドを削除するには、このボタンをクリックします。

[Runtime (ランタイム)]: パーサーのランタイム インスタンスを複数指定する場合はこのボタンを使用します。これにより、パフォーマンスが大幅に向上します。

[OK]: このステージで入力した詳細情報をすべて保存するには、このボタンをクリックします。

[Cancel (キャンセル)]: 実施した更新をすべてキャンセルする場合は、このボタンをクリックします。

[Help (ヘルプ)]: このステージのヘルプ ファイルを参照する場合は、このボタンをクリックします。