スペインとドイツの名前の分割

このテンプレートでは、スペイン系とドイツ系の名前など、カルチャーが混在する名前を要素にパースする方法を示します。パーシング ルールを使って [名前] フィールドの名前を各トークンに分割し、個人名および企業名パーシング グラマーで定義されたフィールドにコピーします。このパーシング グラマーの詳細については、[ツール] > [Open Parser ドメインエディタ] を選択し、[個人および企業名] ドメインと [ドイツ語 (de)] または [スペイン語 (es)] カルチャーのいずれかを選択します。

また、このテンプレートでは、テーブル管理ツールに収められたテーブル データを使って個人名に性別コードを適用します。テーブル管理の詳細については、[ツール] > [テーブル管理] を参照してください。

ビジネス シナリオ

ブリュッセルに本社を置く、ある製薬会社は、ドイツとスペインの営業拠点を統合しました。会社では、カルチャーの混合したデータベースに名前データを格納するために、これらの 2 つのカルチャーで使われる名前の派生形を分析する必要があります。

以下のデータフローは、このビジネス シナリオの解決策を示しています。



このデータフロー テンプレートは Enterprise Designer で使用できます。[ファイル] > [新規作成] > [データフロー] > [テンプレートから作成] に移動し、[ParseSpanish&GermanNames] を選択します。このデータフローでは、Data Normalization モジュールが必要です。

このデータフローでは、データをファイルから読み取り、Open Parser ステージで処理します。入力ファイルの各データ行に以下の操作を行います。

Read from File

このステージでは、パースする名前が記録されているファイルの名前、格納場所、およびレイアウトを識別します。ファイルには、男性と女性の両方の名前と、各名前の CultureCode 情報が記録されています。CultureCode 情報は、入力する名前のカルチャーが "ドイツ (de)" であるか "スペイン (es)" であるかを示します。

Open Name Parser

Open Name Parser では、名前フィールドをチェックして、Spectrum™ Technology Platform 名前データベース ファイルに格納されている名前データと比較します。この比較結果に基づいて、名前データが [First]、[Middle]、[Last] の各名前フィールドに分割されます。

Conditional Router

このステージでは、入力をチェックして、個人名であれば Gender Codes ステージに渡し、企業名であれば Business Names ステージに渡します。

性別コード

キャンバスでこのステージをダブルクリックしてから、[変更] をクリックして Table Lookup ルール オプションを表示します。

[分類] オプションでは、ソースの値をキーとして使用し、対応する値をテーブル エントリから [デスティネーション] リストで選択したフィールドにコピーします。このテンプレートでは、[フィールド全体] が選択され、[ソース][FirstName] フィールドを使用するように設定されています。Table Lookup はフィールド全体を 1 つの文字列として扱い、文字列全体を分類できる場合はレコードにフラグを設定します。

[デスティネーション][GenderCode] フィールドに設定され、Gender Codes テーブルに格納された検索語を使って男性名と女性名の分類が行われます。Table Lookup は、入力データに含まれる語が見つからない場合に "不明 (Unknown)" を意味する値 U を設定します。この機能をより詳しく理解するには、[ツール] > [テーブル管理] を選択し、Gender Codes テーブルを選択してください。

Write to File

このテンプレートには、2 つの Write to File ステージが含まれています。1 つは個人名用、もう 1 つは企業名用です。入力フィールドだけでなく、個人名出力ファイルにも [Name][TitleOfRespect][FirstName][MiddleName][LastName][PaternalLastName][MaternalLastName][MaturitySuffix][GenderCode][CultureUsed][ParserScore] の各フィールドが格納されます。

企業名出力ファイルには、[Name][FirmName][FirmSuffix][CulureUsed][ParserScore] の各フィールドが格納されます。