XML ファイルの例

XML ファイルを入力に使用する Write to Hub データフローは、次のようになります。

Read from XML の設定

Read from XML ステージは、以下を含む階層ファイルを使用します。

この入力ファイルを使用するように設定した場合、Read from XML ステージは次のようになります。

Write to Hub の設定

次に Write to Hub ステージを設定します。モデルに "Employees" という名前を付け、モデルを構成するエンティティと関連性を含むようにステージを設定します。

ここでは組織図に似たモデルを作成しているため、エンティティは、数値 ID を割り当てられた従業員になります。[エンティティを追加] ダイアログボックスにおいてまず、参照ボタンをクリックして [フィールドスキーマ] ダイアログボックスにアクセスし、"id" を選択します。これが、この例のモデルにおける最初のエンティティグループです。

次に、[タイプ] フィールドに "Employee" を設定し、"name" と "title" のチェックボックスをオンにします。これらのフィールドからの情報を、モデル内の ID エンティティのプロパティとして使用するためです。

ID エンティティのプロパティを設定したら、次に処理オプションを設定します。[更新] タブでは、モデル内のプロパティが一旦設定された後に、それらを更新するかどうか、既存データを上書きするかどうかを指定できます。例えばこの例では、Mary Hansen が 2 回出現します。彼女は ID 2 では従業員ですが、ID 11 では管理者であるためです。Write to Hub は 2 回目に Mary Hansen を処理する際に、最初の処理の結果として設定されたデータを上書きするか、または削除するという選択肢があります。[プロパティを空の入力データで上書きしない] (これがデフォルトです) を選択すると、更新が生じた場合に新しいプロパティが作成されて既存のプロパティが上書きされますが、最初の処理で設定されたプロパティが 2 回目の処理では欠落していた場合に、プロパティを空白にすることはしません。このオプションでは、レコードの読み込み順序がモデルに影響を与えないことも保証されます。

  [プロパティを常に更新する] を選択すると、データは常に上書きされ、最後のプロパティデータセットのみがモデルに反映されることになります。[すべての入力が null の場合を除き、プロパティを更新する] を選択すると、新しいレコードのすべてのフィールドが空白である場合を除き、データは常に上書きされます。最後に、[空でないプロパティを上書きしない] を選択した場合は、フィールドが空白でない限り、任意のフィールドの最初のデータセットが維持されます。このオプションでは、空白でない最初のデータセットが保持されることになります。

上記の手順を繰り返して "ManagerId" をモデルの 2 つめのエンティティグループとして追加します。ManagerID と EmployeeID は入力ファイルにおいて異なるフィールドですが、どちらのエンティティもタイプが “Employee” に設定されています。ManagerID を異なるタイプに設定すると、モデルには中間レベルの管理者に対する 2 つのエンティティが含まれることになります。例えば、Jim Waterman は従業員としてのエンティティと管理者としてのエンティティを持つことになります。どちらのエンティティのタイプも "Employee" に設定することにより、Jim Waterman などの管理者は、モデルにおいて 1 つのエンティティのみを持ちます。このエンティティには、(従業員から) 入ってくる複数のエンティティと、(対応する管理者へと) 出ていく 1 つのエンティティがあります。ManagerID エンティティにはプロパティを追加していないことに注意してください。これらのフィールド (name、title) の値は従業員に適用されるものであり、管理者に適用されるものではないからです。また、[更新] タブでは [プロパティを空の入力データで上書きしない] というデフォルト設定をそのまま使用します。

この例の最終的な [エンティティ] タブは、次のようになります。

次に、[関連性] タブを設定します。[関連性を追加] ダイアログボックスにおいてまず、[エンティティ] タブ上で作成されたエンティティの一覧から関連性のソースを選択します。この例のエンティティ間の関連性は、報告階層構造 (従業員から管理者) を反映するものなので、"Employee:Staff/Employee/Staff-id" エンティティをソースとして選択します。次に、"String" を関連性の名前として選択し、"Reports to" というテキストを入力します。続いて、[エンティティ] タブ上で作成されたエンティティの一覧から関連性のターゲットを選択します。この例では、"Employee:id" を選択します。"報告する" 関係の代わりに "管理する" 関係を使用する場合は、ソースフィールドとターゲットフィールドの選択は逆になります。

この例の最終的な [関連性] タブは、次のようになります。

これでデータフローの設定は完了し、完成モデルは Relationship Analysis Client において次のように表されます。

フラットファイルの例と同様に、このモデルも次のようにパネルスタイルで表示することができます。