Ajout d'un horodateur aux enregistrements d'un entrepôt de données

Une manière pratique de garantir la qualité des données est de repérer les enregistrements de l'entrepôt de données en fonction de leur date de chargement. Si la procédure de chargement ne se termine pas correctement ou si vous remarquez des problèmes une fois les données chargées, un colonne d'horodateurs facilite l'identification des enregistrements affectés. Vous pouvez ensuite supprimer tous les enregistrements traités lors d'une phase donnée, revenir à l'état précédant le chargement et résoudre tout problème avant de tenter de charger de nouveau les données. Vous pouvez horodater l'opération de chargement en ajoutant une colonne supplémentaire, comme load_date, à votre table de faits via le stage SQL Command.

Lors du renseignement ou de la mise à jour d'un entrepôt de données, pour ajouter un horodateur au dataflow, procédez comme suit :

  1. Dans Enterprise Designer, ouvrez le dataflow renseignant ou mettant à jour l'entrepôt de données :
  2. Glissez un stage Transformer jusqu'au canevas et connectez-le au dataflow juste avant le stage Write to DB.

    Par exemple :



  3. Double-cliquez sur le stage Transformer.
  4. Cliquez sur Ajouter.
  5. Sous Général, sélectionnez Personnalisé.
  6. Dans le champ Nom de la transformation personnalisée, saisissez un nom pour cette transformation. Vous pouvez choisir n'importe quel nom. Par exemple, Ajouter horodateur.
  7. Dans le champ Script personnalisé, saisissez ceci :
    data['<timestamp field>']=currentDateTime()

    <timestamp field> est le nom du dataflow de données où vous souhaitez placer l'horodateur.

    Par exemple, si vous souhaitez placer l'horodateur dans un champ de dataflow nommé Timestamp, votre script personnalisé prend la forme suivante :

    data['Timestamp']=currentDateTime()
  8. Cliquez sur le bouton Ajouter au bas de la fenêtre.
  9. Cliquez sur Fermer.
  10. Cliquez sur OK pour fermer la fenêtre Options Transformer.

Le dataflow ajoute l'heure actuelle à un champ de chaque enregistrement, à l'aide d'un horodateur figurant dans l'entrepôt de données qui affiche l'heure de chargement de chaque enregistrement.