DB2 Loader

DB2 Loader vous permet de charger des données dans une base de données DB2 configurée sur la plate-forme Spectrum™ Data Integration.
Remarque : Avant de pouvoir utiliser DB2 Loader, vous devez installer le client d'exécution DB2 avec une configuration administrateur.
Nom de l'option Description

Connexion

Sélectionnez la connexion de base de données à utiliser. Vos choix varient en fonction des connexions qui sont définies dans le Gestionnaire de connexion de Management Console. Si vous devez établir une nouvelle connexion à la base de données, ou en modifier ou supprimer une existante, cliquez sur Gérer.

Si vous ajoutez ou modifiez une connexion de base de données, remplissez ces champs :
Nom de la connexion
Saisissez le nom de la connexion.: Ce nom est entièrement de votre choix.
Pilote de la base de données
Sélectionnez le type de base de données approprié.
Options de connexion
Indiquez l'hôte, le port, l'instance, le nom d'utilisateur et le mot de passe à utiliser pour vous connecter à la base de données.
Table/Vue Après avoir sélectionné une connexion, spécifiez la vue ou la table pour l'écriture. Cliquez sur le bouton Parcourir ([...]) pour accéder à la table ou vue à utiliser, ou cliquez sur Créer une table pour créer une table dans la base de données.
Base de données/Alias

Il s'agit d'une variable qui place la base de données et le serveur DB2 dans un catalogue.

Pour placer le serveur DB2 dans un catalogue

Utilisez le processeur de ligne de commande DB2 sur la machine du serveur Spectrum et saisissez la commande suivante :

CATALOG TCPIP NODE <nodename> REMOTE <hostname> SERVER <port>
où :
nodename : nom de la connexion

hostname : nom TCP/IP de l'ordinateur du serveur DB2

port : port du serveur

Pour placer la base de données dans un catalogue

Utilisez la commande :

CATALOG DATABASE <databasename> AS <local_database_alias> AT NODE <nodename>
où :
databasename : nom de la base de données sur le serveur DB2

local_database_alias : nom local donné à la base de données lors de la connexion depuis l'ordinateur du serveur

nodename : nom utilisé dans la commande CATALOG TCP/IP précédente

Champs de stage Cette colonne contient une liste des noms de champ utilisés dans le flux de données. Vous ne pouvez pas modifier les noms de ces champs.
Types Cette colonne contient une liste des types de données de chaque champ.

L'onglet Exécution

Nom de l'option Description
Méthode de chargement Indique le mode d’écriture des données dans une table DB2.
Insérer
Insère les données chargées dans la table, tandis que les données existantes de la table restent inchangées.
Remplacer
Insère les données chargées dans la table après avoir supprimé toutes les données existantes qu'elle contient.

Les définitions de schéma et d'index de la table restent intactes.

Redémarrer
Redémarre le chargement de données, dans le cas où la tentative de chargement précédente a été interrompue.
Non récupérable Indique que cette transaction de chargement n'est pas récupérable.

Si vous sélectionnez cette option, la transaction de chargement est marquée comme non récupérable. Les espaces de la table ne sont pas définis sur l'état Backup Pending après le chargement, et les données chargées ne sont pas copiées lors du chargement. Par conséquent, une transaction non récupérable ne peut pas être récupérée en cas d'échec de chargement des données, même si une opération rollforward est tentée ultérieurement.

Si vous sélectionnez cette option, vous ne pouvez pas la transaction, même si vous utilisez l'utilitaire DB2 rollforward, parce que l’utilitaire ignore une telle transaction non récupérable et que la table est marquée comme « non valide ». En outre, les transactions suivantes sur la table sont elles aussi ignorées par rollforward.

Pour restaurer une table contenant des transactions non-récupérables, vous devez utiliser une sauvegarde au niveau des espaces de la table ou une sauvegarde complète effectuée à un point de validation suivant le chargement non récupérable.

Remarque : Ne sélectionnez pas cette option si les données contiennent des colonnes Datalink avec l’attribut File Link Control.
CPU Nombre de threads parallèles que l’utilitaire de chargement peut générer et gérer pour charger, analyser et formater les enregistrements, tout en créant des objets de table dans chaque partition de base de données.
Disque Nombre de threads parallèles que l’utilitaire de chargement peut générer et gérer pour écrire des données dans les conteneurs d’espaces de table.
Mode d'indexation Indique le mode de gestion des index par l’utilitaire de chargement.
Autoselect
L’utilitaire de chargement décide s’il faut appliquer le mode Régénérer ou Incrémentiel, en fonction de la quantité de données et de la profondeur de l’arborescence des index.
Régénérer
Tous les index sont recréés.
Incrémentiel
Les nouvelles données sont ajoutées aux index existants.

Ce mode peut être appliqué uniquement si l’objet indexé est valide et accessible au début d’une opération de chargement.

Remarque : L'indexation incrémentielle n'est pas pris en charge lorsque TOUTES les conditions suivantes sont réunies :
  1. L'option Load Copy est indiquée logretain ouuserexit est activé).
  2. La table se trouve dans un espace de table DMS.
  3. L'objet index se trouve dans un espace de table partagé par d'autres objets table appartenant à la table en cours de chargement.
Pour contourner cette restriction, placez les index dans des espaces de table distincts.
Deferred
L’utilitaire de chargement ne tente pas de créer un index. Les index existants sont marqués comme devant être actualisés.
Remarque : La construction d'index nécessite plus de temps en mode Deferred qu'en mode Régénérer. Par conséquent, lorsque vous effectuez plusieurs opérations de chargement, laissez la dernière opération de chargement régénérer tous les index au lieu de les régénérer lors du premier accès par une opération n'effectuant pas de chargement.
Remarque : Ce mode est pris en charge uniquement pour les tables comportant des index qui ne sont pas uniques.
Analyse rapide Indique si la validation syntaxique des valeurs des colonnes doit être ignorée, pour améliorer les performances.

Si cette option est cochée, toutes les erreurs syntaxiques des données sont ignorées afin d'optimiser les performances.

Par exemple, si une valeur de chaîne 12wxvg56 est détectée dans un champ mappé vers une colonne d’entiers dans un fichier ASCII, l’utilitaire de chargement doit normalement générer une erreur de syntaxe. Mais, si Analyse rapide est sélectionné, l'erreur de syntaxe est ignorée et un nombre arbitraire est chargé dans le champ d'entier.

Remarque : Assurez-vous que vous utilisez cette option uniquement avec des données correctes et propres.
Nom du schéma Schéma dans lequel les tables d'exceptions sont stockées.
Nom de la table Table d'exceptions dans laquelle sont copiées les lignes contenant des erreurs lors du chargement.
Dossier des fichiers journaux Chemin d'accès au répertoire dans lequel les fichiers journaux doivent être stockés.

Un fichier journal contient une liste des transactions de chargement de base de données exécutées par un stage DB Loader au cours d'une session de chargement.

Cliquez sur le bouton d'ellipse (...) pour spécifier le répertoire de votre choix pour le stockage des fichiers journaux.

Dossier de fichiers incorrects Chemin d'accès au répertoire du serveur DB2 dans lequel les fichiers incorrects doivent être stockés.

Un fichier incorrect contient une liste des enregistrements qu'un stage DB Loader ne parvient pas à charger dans la base de données.

Cliquez sur le bouton d'ellipse (...) pour spécifier le répertoire de votre choix pour le stockage des fichiers incorrects.

Nombre max. d'erreurs autorisées Nombre maximal d’erreurs autorisées avant qu’une opération de chargement soit abandonnée.

Pour abandonner une opération dès que la première erreur est rencontrée, définissez la valeur de ce champ sur 0.

Remarque : Le nombre maximal d'erreurs autorisé est 32 767.
Parallélisme
Une base de données DB2 peut être divisée en plusieurs partitions via le clonage de l’environnement sur différents nœuds physiques.

Les requêtes de base de données distinctes pour l'extraction et la mise à jour des données sont automatiquement réparties sur les différentes partitions et exécutées en parallèle pour optimiser les performances.

Gestion des exceptions
Une base de données DB2 vous permet d’enregistrer les erreurs et les exceptions rencontrées lors de l’exécution des requêtes et des procédures, ainsi que de les gérer de manière appropriée.

Pour ce faire, une base de données DB2 fournit des tables d'exceptions et un schéma qui stockent la source ainsi que les traces de consignation de chaque exception de la base de données.