Définition des champs dans des fichiers de format variable délimités

Cette procédure décrit la manière dont définir les champs dans le stage Read from Variable Format File pour les fichiers délimités.

  1. Dans le stage Read from Variable Format File, cliquez sur l'onglet Champs.
  2. Cliquez sur Régénérer.

    Une liste de tous les champs pour chaque enregistrement apparaît. Pour chaque champ, les informations suivantes apparaissent :

    Parent
    Balise du fichier d'entrée indiquant le type d'enregistrement dans lequel le champ apparaît. Si la balise commence par un nombre, la balise présente le préfixe « NumericTag_ ». Par exemple, une balise nommée 100 deviendrait NumericTag_100. Le préfixe est nécessaire car les noms de champ de dataflow ne peuvent pas commencer par un nombre.
    Champ
    Le nom sera utilisé dans le dataflow pour le champ. Par défaut, les champs portent des noms au format <Tag Name>_<Column n>. Par exemple, le premier champ de type d'enregistrement Owner serait Owner_Column1, le deuxième serait Owner_Column2, etc.
    Type
    Type de données du champ.
    Remarque : Les 50 premiers enregistrements permettent de générer la liste des champs. Le fichier d'entrée doit contenir au moins deux balises racine afin de générer une liste de champs.
  3. Si vous souhaitez modifier les relations parent/enfant entre les balises :
    1. Cliquez sur Modifier la hiérarchie de balise.
    2. Cliquez et faites glisser les balises pour définir la hiérarchie de balise que vous souhaitez.
    3. Cliquez sur OK.
  4. Si vous souhaitez modifier le nom ou type de données d'un champ, sélectionnez le champ et cliquez sur Modifier.
  5. Dans le champ Name, choisissez le champ à ajouter ou saisissez le nom du champ.

    En général, il sera judicieux de remplacer les noms par défaut par des noms significatifs afin de représenter les données contenues dans le champ. Par exemple, envisagez les données d'entrée suivantes :

    001   Joe,Smith,M,100 Main St,555-234-1290

    Cet enregistrement possède une balise parent de 001 et présenterait ces champs créés par défaut :

    • NumericTag_001_Column1 : Joe
    • NumericTag_001_Column2 : Smith
    • NumericTag_001_Column3 : M
    • NumericTag_001_Column4 : 100 Main St
    • NumericTag_001_Column5 : 555-234-1290

    Il serait judicieux de renommer les champs de telle sorte que les noms décrivent les données. Par exemple :

    • FirstName : Joe
    • LastName : Smith
    • Gender : M
    • AddressLine1 : 100 Main St
    • PhoneNumber : 555-234-1290
    Remarque : Vous ne pouvez pas renommer les champs de liste. Les champs de liste contenant tous les champs d'un type d'enregistrement donné utilisent toujours le nom de balise du fichier d'entrée comme nom de champ.
  6. Pour modifier le type de données d'un champ, sélectionnez le type de données de votre choix dans le champ Type.

    Les types de données suivants sont disponibles :

    bigdecimal
    Type de données numérique prenant en charge 38 points de précision décimaux. Utilisez ce type de données pour les données utilisées dans les calculs mathématiques requérant un haut niveau de précision, en particulier ceux impliquant des données financières. Le type de données bigdecimal prend en charge des calculs plus précis que le type de données double.
    booléen
    Type logique doté de deux valeurs : True et False.
    bytearray
    Tableau (liste) d'octets.
    Remarque : ByteArray n'est pas pris en charge en entrée pour un service REST.
    date
    Type de données contenant un mois, un jour et une année. Par exemple, 2012-01-30 ou January 30, 2012. Vous pouvez indiquer un format de date par défaut dans Management Console.
    datetime
    Type de données contenant un mois, un jour, une année et des heures, des minutes et des secondes. Par exemple, 2012/01/30 6:15 PM.
    double
    Un type de données numérique qui contient à la fois des nombres en double précision négatifs et positifs entre 2-1074 et (2-2-52)×21023. En notation E, la plage de valeurs est comprise entre -1.79769313486232E+308 et 1.79769313486232E+308.
    flottant
    Un type de données numérique contenant des nombres de précision seuls négatifs et positifs entre 2-149 et (2-223)×2127. En notation E, la plage de valeurs est comprise entre -3.402823E+38 et 3.402823E+38.
    integer
    Un type de données numériques qui contient à la fois des nombres entiers négatifs et positifs entre -231 (-2,147,483,648) et 231-1 (2,147,483,647).
    liste
    Au sens strict du terme, une liste n'est pas un type de données. Cependant, lorsqu'un champ contient des données hiérarchiques, il est traité comme un champ de « liste ». Dans Spectrum™ Technology Platform, une liste représente un ensemble de données composées de plusieurs valeurs. Par exemple, un champ Noms peut contenir une liste de valeurs de noms. Cela peut être représenté sous forme d'une structure XML, comme suit :
    <Names>
        <Name>John Smith</Name>
        <Name>Ann Fowler</Name>
    </Names>
    Il est important de souligner que le type de données de liste Spectrum™ Technology Platform est différent du type de données de liste de schéma XML dans le sens où ce dernier est un type de données simple composé de plusieurs valeurs, tandis que le type de données de liste Spectrum™ Technology Platform est semblable à un type de données complexe XML.
    long
    Un type de données numériques qui contient à la fois des nombres entiers négatifs et positifs entre -263 (-9,223,372,036,854,775,808) et 263-1 (9,223,372,036,854,775,807).
    chaîne
    Séquence de caractères.
    time
    Type de données contenant l'heure du jour. Par exemple, 21:15:59 ou 9:15:59 PM.
  7. Si vous avez sélectionné une date, une heure ou un type de données numérique, vous pouvez utiliser le format date/heure ou numérique par défaut, ou vous pouvez spécifier un autre format pour ce champ spécifique. Le format par défaut est le format par défaut du système qui a été défini dans les options de conversion du type dans Management Console, ou le format par défaut du flux de données spécifié dans les options de conversion du type dans Enterprise Designer. Le format qui s'applique apparaît. Pour utiliser le format par défaut, laissez l'option Valeur par défaut sélectionnée. Pour indiquer un autre format, choisissez Personnalisé et suivez les étapes suivantes :
    Remarque : Il est important que vous choisissiez un format de date et heure qui reflète avec précision les données que vous lisez à partir du fichier. Par exemple, si le fichier contient des données de date au format Mois/Jour/Année, mais que vous choisissez Jour/Mois/Année, tout calcul de date que vous effectuez dans le flux de données, tel que le tri par date, ne reflètera pas la date correcte. En outre, la conversion de type peut échouer pour les enregistrements, auquel cas le comportement d'échec spécifié dans les options de conversion de type dans Management Console ou Enterprise Designer prendra effet.
    1. Dans le champ Locale, sélectionnez le pays dont vous souhaitez utiliser la convention de formatage. Votre sélection déterminera les valeurs par défaut dans le champ Format. Pour les données de date, votre sélection déterminera également la langue utilisée lorsqu'un mois est épelé. Par exemple, si vous indiquez Anglais, le premier mois de l'année sera « January », alors que si vous indiquez Français, ce sera « Janvier ».
    2. Dans le champ Format, sélectionnez le format des données. Le format dépend du type de données du champ. Une liste des formats les plus couramment utilisés pour les paramètres régionaux sélectionnés est fournie.

      Un exemple du format sélectionné s'affiche à droite du champ Format.

      Vous pouvez également spécifier vos propres formats de date, heure et nombre si ceux disponibles ne répondent pas à vos besoins. Pour indiquer votre propre format de date ou heure, tapez le format dans le champ à l'aide de la notation décrite dans Modèles de date et d'heure. Pour indiquer votre propre format numérique, tapez le format dans le fichier à l'aide de la notation décrite dans Modèles numériques.

  8. Cliquez sur OK.