Ajout de données à partir de fichiers plats

Vous pouvez créer votre profil à partir d'enregistrements figurant dans des fichiers plats sur votre ordinateur ou sur le serveur. Pour ce faire, procédez comme suit :
  1. Dans un navigateur Web, accédez à :

    http://server:port/metadata-insights

    Où : server est l'adresse IP ou le nom de serveur de votre serveur Spectrum™ Technology Platform et port le port HTTP. Par défaut, le port HTTP est 8080.

  2. Connectez-vous à l’aide de vos informations d’identification.
  3. Sur la page Accueil, cliquez sur Profilage.
  4. Cliquez sur le bouton Ajouter profil .
    La page Ajouter profil s’affiche avec un assistant indiquant les trois phases de création d’un profil : Sélectionner la source > Configurer le profil > Terminer.
  5. Dans les options Sélectionner une source de données, sélectionnez l'option Fichier plat, puis cliquez sur le bouton Ajouter des fichiers.
    La fenêtre contextuelle Sélectionner un fichier s’affiche.
  6. Utilisez la zone de sélection du chemin d’accès aux fichiers pour accéder au chemin d’accès sur votre poste local ou sur le serveur où se trouvent les fichiers.
    Une liste de fichiers s’affiche sous la zone de sélection du chemin d’accès aux fichiers. Vous pouvez filtrer les fichiers requis dans la liste à l’aide de la zone de texte à saisie anticipée Filtre.
  7. Sélectionnez tous les fichiers dont vous avez besoin pour créer le profil et cliquez sur OK.
    Les fichiers sélectionnés sont affichés sur le côté gauche de la page, sous le bouton Ajouter des fichiers.
  8. Pour ajouter d’autres fichiers, cliquez de nouveau sur le bouton Ajouter des fichiers et répétez les étapes 6 et 7.
    Remarque : Vous pouvez ajouter des fichiers de différents dossiers figurant sur votre système local, sur votre serveur et sur le serveur FTP, dans n’importe quelle combinaison souhaitée. Pour utiliser le serveur FTP, vous devez commencer par le configurer. Pour plus d'informations, reportez-vous au Guide d'administration.
  9. Cliquez sur un fichier de la liste pour afficher ces détails :
    • Le nombre de fichiers sélectionnés. Par exemple : 7 fichier(s) sélectionnés
    • Codage couleur pour les métadonnées du fichier
      • Vert : métadonnées automatiquement détectées
      • Bleu : métadonnées configurées par l'utilisateur
      • Rouge : métadonnées non détectées. Ces fichiers sont ignorés lors du profilage. Cependant, vous pouvez configurer les métadonnées de ces fichiers à l’aide des champs Paramètres de fichiers, comme décrit dans cette tâche ci-dessous. Après la configuration manuelle, ces fichiers deviennent bleus.
    • Chemin d'accès au fichier. Par exemple, E:/Sample Files/profile/fileOne.txt
    • Paramètres de fichiers
    • Aperçu des enregistrements du fichier
  10. Pour modifier les paramètres de l'un des fichiers, sélectionnez-le, puis modifiez-le, tel que décrit dans ce tableau.
    Paramètres Description

    Encodage des caractères

    L'encodage du fichier texte. Sélectionnez l'un des éléments suivants :

    UTF-8
    Prend en charge tous les caractères Unicode et est rétrocompatible avec le format ASCII. Pour plus d'informations sur UTF, reportez-vous à unicode.org/faq/utf_bom.html.
    UTF-16
    Prend en charge tous les caractères Unicode, mais n'est pas rétrocompatible avec le format ASCII. Pour plus d'informations sur UTF, reportez-vous à unicode.org/faq/utf_bom.html.
    US-ASCII
    L'encodage des caractères en fonction de l'ordre alphabétique anglais.
    UTF-16BE
    Encodage UTF-16 avec sérialisation d'octets gros-boutiste (octet le plus significatif en premier).
    UTF-16LE
    Encodage UTF-16 avec sérialisation d'octets petit-boutiste (octet le moins significatif en premier).
    ISO-8859-1
    Chiffrement de caractères ASCII utilisé habituellement pour les langues européennes occidentales. Également désigné par l'acronyme Latin-1.
    ISO-8859-3
    Chiffrement de caractères ASCII utilisé habituellement pour les langues européennes méridionales. Également connu sous le nom Latin-3.
    ISO-8859-9
    Chiffrement de caractères ASCII utilisé habituellement pour la langue turque. Également connu sous le nom Latin-5.
    CP850
    Une page de code ASCII utilisée pour écrire les langues européennes occidentales.
    CP500
    Une page de code EBCDIC utilisée pour écrire les langues européennes occidentales.
    Shift_JIS
    Un encodage de caractères pour la langue japonaise.
    MS932
    Extension Microsoft de Shift_JIS permettant d'inclure les caractères spéciaux NEC, la sélection NEC des extensions IBM et les extensions IBM.
    CP1047
    Une page de code EBCDIC avec le jeu de caractères Latin-1 complet.
    Délimiteur de champ

    Indique le caractère utilisé pour séparer des champs dans un fichier délimité.

    Par exemple, cet enregistrement utilise une barre verticale (|) comme délimiteur de champ :

    7200 13TH ST|MIAMI|FL|33144

    Les caractères disponibles pour le délimiteur de champ sont les suivants :

    • Virgule
    • Point-virgule
    • Conduite
    • Tabulation
    • Espace
    • Point (.)
    Vous pouvez également ajouter des délimiteurs de champs personnalisés ; pour ajouter un délimiteur de champ personnalisé, procédez comme suit :
    1. Cliquez sur le bouton Ajouter placé à côté du Délimiteur de champ. La fenêtre contextuelle Ajouter un séparateur apparaît.
    2. Saisissez le délimiteur de champ de votre choix dans le champ Caractère ; l'Unicode correspondant s'affiche automatiquement et inversement.
    3. Saisissez un nom approprié pour votre délimiteur dans le champ Description.
    4. Cliquez sur Enregistrer ; votre délimiteur apparaît dans le menu déroulant Délimiteur de champ.

    Qualificateur de texte

    Le caractère utilisé pour entourer les valeurs de texte dans un fichier délimité.

    Par exemple, cet enregistrement utilise des guillemets doubles (") en tant que qualificateur de texte.

    "7200 13TH ST"|"MIAMI"|"FL"|"33144"

    Ces caractères disponibles à définir en tant que qualificateurs de texte sont :

    • Guillemets simples (')
    • Guillemets doubles (")

    Si le fichier utilise un délimiteur de texte, cliquez sur le bouton de sélection pour sélectionner un autre caractère délimiteur.

    Séparateur de ligne Indique le caractère utilisé pour séparer des enregistrements en ligne dans un fichier séquentiel ou délimité.

    Les paramètres de séparateur d’enregistrements disponibles sont :

    Unix (U+000A)
    Un caractère de saut de ligne sépare les enregistrements. Il s'agit du séparateur d'enregistrement standard pour les systèmes Unix.
    Macintosh (U+000D)
    Un caractère de retour chariot sépare les enregistrements. Il s'agit du séparateur d'enregistrement standard pour les systèmes Macintosh.
    Windows (U+000D U+000A)
    Un retour chariot suivi d'un saut de ligne sépare les enregistrements. Il s'agit du séparateur d'enregistrement standard pour les systèmes Windows.
    Première ligne comme en-tête

    Indique si le premier enregistrement d'un fichier délimité contient des informations d'en-tête. Un Oui indique qu’il comporte des informations d’en-tête.

    Par exemple, cet extrait de fichier illustre une ligne d'en-tête dans le premier enregistrement.

    "AddressLine1"|"City"|"StateProvince"|"PostalCode"
    "7200 13TH ST"|"MIAMI"|"FL"|"33144"
    "One Global View"|"Troy"|"NY"|12180
  11. Pour appliquer des paramètres d’un fichier à un autre :
    1. Sélectionnez le fichier à partir duquel vous souhaitez copier les paramètres, puis cliquez sur le bouton Copier les paramètres du fichier.
    2. Dans la fenêtre contextuelle Appliquer les paramètres fichier qui s’affiche, sélectionnez les fichiers dans lesquels vous souhaitez appliquer les paramètres, puis cliquez sur OK.
      Remarque : Les paramètres de fichier sont appliqués aux fichiers sélectionnés.
  12. Pour afficher un aperçu du fichier sélectionné, reportez-vous à la section Aperçu sous Paramètres de fichiers.
  13. Pour configurer le profil que vous avez créé, cliquez sur dans le coin supérieur droit de la page.