Field Parser

Le stage Field Parser extrait les champs des données XML et Delimited dans la colonne d’entrée spécifiée. Pour configurer les options de Field Parser, procédez comme suit.

  1. Dans le champ Source, sélectionnez la colonne contenant les données XML ou Delimited à analyser.
    Remarque : La liste déroulante affiche toutes les colonnes d’entrée de chaîne.
  2. Sélectionnez le Format XML ou Delimited suivant le type de données que vous souhaitez analyser et, en conséquence, sélectionnez les options décrites ci-dessous.

Options Field Parser pour les données XML

Nom de l'option Description
Server name Indique si le fichier que vous avez sélectionné pour inférer le schéma se trouve sur l'ordinateur exécutant Enterprise Designer ou sur le serveur. Si vous sélectionnez un fichier sur l'ordinateur local, le nom du serveur sera Mon ordinateur. Si vous sélectionnez un fichier sur le serveur, le nom du serveur sera Spectrum™ Technology Platform.
Fichier de Schéma

Indique le chemin du fichier de schéma XSD. Cliquez sur le bouton d'ellipse (...) pour accéder à l'emplacement du fichier. Le fichier de schéma peut résider sur le serveur ou sur votre système local.

Sinon, vous pouvez également spécifier un fichier XML au lieu d'un fichier XSD. Si vous spécifiez un fichier XML, le schéma est inféré en fonction de la structure du fichier XML. Utiliser un fichier XML au lieu d'un fichier XSD présente les limites suivantes :

  • Le fichier XML ne peut pas être supérieur à 1 Mo. Si la taille du fichier XML est supérieure à 1 Mo, essayez d'enlever quelques données en maintenant la structure du fichier XML.
  • Le fichier de données ne sera pas validé en fonction du schéma déduit.
Remarque : Si le Spectrum™ Technology Platform est en cours d'exécution sur les systèmes Unix ou Linux, rappelez-vous que les noms de fichiers et les chemins sur ces plates-formes sont sensibles à la casse.
Champs de sortie

Cette section affiche les détails du schéma sélectionné. Elle inclut l’élément racine, suivi des éléments enfants ainsi que de leurs attributs.

Par défaut, tous les nœuds du schéma restent sélectionnés. Cependant, vous pouvez décocher la case des nœuds que vous ne souhaitez pas transmettre au stage suivant.
  • Rechercher un nœud : saisissez le nom du nœud auquel vous souhaitez accéder dans l'arborescence de schémas. Le nœud saisi est mis en surbrillance dans le volet d’aperçu sous le champ.
  • XPath : cliquez n’importe où dans ce champ pour afficher le chemin d’accès XML (XPath) des éléments et attributs du nœud en surbrillance dans l'arborescence de schémas. Pour afficher tous les XPath que vous avez précédemment affichés, cliquez sur la flèche en bas à droite du champ.
    Remarque : XPath est un langage qui permet de trouver des informations dans un document XML. Pour plus d'informations, consultez www.w3schools.com/xpath/.

Options Field Parser pour les données au format Delimited

Nom de l'option Description
Séparateur de champs Dans la liste déroulante, sélectionnez le séparateur de champs utilisé dans la colonne Delimited à analyser.

Si la colonne Delimited utilise un caractère différent comme séparateur de champ, cliquez sur le bouton d'ellipse pour sélectionner un autre caractère comme séparateur de champ.

Qualificateur de texte

Dans la liste déroulante, sélectionnez le qualificateur de texte utilisé dans la colonne Delimited à analyser.

Remarque : Les qualificateurs de texte sont le caractère utilisé pour entourer les valeurs de texte dans des données au format Delimited.

Si la colonne Delimited utilise un qualificateur de texte différent, cliquez sur le bouton d'ellipse pour sélectionner un autre caractère comme qualificateur de texte.

Type de sortie

Sélectionnez si vous souhaitez que la sortie analysée se présente sous la forme d’une Liste (affichage hiérarchique des valeurs) ou de Champs.

Remarque : Pour obtenir une liste comme type de sortie, vous pouvez ajouter un seul champ de sortie, tandis que l’option Champs vous permet d’ajouter plusieurs champs dans lesquels vous pouvez obtenir les valeurs distinctes pendant l’analyse.
Champs de sortie

Cette section vous permet d'ajouter/de modifier les différents champs dans lesquels vous souhaitez que les détails de la colonne au format Delimited soient séparés. Vous pouvez également supprimer n'importe quel champ de sortie ajouté.

Pour ajouter un nouveau champ à afficher dans la sortie analysée, cliquez sur le bouton Ajouter et effectuez ces étapes dans la fenêtre contextuelle Paramètre de Champ qui s’affiche :
  1. Saisissez le Nom du champ.
  2. Dans la liste déroulante Type, sélectionnez le type de données du champ à ajouter. Suivant le type sélectionné, quelques autres champs peuvent être définis. Par exemple, en cas de date, vous pouvez définir son format sur M/j/aa, MMM j. aaaa ou MMMM j.aaaa. Pour des informations plus détaillées sur les types de données et la définition de leurs détails, reportez-vous à la section Définition de champs dans un fichier d'entrée délimité.
    Remarque : Si vous sélectionnez Chaîne comme type de données, n’importe quel type de données au format Delimited est analysé. Cependant, vous pouvez également utiliser le type spécifique, en fonction des données que vous souhaitez analyser dans le champ.
  3. Dans le champ Position, saisissez la position du type de données (dans le fichier d’entrée) à analyser pour ce champ. Par exemple, dans l'extrait de fichier suivant, si vous souhaitez analyser les valeurs de date et d'heure dans le champ en cours d'ajout, définissez la Position sur 3.
    true;"02/02/2022";"10/2/92 5:05 AM";598985994665542.25634;1;
    "Arjun";74785.155;5:05PM,1,Deepak,65152
    false;"15/03/1923";"3/23/90 11:55 AM";3425699466554.2563;2;
    "sharma";5.1;5:45AM,2,Arjun,365273          
  4. Cliquez sur Ajouter champ et Fermer.
Le champ ajouté et ses détails sont affichés dans la case.
Remarque : Si vous souhaitez que tout caractère d'espacement superflu soit supprimé au début et à la fin d'une chaîne de valeur dans un champ, cochez la case Trim.

Modifier : cliquez sur ce bouton pour modifier les détails d’un des champs de sortie ajoutés.

Modifier : cliquez sur ce bouton pour supprimer l’un des champs de sortie ajoutés.

Exécution : ce bouton permet de spécifier plusieurs instances d’exécution de Field Parser. Cela se traduit par une amélioration significative des performances.

OK : cliquez sur ce bouton pour enregistrer toutes les informations saisies dans ce stage.

Annuler : cliquez sur ce bouton pour annuler toutes les mises à jour que vous avez apportées.

Aide : cliquez sur ce bouton pour consulter le fichier d'aide de ce stage.