Write to File

Sortie de dataflow Write to File dans un fichier texte.
Conseil : Vous pouvez copier votre source et la coller comme récepteur dans votre dataflow pour configurer le fichier rapidement et utiliser les mêmes champs définis dans votre source.
Condition préalable : pour écrire un fichier dans l'un des types de connexions à des systèmes de fichiers, tels que FTP, Cloud, Amazon AWS S3 et HDFS, procédez comme suit :
  1. Créez une connexion à ces serveurs de fichiers à l'aide de Management Console ou de Metadata Insights. Pour plus d’informations, reportez-vous à la section Définition de connexions.
  2. Sélectionnez le chemin d'accès au fichier requis à l'aide du champ Nom de fichier de l'onglet Propriétés du fichier (décrit ci-dessous).

Onglet de propriétés du fichier

Nom du champ

Description

Server name

Indique si le fichier que vous sélectionnez comme entrée figure sur l'ordinateur exécutant Enterprise Designer ou sur le serveur Spectrum™ Technology Platform. Si vous sélectionnez un fichier sur l'ordinateur local, le nom du serveur sera Mon ordinateur. Si vous sélectionnez un fichier sur le serveur, le nom du serveur sera Spectrum™ Technology Platform.

Nom de fichier

Indique le chemin du fichier. Cliquez sur le bouton de sélection (...) pour trouver le fichier souhaité.

Lors de l'écriture d'un fichier sur un serveur de fichiers HDFS, les formats de compression pris en charge sont les suivants :
  1. GZIP (.gz)
  2. BZIP2 (.bz2)
Remarque : Incluez l'extension appropriée dans le nom de fichier, pour indiquer le format de compression à utiliser pour écrire le fichier.
Avertissement : Si le Spectrum™ Technology Platform est en cours d'exécution sur les systèmes Unix ou Linux, rappelez-vous que les noms de fichiers et les chemins sur ces plates-formes sont sensibles à la casse.

Type d'enregistrement

Le format des enregistrements dans le fichier. Sélectionnez l'un des éléments suivants :

Séquence de lignes
Un fichier texte dans lequel les enregistrements sont séparés par un caractère de fin de ligne (EOL) comme un retour chariot ou un retour à la ligne (CR ou LF) et chaque champ dispose d'une position de caractère fixe de départ et de fin.
Largeur fixe
Un fichier texte dans lequel chaque enregistrement est un nombre déterminé de caractères de longueur, et chaque champ dispose d'une position de caractère de départ et de fin fixe .
Délimité
Un fichier texte dans lequel les enregistrements sont séparés par un caractère de fin de ligne (EOL) comme un retour chariot ou un retour à la ligne (CR ou LF) et chaque champ est séparé par un caractère désigné comme une virgule.

Encodage des caractères

L'encodage du fichier texte. Sélectionnez l'un des éléments suivants :

CP1252
Cet encodage est également connu sous le nom de jeu de caractères Windows-1252 ou simplement Windows. Il s'agit d'un super ensemble d'ISO-8859-1, qui utilise la plage de codes 128-159 pour afficher des caractères supplémentaires non inclus dans le jeu de caractères ISO-8859-1.
UTF-8
Prend en charge tous les caractères Unicode et est rétrocompatible avec le format ASCII. Pour plus d'informations sur UTF, reportez-vous à unicode.org/faq/utf_bom.html.
UTF-16
Prend en charge tous les caractères Unicode, mais n'est pas rétrocompatible avec le format ASCII. Pour plus d'informations sur UTF, reportez-vous à unicode.org/faq/utf_bom.html.
US-ASCII
L'encodage des caractères en fonction de l'ordre alphabétique anglais.
UTF-16BE
Encodage UTF-16 avec sérialisation d'octets gros-boutiste (octet le plus significatif en premier).
UTF-16LE
Encodage UTF-16 avec sérialisation d'octets petit-boutiste (octet le moins significatif en premier).
ISO-8859-1
Chiffrement de caractères ASCII utilisé habituellement pour les langues européennes occidentales. Également désigné par l'acronyme Latin-1.
ISO-8859-3
Chiffrement de caractères ASCII utilisé habituellement pour les langues européennes méridionales. Également connu sous le nom Latin-3.
ISO-8859-9
Chiffrement de caractères ASCII utilisé habituellement pour la langue turque. Également connu sous le nom Latin-5.
CP850
Une page de code ASCII utilisée pour écrire les langues européennes occidentales.
CP500
Une page de code EBCDIC utilisée pour écrire les langues européennes occidentales.
Shift_JIS
Un encodage de caractères pour la langue japonaise.
MS932
Extension Microsoft de Shift_JIS permettant d'inclure les caractères spéciaux NEC, la sélection NEC des extensions IBM et les extensions IBM.
CP1047
Une page de code EBCDIC avec le jeu de caractères Latin-1 complet.

Séparateur de champs

Indique le caractère utilisé pour séparer des champs dans un fichier délimité.

Par exemple, cet enregistrement utilise une barre verticale (|) comme séparateur de champ :

7200 13TH ST|MIAMI|FL|33144

Ces caractères disponibles à définir en tant que séparateurs de champs sont :

  • Espace
  • Tabulation
  • Virgule
  • Point (.)
  • Point-virgule
  • Conduite

Si le fichier utilise un caractère différent comme séparateur de champ, cliquez sur le bouton de sélection pour sélectionner un autre caractère délimiteur.

Qualificateur de texte

Le caractère utilisé pour entourer les valeurs de texte dans un fichier délimité.

Par exemple, cet enregistrement utilise des guillemets doubles (") en tant que qualificateur de texte.

"7200 13TH ST"|"MIAMI"|"FL"|"33144"

Ces caractères disponibles à définir en tant que qualificateurs de texte sont :

  • Guillemets simples (')
  • Guillemets doubles (")

Si le fichier utilise un délimiteur de texte, cliquez sur le bouton de sélection pour sélectionner un autre caractère délimiteur.

Séparateur d'enregistrements

Indique le caractère utilisé pour séparer des enregistrements dans un fichier séquentiel ligne par ligne ou délimité. Ce champ n'est pas disponible si vous activez la case Utiliser EOL par défaut.

Les paramètres de séparateur d’enregistrements disponibles sont :

Unix (U+000A)
Un caractère de saut de ligne sépare les enregistrements. Il s'agit du séparateur d'enregistrement standard pour les systèmes Unix.
Macintosh (U+000D)
Un caractère de retour chariot sépare les enregistrements. Il s'agit du séparateur d'enregistrement standard pour les systèmes Macintosh.
Windows (U+000D U+000A)
Un retour chariot suivi d'un saut de ligne sépare les enregistrements. Il s'agit du séparateur d'enregistrement standard pour les systèmes Windows.

Si votre fichier utilise un séparateur d'enregistrement, cliquez sur le bouton de sélection pour sélectionner un autre caractère séparateur.

Utiliser EOL par défaut

Indique que le séparateur d'enregistrements du fichier est le caractère de fin de ligne (EOL) par défaut utilisé sur le système d'exploitation sur lequel le serveur Spectrum™ Technology Platform est exécuté.

Ne sélectionnez pas cette option si le fichier utilise un caractère EOL qui est différent du caractère EOL par défaut utilisé sur le système d'exploitation du serveur. Par exemple, si le fichier utilise un EOL Windows, mais que le serveur fonctionne sous Linux, ne cochez pas cette option. Au lieu de cela, sélectionnez l'option Windows dans le champ Record separator.

Longueur d'enregistrement

Pour les fichiers à largeur fixe, précise le nombre exact de caractères dans chaque enregistrement.

Pour les fichiers de séquence de lignes, indique la longueur, en caractères, de l'enregistrement le plus long dans le fichier.

La première ligne est l’enregistrement d'en-tête.

Indique si le premier enregistrement dans un fichier délimité contient des informations d'en-tête, mais aucune donnée.

Par exemple, cet extrait de fichier illustre une ligne d'en-tête dans le premier enregistrement.

"AddressLine1"|"City"|"StateProvince"|"PostalCode"
"7200 13TH ST"|"MIAMI"|"FL"|"33144"
"One Global View"|"Troy"|"NY"|12180

Traiter les enregistrements avec moins de champs que ce qui est défini comme incorrect

Les enregistrements de fichiers délimités contenant moins de champs que le nombre défini dans l'onglet Champs seront traités comme des enregistrements incorrects.

Importer

Importe la définition du dessin d'enregiestrement du fichier, le paramètre d'encodage et les options de tri à partir d'un fichier de paramètres. Le fichier de paramètres est créé en exportant les paramètres à partir d'un autre stage Read from File ou Write to File qui utilisait le même fichier d'entrée ou un fichier qui dispose du même dessin d'enregistrement que le fichier avec lequel vous joblez.

Exporter

Enregistre la définition du dessin d'enregistrement du fichier, le paramètre d'encodage et les options de tri dans un fichier de paramètres. Vous pouvez ensuite importer ces paramètres dans d'autres stages Read from File ou Write to File qui utilisent le même fichier d'entrée ou un fichier semble à celui que vous utilisez actuellement. Vous pouvez utiliser le fichier de paramètres avec Job Executor pour indiquer les paramètres de fichier lors de l'exécution.

Pour plus d'informations sur le fichier de paramètres, voir Fichier de paramètres de définition du fichier.

Onglet Champs

L'onglet Champs définit les noms, les positions, et, pour les fichiers à longueur fixe et à séquence de lignes, les longueurs de champs dans le fichier. Pour plus d'informations, reportez-vous aux rubriques suivantes :

Onglet Trier les champs

L'onglet Trier les champs définit les champs permettant de trier les enregistrements de sortie avant leur écriture dans le fichier de sortie. Le tri est facultatif. Pour plus d'informations, reportez-vous à la section Tri des enregistrements de sortie.

L'onglet Exécution

Nom de l'option

Description

Nom de fichier

Cela affiche le fichier défini dans l'onglet Propriétés de fichier.

Générer plusieurs fichiers Sélectionnez cette option pour écrire des enregistrements dans des fichiers différents, plutôt que d'écrire tous les enregistrements en un fichier. Le fichier dans lequel chaque enregistrement est écrit est indiqué dans l'enregistrement lui-même. Chaque enregistrement doit contenir un champ indiquant soit un nom de fichier, soit le chemin d'accès complet au fichier dans lequel vous souhaitez écrire l'enregistrement. Par exemple, pour envoyer les prix des actions de différentes sociétés (de groupes divers) à tous les clients séparément, cette fonctionnalité écrit les prix des actions des différentes sociétés dans des fichiers distincts qui peuvent être envoyés à chacun des clients, si vous le désirez. Si vous activez l'option Générer plusieurs fichiers, vous devez spécifier un fichier de sortie sur le serveur Spectrum™ Technology Platform ou sur un serveur FTP. Pour écrire les données dans un fichier sur un serveur FTP, vous devez définir une connexion au serveur de fichiers via Management Console.
Remarque : Les enregistrements de la colonne que vous sélectionnez dans Champ de chemin d'accès au fichier doivent se présenter dans l'ordre trié. Utilisez cette fonctionnalité lorsque l'enregistrement contient un nom de fichier ou le fichier de fichier complet.
Champ de chemin d'accès au fichier Sélectionne le champ contenant le chemin (un nom de fichier ou le chemin de fichier complet) du fichier dans lequel vous souhaitez écrire l'enregistrement. Ce champ n'est activé que si vous sélectionnez Générer plusieurs fichiers.

Mode Écriture

Indique s'il faut ajouter la sortie du dataflow à la fin du fichier ou supprimer les données existantes dans le fichier avant écriture de la sortie. L'un des éléments suivants :

Écraser
Remplace les données existantes dans le fichier de sortie chaque fois que le dataflow est exécuté.
Ajouter
Ajoute le dataflow de sortie à la fin du fichier, sans effacer les données existantes du fichier