Write to Hadoop Sequence File
Le stage Write to Hadoop Sequence File écrit les données dans un fichier de séquence comme sortie d'un dataflow. Un fichier de séquence est un fichier plat constitué de paires de valeurs clés binaires. Pour obtenir davantage d'informations, consultez l'adresse suivante : wiki.apache.org/hadoop/SequenceFile.
- Connexion à Hadoop : pour pouvoir utiliser le stage Write to Hadoop Sequence File, vous devez créer une connexion au serveur de fichiers Hadoop. Une fois que cela est fait, le nom sous lequel vous enregistrez la connexion est affiché comme nom de serveur.
Onglet de propriétés du fichier
Champs | Description |
---|---|
Serveur | Indique que le fichier que vous sélectionnez dans le champ Nom de fichier se trouve sur le système Hadoop. Remarque : Vous devez créer une connexion au serveur de fichiers Hadoop avant de l'utiliser ici. Pour plus de détails sur la création d'une connexion, reportez-vous à la section Connexion à Hadoop. Si vous sélectionnez un fichier sur le système Hadoop, le nom du serveur est le nom que vous indiquez lors de la création d'un serveur de fichiers. |
Nom de fichier | Indique le chemin du fichier. Cliquez sur le bouton de sélection (...) pour trouver le fichier souhaité. |
Séparateur de champs |
Indique le caractère utilisé pour séparer des champs dans un fichier délimité. Par exemple, cet enregistrement utilise une barre verticale (|) comme séparateur de champ :
Ces caractères disponibles à définir en tant que séparateurs de champs sont :
Si le fichier utilise un caractère différent comme séparateur de champ, cliquez sur le bouton de sélection pour sélectionner un autre caractère délimiteur. |
Qualificateur de texte |
Le caractère utilisé pour entourer les valeurs de texte dans un fichier délimité. Par exemple, cet enregistrement utilise des guillemets doubles (") en tant que qualificateur de texte.
Ces caractères disponibles à définir en tant que qualificateurs de texte sont :
Si le fichier utilise un délimiteur de texte, cliquez sur le bouton de sélection pour sélectionner un autre caractère délimiteur. |
Onglet Champs
L'onglet Champs définit les noms, positions et types des champs du fichier. (Pour plus d'informations, reportez-vous à la section Définition de champs dans un fichier de séquence de sortie.)