Tri des enregistrements d'entrée

Dans le stage Read from File, l'onglet Trier les champs définit les champs permettant de trier les enregistrements d'entrée avant qu'ils ne soient envoyés dans le flux de données. Le tri est facultatif.

  1. Dans l'onglet Trier des champs, cliquez sur Ajouter.
  2. Cliquez sur la flèche de déroulement dans la colonne Nom du champ et sélectionnez le champ que vous voulez trier. Les champs disponibles à la sélection dépendent des champs définis dans ce fichier d'entrée.
  3. Dans la colonne Ordre, sélectionnez Ascending ou Descending.
  4. Répétez cette opération jusqu'à l'ajout de tous les champs d'entrée que vous souhaitez utiliser pour le tri. Changez l'ordre du tri en surlignant la ligne pour le champ que vous voulez déplacer et cliquez sur Vers le haut ou Vers le bas.
  5. Les options de performance de tri par défaut de votre système sont définies dans Management Console. Si vous voulez remplacer les options de performance de tri par défaut, cliquez sur l'onglet Avancé. La boîte de dialogue Options avancées contient les options de performance de tri suivantes :
    Limite du nombre d'enregistrement en mémoire
    Spécifie le nombre maximum de rangées de données qu'un trieur peut contenir en mémoire avant que celui-ci commence à pager sur le disque. Par défaut, un tri de 10 000 enregistrements ou moins sera effectué en mémoire et un tri de plus de 10 000 enregistrements sera effectué sur le disque. La limite maximale est de 100 000 enregistrements. En général, un tri en mémoire est beaucoup plus rapide qu'un tri sur le disque ; donc, il faut définir une valeur assez haute pour que la plupart des tris s'effectuent en mémoire et que seuls les groupes de grande taille soient écrits sur le disque.
    Remarque : Soyez conscient du fait qu'au sein d'environnements où des jobs s'exécutent de manière simultanée, une augmentation du paramètre Dans la limite d'enregistrement mémoire augmente la probabilité de ne plus disposer de suffisamment de mémoire.
    Nombre maximal de fichiers temporaires
    Spécifie le nombre maximal de fichiers temporaires pouvant être employés par un processus de tri. L'utilisation d'un plus grand nombre de fichiers temporaires peut améliorer les performances. Cependant, le nombre optimal dépend très largement de la configuration du le serveur qui exécute Spectrum™ Technology Platform. Nous vous conseillons d'essayer différents paramètres et d'observer l'effet de l'utilisation d'un plus ou moins grand nombre de fichiers temporaires sur les performances. Pour calculer le nombre approximatif de fichiers temporaires nécessaires, utilisez l'équation suivante :
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    Notez que le nombre maximal de fichiers temporaires ne peut pas être supérieure à 1 000.
    Activer la compression
    Spécifie si les fichiers temporaires sont compressés lors de leur écriture sur le disque.
    Remarque : Les paramètres de performances de tri optimal dépendent de la configuration matérielle de votre serveur. Néanmoins, l'équation suivante produit généralement de bonnes performances de tri :
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords