Détails des tables et des colonnes dans les résultats de profilage

La page Résultats de profilage des données peut être divisée en trois parties.
  • Un en-tête affichant les détails du profil
  • Le volet gauche, qui affiche le nom du profil et toutes les tables et colonnes incluses
  • Le volet de rapport, qui fournit une vue illustrée des données analysées

Le rapport affiché dans le volet droit est basé sur les éléments que vous sélectionnez dans le volet gauche (profil, table ou colonne). Des détails, tels que les valeurs Déviation standard (Dév. std), Maximum (Maxi), Minimum (Mini) et Moyenne sont affichés au niveau des colonnes pour les données numériques, tandis que la fréquence de longueur et la fréquence de motif de texte sont affichées pour les colonnes de chaînes. En outre, suivant les règles sélectionnées pour le profilage, d’autres onglets sont affichés dans le rapport, tels que Type de sémantique pour les colonnes comportant des valeurs de type de sémantique si la règle Analyse sémantique est sélectionnée. Pour plus d'informations, reportez-vous à la section Règles de profilage.

En outre, vous pouvez collaborer sur vos résultats de profilage à l'aide de la fonction de commentaires disponible au niveau du modèle, de la table et de la colonne. Pour plus d'informations, voir Collaboration sur les résultats de profilage des données.

Détails du profil

L’en-tête du rapport affiche ces détails du profil analysé.

  • Nom de profil : nom du profil
  • Description : brève description du profil
  • Démarré : date (aaaa/mm/jj), heure (hh:mm:ss) et période (AM ou PM) d'initialisation de l'analyse du profil
  • Source de données : source de données du profil en cours d’analyse. Il peut s'agir d'un Physical Model ou d'un Logical Model ou encore d'une Data Source Connection directe.
  • Utilisateur : l’utilisateur qui a créé le profil
  • Tables : nombre de tables du modèle sélectionné
  • Type de source de données : indique si la source de données du profil est un modèle ou une base de données.
  • Enregistrements : nombre total d'enregistrements analysés

Détails du modèle et des tables

Le volet de navigation gauche de la page Résultats de profilage des données affiche le profil analysé et les tables et les colonnes qui y sont incluses. Le rapport illustré affiché dans le volet droit correspond à la sélection effectuée dans le volet gauche. Par exemple, si vous cliquez sur le nom de profil, le rapport affiche :
  • Le Résumé du profil affichant le pourcentage de lignes complètes et incomplètes des données du profil.
  • Un aperçu des tables des données du profil dans l'onglet Résumé des tables.
Vous pouvez utiliser la zone de texte à saisie anticipée Rechercher du volet de navigation gauche pour rechercher la table ou la colonne pertinente.
Remarque : Pour le type de données date, les résultats affichent le fuseau horaire du poste client.

Les résultats de profilage des données

Suivant les éléments que vous sélectionnez dans le volet gauche de cette page, ces rapports sont affichés dans le volet droit.
  • Rapport d’analyse du profil : cliquez sur le nom de source de données dans le volet gauche pour afficher ces détails :
    • Complétude : pourcentage d'exhaustivité des lignes des données du profil
    • Résumé des tables : affiche ces détails pour chaque table du profil
      • Nom de la table : noms de toutes les tables du profil
      • Nombre de colonnes : nombre de colonnes de la table
      • Nombre d'enregistrements : nombre d'enregistrement de la table
      • Complétude (%) : exhaustivité des enregistrements de la table
  • Rapport de la table : cliquez sur l'un des noms de table du volet gauche pour afficher ces détails :
    Remarque : Dans Fichier platProfilage, vous pouvez afficher les enregistrements non conformes de votre table en cliquant sur l'onglet Enregistrements non conformes. Cet onglet affiche la Catégorie et le Nombre des enregistrements non conformes. Un enregistrement est traité comme non conforme pour ces catégories :
    • Lignes avec moins de champs que le nombre de colonnes définies
    • Lignes avec plus de champs que le nombre de colonnes définies

      Vous pouvez également afficher un aperçu des enregistrements non conformes en cliquant sur la catégorie. L'aperçu affiche le Numéro d'enregistrement, l'Enregistrement, et le Motif pour catégoriser un enregistrement comme non conforme.

    • Complétude : pourcentage d'exhaustivité des lignes de la table
    • Résumé des colonnes : affiche ces détails pour chaque colonne de la table
      • Nom de colonne : noms de toutes les colonnes de la table
      • Type de colonne : type de données de la colonne
      • Complétude (%) : exhaustivité des enregistrements de la colonne
      • Unicité (%) : caractère unique des données contenues dans la colonne
      • Type détecté : affiche les types de sémantique, tels que l'adresse électronique, le téléphone, la ville, le prénom et le nom de famille, détectés dans la chaîne de cette colonne
    • Fréquence de comptage nulle : affiche le nombre de valeurs null de chaque ligne de la table
    Remarque : Vous pouvez afficher un récapitulatif des valeurs atypiques détectées pour chaque colonne de votre table en cliquant sur l'onglet Analyse des valeurs atypiques. Cet onglet affiche les occurrences par catégorie de tout modèle, valeur, longueur ou fréquence d'une colonne qui se situe en dehors de la plage des autres observations. Les catégories prises en charge sont Valeurs atypiques de longueur, Valeurs atypiques de fréquence, Valeurs atypiques de modèle de texte, Valeurs atypiques numériques, Valeurs atypiques de type sémantique et Valeurs atypiques de type de données.
  • Rapport de la colonne : cliquez sur l'une des colonnes du volet gauche pour afficher ces détails :
    Remarque : Vous pouvez afficher les valeurs atypiques détectées dans une colonne en cliquant sur l'onglet Valeurs atypiques. Cet onglet affiche une structure tabulaire des valeurs atypiques détectées par catégorie dans votre colonne. Des détails tels que Modèle, Longueur, Valeur ou Fréquence, Plage calculée et Occurrence sont également affichés.
    • Complétude : pourcentage d'exhaustivité des données de la colonne
    • Unicité : caractère unique des données de la colonne (%)
    • Longueur mini. et Longueur maxi. de caractères au cas où les données de la colonne constituent une chaîne
    • Déviation Standard (Dév. std), valeurs maximale (Maxi.), minimale (Mini.) et Moyenne si la colonne comporte des données numériques.
    • Fréquence des données de la colonne
    • Fréquence de longueur au cas où les données de la colonne sont de type chaîne
    • Fréquence de modèle de texte au cas où les données de la colonne sont de type chaîne