Mise en cluster

Un modèle de mise en cluster PMML détermine le meilleur cluster de mise en correspondance pour un enregistrement donné basé sur la distance ou la mesure de similarité utilisée pour la mise en cluster. Un cluster est un sous-ensemble de données similaires. La mise en cluster (également appelée apprentissage sans supervision) est le processus de division d’un jeu de données en groupes, de sorte que les membres de chaque groupe soient aussi similaires les uns des autres que possible et que les différents groupes soient aussi dissimilaires les uns des autres que possible.

Élément de modèle

<ClusteringModel functionName="clustering" ...

Fonctions non prises en charge

Les modèles de mise en cluster avec l'élément <MiningSchema> contenant une référence à un élément <DerivedField> ne sont pas pris en charge.

Sorties de modèle


Fonctionnalités de sortie de modèle prises en charge	Description
predictedValue	Meilleur cluster de mise en correspondance basé sur la distance ou la mesure de similarité utilisée pour la mise en cluster.
transformedValue	Valeur générée via une expression de transformation appliquée à la sortie de modèle prédite.
decision	Valeur générée via une expression appliquée à la sortie de modèle prédite résultant en une valeur catégorisée.
predictedDisplayValue	Valeur lisible par l'homme utilisée pour représenter la valeur prédite à partir du modèle.

entityId	S’il est présent, index basé sur 1 (identifiant implicite) du cluster gagnant/prédit.
affinity	Valeur de la distance ou de la similarité de l’enregistrement fourni au cluster prédit tel que défini dans le modèle.