Clustering

Ein PMML-Clustering-Modell bestimmt das am besten übereinstimmende Cluster für einen angegebenen Datensatz, basierend auf dem im Cluster verwendeten Maß für Entfernung oder Ähnlichkeit. Ein Cluster ist eine Teilmenge mit ähnlichen Daten. Clustering (auch bekannt als unüberwachtes Lernen) ist der Prozess, bei dem ein Dataset in Gruppen aufgeteilt wird, sodass die Mitglieder jeder Gruppe einander so ähnlich wie möglich sind und unterschiedliche Gruppen sich so viel wie möglich voneinander unterscheiden.

Modellelement

<ClusteringModel functionName="clustering" ...

Nicht unterstützte Features

Clustering-Modelle mit dem Element <MiningSchema>, das einen Verweis auf ein Element <DerivedField> enthält, werden nicht unterstützt.

Modellausgaben

Unterstützte Features für Modellausgaben Beschreibung
predictedValue Dies ist das am besten übereinstimmende Cluster, basierend auf dem im Cluster verwendeten Maß für Entfernung oder Ähnlichkeit.
transformedValue Dies ist ein Wert, der über einen auf die vorhergesagte Modellausgabe angewendeten Transformationsausdruck generiert wird.
decision Dies ist ein Wert, der über einen auf die vorhergesagte Modellausgabe angewendeten Ausdruck generiert wird, der einen kategorisierten Wert ergibt.
predictedDisplayValue Dies ist der visuell lesbare Wert, der zur Anzeige des vom Modell vorhergesagten Wertes verwendet wird.
   
entityId Dies ist der bei 1 startenden Index (implizite Identifikation) des vorhergesagten Ergebnisclusters.
affinity Dies ist der Wert der Entfernung oder der Ähnlichkeit des angegebenen Datensatzes bezüglich des vorhergesagten Clusters, wie er im Modell definiert wird.