Agrupación en clústeres

Un modelo de agrupación en clústeres PMML determina el mejor clúster de cruce para un registro determinado basado en la distancia o medida de semejanza utilizada para la agrupación en clústeres. Un clúster es un subconjunto de datos similares. Una agrupación en clústeres (también conocida como aprendizaje sin supervisión) es el proceso de dividir un conjunto de datos en grupos, donde los miembros de cada uno sean lo más parecidos entre sí que sea posible y los grupos diferentes sean lo más distintos entre sí como se pueda.

Elemento modelo

<ClusteringModel functionName="clustering" ...

Características no compatibles

No se admiten los modelos de agrupación en clústeres con el elemento <MiningSchema> que contienen una referencia al elemento <DerivedField>.

Modelo de salidas

Características compatibles del modelo de salida	Descripción
predictedValue	El mejor clúster de cruce basado en la medida de distancia o semejanza utilizada para la agrupación en clústeres.
transformedValue	Un valor generado a través de una expresión de transformación aplicada al modelo de salida previsto.
decision	Un valor generado a través de una expresión aplicada al modelo de salida previsto, lo que da como resultado un valor categorizado.
predictedDisplayValue	El valor legible por humanos que se usa para representar el valor previsto desde el modelo.

entityId	Si está presente, el índice basado en 1 (identificador implícito) del clúster ganador/previsto.
affinity	El valor de la distancia o la semejanza del registro proporcionado al clúster previsto conforme se define en el modelo.