Agrupación en clústeres
Un modelo de agrupación en clústeres PMML determina el mejor clúster de cruce para un registro determinado basado en la distancia o medida de semejanza utilizada para la agrupación en clústeres. Un clúster es un subconjunto de datos similares. Una agrupación en clústeres (también conocida como aprendizaje sin supervisión) es el proceso de dividir un conjunto de datos en grupos, donde los miembros de cada uno sean lo más parecidos entre sí que sea posible y los grupos diferentes sean lo más distintos entre sí como se pueda.
Elemento modelo
<ClusteringModel functionName="clustering" ...
Características no compatibles
No se admiten los modelos de agrupación en clústeres con el elemento <MiningSchema> que contienen una referencia al elemento <DerivedField>.
Modelo de salidas
Características compatibles del modelo de salida | Descripción |
---|---|
predictedValue | El mejor clúster de cruce basado en la medida de distancia o semejanza utilizada para la agrupación en clústeres. |
transformedValue | Un valor generado a través de una expresión de transformación aplicada al modelo de salida previsto. |
decision | Un valor generado a través de una expresión aplicada al modelo de salida previsto, lo que da como resultado un valor categorizado. |
predictedDisplayValue | El valor legible por humanos que se usa para representar el valor previsto desde el modelo. |
entityId | Si está presente, el índice basado en 1 (identificador implícito) del clúster ganador/previsto. |
affinity | El valor de la distancia o la semejanza del registro proporcionado al clúster previsto conforme se define en el modelo. |