Configuración de opciones básicas

  1. Deje marcada la opción Estandarizar campos de entrada para estandarizar las columnas numéricas a fin de que la variación media y por unidad sea igual a cero.
    Si no utiliza la estandarización, los resultados podrían incluir componentes dominados por variables que aparentarán tener variaciones mayores en relación con otros atributos como una cuestión de escala y no como una contribución verdadera.
  2. Revise el Número estimado de agrupamiento para hacer que el algoritmo de K-Means intente determinar el número de agrupamiento que contendrá el modelo. Aunque designe el número de agrupamiento deseado en la pestaña Propiedades del modelo, la rutina podría descubrir durante su procesamiento que un número de agrupamiento diferente resulta más apropiado en vista de los datos.
  3. Especifique un valor entre 1 y 100 como Porcentaje para datos de capacitación cuando los datos de entrada se dividen aleatoriamente en muestras de datos de capacitación y de prueba.
  4. Ingrese el valor de 100 menos la cantidad que ingresó en el Paso 5 como Porcentaje para datos de prueba.
  5. Ingrese un número en Propagar para muestras para garantizar que cuando los datos se dividan en datos de prueba y de capacitación, esto ocurra siempre de la misma manera cada vez que ejecute el flujo de datos. Deje “0” en este campo para obtener una división aleatoria cada vez que ejecuta el flujo.
  6. Haga clic en Aceptar para guardar el modelo y la configuración, o continúe a la ficha siguiente.