Aprendizaje no supervisado: Segmentación

La demostración del aprendizaje no supervisado de ciencia de datos le permite realizar la segmentación mediante los datos Gastos de consumo. Se utilizan numerosos archivos con los que se demuestra, en conjunto, la funcionalidad de la Solución de ciencia de datos de Spectrum™ Technology Platform en Enterprise Designer.

En Spectrum_DataScience_Unsupervised_Learning.zip se incluyen los siguientes archivos:
  • Spectrum_DataScience_Unsupervised_Learning.pdf: documentación en la que se entrega información sobre cómo crear y utilizar el flujo de datos principal, el subflujo, el flujo de datos para calificación y todos los archivos compatibles
  • Data.zip: los archivos de entrada y de salida requeridos para cada uno de los flujos de datos incluidos
    • Carpeta Input: los archivos de entrada requeridos para cada uno de los flujos de datos incluidos
    • Carpeta Output: los archivos de salida requeridos para cada uno de los flujos de datos incluidos
    • Carpeta PythonBased: archivos de entrada y de salida requeridos para utilizar el procesamiento Phyton opcional en vez de utilizar Group Statistics y las etapas Transformer en el flujo de datos principal
  • Consumer_Expenditure_Demo_DF_(v12.1).zip: los flujos de datos para Spectrum™ Technology Platform 12.1
    • ConsumerExpenditure_v121_sampleandcluster.df
    • ConsumerExpenditure_v121_sampleandcluster_subflow.df
    • ConsumerExpenditure_v121_score.df
    • ConsumerExpenditure_v121_subflow.df
    • Carpeta PythonBased: flujos de datos, flujos de procesos, secuencia de comandos bat, secuencia de comandos y documentación de Python requeridos para utilizar el procesamiento Phyton opcional en vez de utilizar Group Statistics y las etapas Transformer en el flujo de datos principal
  • Consumer_Expenditure_Demo_DF_(v12.2).zip: los flujos de datos para Spectrum™ Technology Platform 12.2
    • ConsumerExpenditure_v122_sampleandcluster.df
    • ConsumerExpenditure_v122_sampleandcluster_subflow.df
    • ConsumerExpenditure_v122_score.df
    • ConsumerExpenditure_v122_subflow.df
    • Carpeta PythonBased: flujos de datos, flujos de procesos, secuencia de comandos bat, secuencia de comandos y documentación de Python requeridos para utilizar el procesamiento Phyton opcional en vez de utilizar Group Statistics y las etapas Transformer en el flujo de datos principal
  • ReadMe.txt: descripciones e instrucciones de alto nivel para los archivos mencionados anteriormente.
Puede crear su propio flujo de datos si sigue las instrucciones de la documentación paso a paso o puede utilizar los flujos de datos que se incluyen como referencias para confirmar cómo deberían lucir las etapas individuales finalizadas y los flujos de datos como un todo.