Unüberwachtes Lernen: Segmentierung

Die Demonstration für das unüberwachte Lernen von Data Science führt die Segmentierung anhand von Consumer Expenditure-Daten durch. Es nutzt mehrere Dateien, die zusammen die Funktion der Data Science Solution der Spectrum™-Technologieplattform in Enterprise Designer demonstrieren.

„Spectrum_DataScience_Unsupervised_Learning.zip“ beinhaltet folgende Dateien:
  • Spectrum_DataScience_Unsupervised_Learning.pdf: Eine Dokumentation, die Sie durch die Erstellung und Verwendung des primären Datenflusses, des Unterflusses, des Bewertungsdatenflusses und aller unterstützenden Dateien führt.
  • Data.zip: Die erforderlichen Eingabe- und Ausgabedateien für jeden der enthaltenen Datenflüsse
    • Eingabeordner: Die erforderlichen Eingabedateien für jeden der enthaltenen Datenflüsse
    • Ausgabeordner: Die erforderlichen Ausgabedateien für jeden der enthaltenen Datenflüsse
    • PythonBased-Ordner: Die erforderlichen Eingabe- und Ausgabedateien zur Verwendung der optionalen Python-Verarbeitung anstelle von Group Statistics- und Transformer-Schritten im primären Datenfluss
  • Consumer_Expenditure_Demo_DF_(v12.1).zip: Die Datenflüsse für die Spectrum™ Technology Platform 12.1
    • ConsumerExpenditure_v121_sampleandcluster.df
    • ConsumerExpenditure_v121_sampleandcluster_subflow.df
    • ConsumerExpenditure_v121_score.df
    • ConsumerExpenditure_v121_subflow.df
    • PythonBased-Ordner: Die erforderlichen Datenflüsse und Prozessflüsse sowie das Bat-Skript, das Python-Skript und die Dokumentation zur Verwendung der optionalen Python-Verarbeitung anstelle von Group Statistics- und Transformer-Schritten im primären Datenfluss
  • Consumer_Expenditure_Demo_DF_(v12.2).zip: Die Datenflüsse für die Spectrum™ Technology Platform 12.2
    • ConsumerExpenditure_v122_sampleandcluster.df
    • ConsumerExpenditure_v122_sampleandcluster_subflow.df
    • ConsumerExpenditure_v122_score.df
    • ConsumerExpenditure_v122_subflow.df
    • PythonBased-Ordner: Die erforderlichen Datenflüsse und Prozessflüsse sowie das Bat-Skript, das Python-Skript und die Dokumentation zur Verwendung der optionalen Python-Verarbeitung anstelle von Group Statistics- und Transformer-Schritten im primären Datenfluss
  • ReadMe.txt: Umfangreiche Beschreibungen und Anweisungen für die zuvor genannten Dateien.
Sie können Ihren eigenen Datenfluss erstellen, indem Sie die Schritt-für-Schritt-Anweisungen in der Dokumentation befolgen, oder Sie können die enthaltenen Datenflüsse als Referenzen verwenden, um zu bestätigen, wie die einzelnen abgeschlossenen Schritte und Datenflüsse insgesamt aussehen sollten.