Überwachtes Lernen: Kreditausfallvorhersage

Die Demonstration für das überwachte Lernen von Data Science führt die Kreditausfallvorhersage mithilfe von Lending Club-Daten durch. Es nutzt mehrere Dateien, die zusammen die Funktion der Data Science Solution der Spectrum™-Technologieplattform in Enterprise Designer demonstrieren.

„Spectrum_DataScience_Supervised_Learning.zip“ beinhaltet folgende Dateien:
  • Spectrum_DataScience_Supervised_Learning.pdf: Eine Dokumentation, die Sie durch die Erstellung und Verwendung des Datenflusses des einzelnen Kategorisierungsmoduls, des Bewertungsdatenflusses und aller unterstützenden Dateien führt.
  • Data.zip: Die erforderlichen Eingabedateien, Testdateien und Trainingsdateien für jeden der enthaltenen Datenflüsse.
    • loan.csv
    • LoanStats_2016Q1.csv
    • LoanStats_2016Q2.csv
    • LoanStats_2016Q3.csv
    • testData.txt
    • testDataCollege.txt
    • testDataStable.txt
    • testDataThankful.txt
    • trainData.txt
    • trainDataCollege.txt
    • trainDataStable.txt
    • trainDataThankful.txt
    • training.xml
    • trainingCollege.xml
    • trainingStable.xml
    • trainingThanks.xml
  • Lending_Club_Demo_DF_(V12.1).zip: Die Datenflüsse für die Spectrum™-Technologieplattform 12.1:
    • LendingClub_2007_2016Q12_v121_MultipleCategorizers.df
    • LendingClub_2007_2016Q1Q2_v121_SingleCategorizer.df
    • LendingClub_2016Q3_v121_SingleCategorizer_Scoring.df
  • Lending_Club_Demo_DF_(V12.2).zip: Die Datenflüsse für die Spectrum™-Technologieplattform 12.2:
    • LendingClub_2007_2016Q12_v122_MultipleCategorizers.df
    • LendingClub_2007_2016Q1Q2_v122_SingleCategorizer.df
    • LendingClub_2016Q3_v122_SingleCategorizer_Scoring.df
  • ReadMe.txt: Umfangreiche Beschreibungen und Anweisungen für die zuvor genannten Dateien.
Sie können Ihren eigenen Datenfluss erstellen, indem Sie die Schritt-für-Schritt-Anweisungen in der Dokumentation befolgen, oder Sie können die enthaltenen Datenflüsse als Referenzen verwenden, um zu bestätigen, wie die einzelnen abgeschlossenen Schritte und Datenflüsse insgesamt aussehen sollten.