Aprendizaje supervisado: Predicción de probabilidad de incumplimiento

La demostración de aprendizaje supervisado de ciencia de datos le permite realizar la predicción predeterminada de la probabilidad de incumplimiento con los datos de Lending Club. Se utilizan numerosos archivos con los que se demuestra, en conjunto, la funcionalidad de la Solución de ciencia de datos de Spectrum™ Technology Platform en Enterprise Designer.

En Spectrum_DataScience_Supervised_Learning.zip se incluyen los siguientes archivos:
  • Spectrum_DataScience_Supervised_Learning.pdf: documentación en la que se entrega información sobre cómo crear y utilizar el flujo de datos único para categorización, el flujo de datos para calificación y todos los archivos compatibles.
  • Data.zip: los archivos de entrada, de prueba y de capacitación requeridos para cada flujo de datos incluido.
    • loan.csv
    • LoanStats_2016Q1.csv
    • LoanStats_2016Q2.csv
    • LoanStats_2016Q3.csv
    • testData.txt
    • testDataCollege.txt
    • testDataStable.txt
    • testDataThankful.txt
    • trainData.txt
    • trainDataCollege.txt
    • trainDataStable.txt
    • trainDataThankful.txt
    • training.xml
    • trainingCollege.xml
    • trainingStable.xml
    • trainingThanks.xml
  • Lending_Club_Demo_DF_(V12.1).zip: el flujos de datos para Spectrum™ Technology Platform 12.1.
    • LendingClub_2007_2016Q12_v121_MultipleCategorizers.df
    • LendingClub_2007_2016Q1Q2_v121_SingleCategorizer.df
    • LendingClub_2016Q3_v121_SingleCategorizer_Scoring.df
  • Lending_Club_Demo_DF_(V12.2).zip: el flujos de datos para Spectrum™ Technology Platform 12.2.
    • LendingClub_2007_2016Q12_v122_MultipleCategorizers.df
    • LendingClub_2007_2016Q1Q2_v122_SingleCategorizer.df
    • LendingClub_2016Q3_v122_SingleCategorizer_Scoring.df
  • ReadMe.txt: descripciones e instrucciones de alto nivel para los archivos mencionados anteriormente.
Puede crear su propio flujo de datos si sigue las instrucciones de la documentación paso a paso o puede utilizar los flujos de datos que se incluyen como referencias para confirmar cómo deberían lucir las etapas individuales finalizadas y los flujos de datos como un todo.