教師あり学習: 貸付返済不能予測
Data Science の教師あり学習デモは、Lending Club データを使用して貸付返済不能予測を実施します。このデモでは、Spectrum™ Technology Platform の Data Science ソリューションの機能を Enterprise Designer で示すための複数のファイルを利用します。
Spectrum_DataScience_Supervised_Learning.zip には、以下のファイルが含まれています。
- Spectrum_DataScience_Supervised_Learning.pdf — 単一カテゴライザのデータフロー、スコアリング データフロー、すべてのサポートを作成して使用する方法を紹介しているドキュメントです。
- Data.zip — 必須の入力ファイル、テスト ファイル、トレーニング ファイルが付属のデータフローごとに用意されています。
- loan.csv
- LoanStats_2016Q1.csv
- LoanStats_2016Q2.csv
- LoanStats_2016Q3.csv
- testData.txt
- testDataCollege.txt
- testDataStable.txt
- testDataThankful.txt
- trainData.txt
- trainDataCollege.txt
- trainDataStable.txt
- trainDataThankful.txt
- training.xml
- trainingCollege.xml
- trainingStable.xml
- trainingThanks.xml
- Lending_Club_Demo_DF_(V12.1).zip — Spectrum™ Technology Platform 12.1 用のデータフロー
- LendingClub_2007_2016Q12_v121_MultipleCategorizers.df
- LendingClub_2007_2016Q1Q2_v121_SingleCategorizer.df
- LendingClub_2016Q3_v121_SingleCategorizer_Scoring.df
- Lending_Club_Demo_DF_(V12.2).zip — Spectrum™ Technology Platform 12.2 用のデータフロー
- LendingClub_2007_2016Q12_v122_MultipleCategorizers.df
- LendingClub_2007_2016Q1Q2_v122_SingleCategorizer.df
- LendingClub_2016Q3_v122_SingleCategorizer_Scoring.df
- ReadMe.txt — これまでに述べたファイルに関する大まかな説明と手順です。
ドキュメントの手順ごとの詳細な説明に従って独自のデータフローを作成できます。付属のデータフローを参考にして、各ステージおよびデータフローを全体としてどのように完成させればよいか確認することもできます。