プロファイリング結果におけるテーブルの詳細情報
左ペインでいずれかのテーブル名をクリックすると、以下の詳細情報が表示されます。
- 完全性: プロファイル データで検出された完全な行と不完全な行の割合
- テーブル サマリ: テーブル内の各テーブルの詳細
- 列名: テーブル内のすべての列の名前
- データ タイプ: 列内のデータ タイプ
- 完全性 (%): 列内のレコードの完全性
- 一意性: 列に含まれるデータの一意性
- 検出されたタイプ: この列の文字列内で検出されたメール アドレス、電話番号、都市、姓、名などの意味型を表示します。
- その他の統計: 最小長、最大長、テキスト パターンなど、その他さまざまな統計を表示します。
- NULL 出現頻度: テーブルのすべての行の中の null 値の数
異常値の表示
[異常値分析] タブをクリックすると、検出された異常値のサマリをテーブルの各列で表示できます。このタブには、他の観測データの範囲から外れている列のパターン、値、長さ、度数のカテゴリ別件数が表示されます。
例えば、国名に使用できる文字数は最大 14 文字で、データ内に 15 文字の文字列が検出されると、その文字列は [長さの異常値] に分類されます。サポートされているカテゴリは、長さの異常値、度数の異常値、テキスト パターンの異常値、数値の異常値、意味型の異常値、データ タイプの異常値です。
形式に誤りのあるレコードの表示
[フラット ファイルプロファイリング]で、[形式に誤りのあるレコード] タブをクリックすると、テーブル内の形式に誤りのあるレコードを表示できます。このタブには、形式の誤りのあるレコードのカテゴリおよび個数が表示されます。レコードは、次のカテゴリの形式誤りとして処理されます。
- 定義された列の数よりもフィールドの数が少ない行
- 定義された列の数よりもフィールドの数が多い行
[カテゴリ] をクリックして、形式に誤りのあるレコードのプレビューを表示することもできます。このプレビューには、レコード番号、レコード、形式誤りとしてレコードが分類された理由が表示されます。