クラスタ化

PMML クラスタ化モデルは、特定のレコードに対して最適なマッチング クラスタを決定します。この決定は、クラスタリングに使用される距離または類似性の尺度に基づいて行われます。クラスタは、類似するデータのサブセットです。クラスタリング (教師なし学習とも呼ばれます) は、データセットをグループに分割する処理です。グループのメンバーはできるだけ似たものになるように選択され、また異なるグループどうしはできるだけ似ていないものになるように選択されます。

モデル要素

<ClusteringModel functionName="clustering" ...

サポートされない機能

<DerivedField> 要素への参照を含む <MiningSchema> 要素を持つクラスタリング モデルはサポートされていません。

モデル出力

サポートされるモデル出力機能 説明
predictedValue クラスタリングに使用される距離または類似性の尺度に基づいて決定される最適なマッチング クラスタ。
transformedValue 予測モデル出力に適用された変換式によって生成された値。
decision 分類値となった予測モデル出力に適用された式によって生成された値。
predictedDisplayValue モデルからの予測値を表現するために使用される、人間が判読可能な値。
   
entityId 存在する場合は、ウィニング/予測クラスタの 1 ベースのインデックス (暗黙的識別子)。
affinity 与えられたレコードからモデルに定義されている予測クラスタへの距離または類似性の値。