クラスタ化

PMML クラスタ化モデルは、特定のレコードに対して最適なマッチングクラスタを決定します。この決定は、クラスタリングに使用される距離または類似性の尺度に基づいて行われます。クラスタは、類似するデータのサブセットです。クラスタリング (教師なし学習とも呼ばれます) は、データセットをグループに分割する処理です。グループのメンバーはできるだけ似たものになるように選択され、また異なるグループどうしはできるだけ似ていないものになるように選択されます。

モデル要素

<ClusteringModel functionName="clustering" ...

サポートされない機能

<DerivedField> 要素への参照を含む <MiningSchema> 要素を持つクラスタリングモデルはサポートされていません。

モデル出力

サポートされるモデル出力機能	説明
predictedValue	クラスタリングに使用される距離または類似性の尺度に基づいて決定される最適なマッチングクラスタ。
transformedValue	予測モデル出力に適用された変換式によって生成された値。
decision	分類値となった予測モデル出力に適用された式によって生成された値。
predictedDisplayValue	モデルからの予測値を表現するために使用される、人間が判読可能な値。

entityId	存在する場合は、ウィニング/予測クラスタの 1 ベースのインデックス (暗黙的識別子)。
affinity	与えられたレコードからモデルに定義されている予測クラスタへの距離または類似性の値。