📘

データ前処理 - 主成分分析

 

主成分分析とは?

⚠️
機能制限について
主成分分析は環境によってはご利用いただけません。
説明変数に主成分分析(PCA)を適用し、カラム数を削減します。 主成分分析では削減後のカラム数のことを「次元数」とも呼び、次元数を削減することでデータを単純化することができます。
主成分分析の適用により説明変数を低次元に圧縮し、モデルの精度向上や学習時間の短縮が期待できることがあります。
なお、主成分分析は各説明変数のスケールに依存した変換がされるため、主成分分析の適用前に📘データ前処理 - 正規化 の適用を強く推奨します。
⚠️
制限について
主成分分析カードは1つのツリー内(データから学習カードまでの一連のフロー)に1つだけ使用することができます。
また 📘モデル評価 - 要因分析 では主成分分析前のカラムに逆変換されたものが可視化されますが、主成分分析カード以降にカラム数を増減させた場合には主成分分析カードで出力された説明変数で可視化が行われます。

主成分分析カードの操作方法

結線

処理対象データを結線してください。

パラメータの設定

設定項目説明
変換後の説明変数の次元数主成分分析後の説明変数の次元数を正の整数値で指定します。元の説明変数の数よりも大きな数値にすることはできません。

実行

  • パラメーターに従い主成分分析が行われます。
  • 処理が成功すると、メッセージが表示されます。
  • 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。

処理結果の確認

  • 主成分分析で変換された説明変数のカラム名は “主成分_1”, “主成分_2”, … のように変更されます。
  • 主成分_1, 主成分_2, … の順に第一主成分、第二主成分、… を示しています。
  • 必要に応じて、表形式、統計量、グラフ形式で分割結果を確認してください。