📘

データ可視化 - 相関分析

 

相関分析とは?

相関分析は変数間の線形関係の関連性を確認したいときに利用するカードです。 相関係数を可視化したもので値は-1から1の範囲で、1に近いほど正の相関が強く、-1に近いほど負の相関が強いことを示します。
また、目的変数と、ある説明変数の相関を可視化することで、説明変数がモデルの精度向上に寄与するかどうか分析することができます。

相関分析カードの操作方法

結線

対象データを結線してください。

パラメータの設定

設定項目任意/必須初期値説明
※適用カラム必須全てのカラム相関分析適用の対象カラム
「適用カラム」は処理データに結線した際に現れます

実行

  • “実行”ボタンを押してください。
  • 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。

相関分析の結果の確認

  • 上の図は公開データである「シェアサイクル利用の総台数予測(クイックスタート用)」において、目的変数に “非会員の自転車利用台数” を設定し、適用カラムには表示されている全てのカラムを選択した場合の相関分析の結果です。
  • この例では、目的変数に対して説明変数である “湿度” が負の相関が強いことがわかります。一方で、それ以外の説明変数は正の相関が強いことがわかります。