📘

データ可視化 - 自己相関分析

自己相関分析とは?

自己相関分析は、変数ごとの周期性を確認するために必要なカードです。 定常性を確認し、適切な時間窓を設定するために役に立ちます。
例えば、日曜日は利用者が多いといった性質がある場合に、その性質を可視化します。

自己相関分析カードの操作方法

結線

対象データを結線してください。

パラメータの設定

設定項目任意/必須初期値説明
アルゴリズム必須無し自己相関又は偏自己相関を選択
※分析するカラム必須無し相関分析適用の対象カラム
解析幅必須10どれだけの差分を取って解析を行うか
※「分析するカラム」は処理データに結線した際に現れます

実行

  • “実行”ボタンを押してください。
  • 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。

自己相関分析の結果の確認

  • 上の図は公開データである「シェアサイクル利用の総台数予測(クイックスタート用)」において、“自転車の総利用台数”の自己相関を可視化した結果です。
  • 遅れ幅ごとの相関の推移が、青い棒グラフで表示されます。また、グラフ上で上側と下側にピークになっている部分について、それぞれオレンジ背景色のラベルで、ピーク時の遅れ幅(x軸の値)と相関の値(y軸)が表示されます。
    • 例えば、上の図の例では、”自転車の総利用台数”と、”自転車の総利用台数”を24レコード分遅らせたものの相関が、約0.815であるという意味になります。
    • このデータセットは1時間間隔のデータとなっているため、概ね24時間ごとのデータに強い正の相関があることが分かります。すなわち、前日の同じ時刻と類似した動きをするため、最低でも24時間分のデータを時間窓切り出しするとよいという示唆が得られます。