📘
データ可視化 - 自己相関分析
自己相関分析とは?
自己相関分析は、変数ごとの周期性を確認するために必要なカードです。
定常性を確認し、適切な時間窓を設定するために役に立ちます。
例えば、日曜日は利用者が多いといった性質がある場合に、その性質を可視化します。
自己相関分析カードの操作方法
結線
対象データを結線してください。
パラメータの設定

設定項目 | 任意/必須 | 初期値 | 説明 |
---|---|---|---|
アルゴリズム | 必須 | 無し | 自己相関又は偏自己相関を選択 |
※分析するカラム | 必須 | 無し | 相関分析適用の対象カラム |
解析幅 | 必須 | 10 | どれだけの差分を取って解析を行うか |
※「分析するカラム」は処理データに結線した際に現れます
実行

- “実行”ボタンを押してください。
- 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。
自己相関分析の結果の確認

- 上の図は公開データである「シェアサイクル利用の総台数予測(クイックスタート用)」において、“自転車の総利用台数”の自己相関を可視化した結果です。
- 遅れ幅ごとの相関の推移が、青い棒グラフで表示されます。また、グラフ上で上側と下側にピークになっている部分について、それぞれオレンジ背景色のラベルで、ピーク時の遅れ幅(x軸の値)と相関の値(y軸)が表示されます。
- 例えば、上の図の例では、”自転車の総利用台数”と、”自転車の総利用台数”を24レコード分遅らせたものの相関が、約0.815であるという意味になります。
- このデータセットは1時間間隔のデータとなっているため、概ね24時間ごとのデータに強い正の相関があることが分かります。すなわち、前日の同じ時刻と類似した動きをするため、最低でも24時間分のデータを時間窓切り出しするとよいという示唆が得られます。