📘
データ前処理 - 休日情報抽出
休日情報抽出とは?
データの時刻カラムの日時から休日(土日祝)を抽出し、説明変数に追加します。
休日情報を抽出し説明変数に加えることで、平日/休日の違いで変化するデータの予測がしやすくなり精度が向上する場合があります。
例えば平日と休日によって需要の偏りがある需要予測などの課題に適用することが有効です。
休日情報抽出カードの操作方法
結線
処理対象データを結線してください。
パラメータの設定
休日は国やエリアによって異なるため、時刻がどの国・エリアのものであるかを設定する必要があります。
設定項目 | 説明 | 追加されるカラム名 |
---|---|---|
休日を抽出する国・エリア | データ内の時刻の国・エリアを設定します。国/エリアにより休日の抽出結果が異なります。 | 時刻カラム名 + “_” + 国・エリア名 + “_holiday” |
例えば国・エリアを “Japan” と指定し、時刻カラム名が “Date” である場合、 “Date_Japan_holiday” というカラムが追加されます。
そのカラムは、日本における休日に該当する時刻のレコードが1、それ以外のレコードが0となります。
日本における休日の判定誤りについて
国・エリアを “Japan” に設定した場合、以下の日が本来平日であるところが休日と判定されることがわかっています。
年 | 月日 | |||
---|---|---|---|---|
1950年 | 1月2日 | 1月16日 | ||
1951年 | 4月30日 | |||
1952年 | 11月24日 | |||
1954年 | 3月22日 | |||
1956年 | 1月2日 | 1月16日 | 4月30日 | 9月24日 |
1957年 | 5月6日 | 11月4日 | ||
1958年 | 11月24日 | |||
1960年 | 3月21日 | |||
1961年 | 1月2日 | 1月16日 | ||
1962年 | 4月30日 | 9月24日 | ||
1963年 | 5月6日 | 11月4日 | ||
1965年 | 3月22日 | |||
1967年 | 1月2日 | 1月16日 | 9月25日 | |
1968年 | 2月12日 | 5月6日 | 9月16日 | 11月4日 |
1969年 | 11月24日 | |||
1971年 | 3月22日 | 10月11日 |
実行
- パラメーターに従い休日情報の抽出処理が行われます。
- 抽出と説明変数への追加が成功すると、メッセージが表示されます。
- 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。
処理結果の確認
テーブルタブを見ると、休日情報の説明変数のカラムが追加されていることが確認できます。
休日は1、休日以外の日は0となります。