📘

データ前処理 - 休日情報抽出

 

休日情報抽出とは?

データの時刻カラムの日時から休日(土日祝)を抽出し、説明変数に追加します。
休日情報を抽出し説明変数に加えることで、平日/休日の違いで変化するデータの予測がしやすくなり精度が向上する場合があります。 例えば平日と休日によって需要の偏りがある需要予測などの課題に適用することが有効です。

休日情報抽出カードの操作方法

結線

処理対象データを結線してください。

パラメータの設定

休日は国やエリアによって異なるため、時刻がどの国・エリアのものであるかを設定する必要があります。
設定項目説明追加されるカラム名
休日を抽出する国・エリアデータ内の時刻の国・エリアを設定します。国/エリアにより休日の抽出結果が異なります。時刻カラム名 + “_” + 国・エリア名 + “_holiday”
例えば国・エリアを “Japan” と指定し、時刻カラム名が “Date” である場合、 “Date_Japan_holiday” というカラムが追加されます。 そのカラムは、日本における休日に該当する時刻のレコードが1、それ以外のレコードが0となります。
 
⚠️
日本における休日の判定誤りについて
国・エリアを “Japan” に設定した場合、以下の日が本来平日であるところが休日と判定されることがわかっています。
月日
1950年1月2日1月16日
1951年4月30日
1952年11月24日
1954年3月22日
1956年1月2日1月16日4月30日9月24日
1957年5月6日11月4日
1958年11月24日
1960年3月21日
1961年1月2日1月16日
1962年4月30日9月24日
1963年5月6日11月4日
1965年3月22日
1967年1月2日1月16日9月25日
1968年2月12日5月6日9月16日11月4日
1969年11月24日
1971年3月22日10月11日

実行

  • パラメーターに従い休日情報の抽出処理が行われます。
  • 抽出と説明変数への追加が成功すると、メッセージが表示されます。
  • 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。

処理結果の確認

テーブルタブを見ると、休日情報の説明変数のカラムが追加されていることが確認できます。 休日は1、休日以外の日は0となります。