Node-AIリソース
マニュアルアカデミーカスタムカードギャラリー公開レシピヘルプログイン新規登録
マニュアルアカデミーカスタムカードギャラリー公開レシピヘルプログイン新規登録
トップ/カスタムカードギャラリー/ワンホットエンコーディング(ダミー変数化)

ワンホットエンコーディング(ダミー変数化)

2024/7/31 17:292025/3/27 10:43
概要活用シーン動作上の注意点分析上の注意点コード入出力の例入力出力
 

概要

数字の大小に意味のないデータ(カテゴリカルデータ)の列を、0か1かだけの列に変換して、カラムを追加します。
参考文献: カテゴリカルデータ処理 - ごちきか

活用シーン

数値ではないデータを数値に変換して分析に活用できます。

動作上の注意点

  • COLUMNSに指定したカラム名が元のデータに含まれていない場合、エラーが発生します。
  • 予測カードを用いる場合、予測したいデータのカテゴリカルデータの列に学習データと同じ種類のカテゴリ(上の例では「みかん」「りんご」「パイナップル」の3つ)が現れないと、予測に失敗します。
  • 目的変数のカラムは削除できないため、目的変数以外のカラムに適用してください。

分析上の注意点

  • 多重共線性の問題を避けるため、出力されるカテゴリの列の数は元のカテゴリ(上の例では「みかん」「りんご」「パイナップル」の3つ)より1少ない(上の例では「りんご」「パイナップル」の2つ)設定になっています。詳しくは、以下の文献を参照してください。
    • ダミー変数化 - ごちきか

コード

入出力の例

入力

時刻売上商品
2023-12-01 00:002みかん
2023-12-01 01:004りんご
2023-12-01 02:006みかん
2023-12-01 03:001パイナップル
2023-12-01 04:0010みかん
2023-12-01 05:009りんご
2023-12-01 06:008みかん
2023-12-01 07:008パイナップル
2023-12-01 08:002りんご

出力

時刻売上商品_りんご商品_パイナップル
2023-12-01 00:00200
2023-12-01 01:00410
2023-12-01 02:00600
2023-12-01 03:00101
2023-12-01 04:001000
2023-12-01 05:00910
2023-12-01 06:00800
2023-12-01 07:00801
2023-12-01 08:00210
 
 
お問い合わせ
利用規約(PDF:1,527KB)
情報の外部送信について
プライバシーポリシー
 
Copyright © NTT Communications Corporation All Rights Reserved.