📘
モデル開発 - FastGSCADモデルの設計
FastGSCADとは
FastGSCADは、Group Smoothly Clipped Absolute Deviation(以下、GSCAD)を高速化したアルゴリズムです。
本モデルは、 LassoやSparse Group Lasso(以下、SGL)と同様に、不要な変数を除外し、有用な変数のみを自動的に選択するスパースモデリング技術の一種です。
GSCADは、特徴量にグループ構造を持つデータに対して、グループ単位での正則化を行うことで重要な特徴グループを選択する手法です。
Lassoと比べて、グループ全体の関連性を考慮できるため、意味のある特徴のまとまりをより適切に抽出できます。
また、SGLと比較して、重要な特徴グループの影響を必要以上に小さく見積もることなく、不要なグループだけを効果的に除外できる点が特長です。
Node-AIでは、1つのカラム(説明変数)を1つのグループとして自動で設定します。
例えば、説明変数としてカラムA~Eのデータがあり、モデル準備 - 時間窓切り出し カードにより窓幅を5に設定したとします。
この設定では、各カラムについて直近5時点(時刻1〜5)のデータが特徴量となるため、全体で5カラム × 5時点 = 25個の特徴量をモデルに入力することになります。
GSCADでは、各カラムに対応する5時点分の特徴量を1つのグループとみなし、どのグループを使用するかを自動で選択します。
以下の図の例では、カラムAとBが選択されています。
この場合、GSCADはカラムAとBに対応する計10時点分の特徴量を活用し、その重みを比較的高い精度で推定することができます。

一方、LassoやSGLの場合、カラムAとBの計10時点分の特徴量に過小な重みをつけてしまい、予測精度が低下する恐れがあります。
FastGSCADの特徴
- 大規模なデータに対しても比較的高速に学習することができます。 特に、LassoやFastSGLと比較して高速に学習できます。
- (Node-AIでは1カラムが1グループとして設定されるため)重要なカラムのみを特徴量として選択するように学習されます。
FastGSCADとLasso/FastSGLの比較表
項目 | FastGSCAD | Lasso | FastSGL |
特徴量の選択方法 | カラム単位で選択 | 個々の特徴量で選択 | カラム単位と個々の特徴量の両方を柔軟に考慮しながら選択 |
オラクル性 | 有 | 無 | 無 |
学習スピード | ◎ | △ | ○ |
有効場面の一例 | 多くのカラムがある中で、売上に影響を与える重要なカラムを比較的正しく絞り込みつつ、かつ予測精度もある程度担保した売上予測モデルを構築したい場面 | 過去の複数時点にわたる特徴量の中から、各カラムを意識せず、1つ1つのタイミングごとにどの特徴量が売上に効いているかを見極めて選択したい場面 | 売上に影響を与えるカラムとその過去のタイミングをバランス良く選定したい場面 |
オラクル性とは
直感的には、データ数が十分多いときに、重要な変数を正しく選択し、その変数を用いて重みを正確に推定する性質を意味します。GSCADはオラクル性を有していますが、LassoおよびSGLはこの性質を持っていません。そのため、データ数がいくら多くとも、重要な変数を選べなかったり、推定された重みが正確でない場合があります。オラクル性のより厳密な解説は スパースモデリング(応用編)をご確認ください(外部サイトの「ごちきか」に遷移します)。
FastGSCADの活用例
FastGSCADの要因分析では、各特徴量の重みがヒートマップで表示されるため、特定のカラムに集中して値が強くなる傾向が確認できます。
FastGSCADカードの操作方法
各種パラメータの設定
パラメータ名 | 概要 |
lamb | 特徴選択(正則化)の強度を設定します。値が大きいほど、少数のカラムを重要視するように動作します。Lasso における alpha やFastSGLにおけるrhoに相当します。 |
設計の保存
- “実行” ボタンを押して、設定を保存します。
- 設定内容に矛盾が存在する場合は、エラーが表示されます。
- 処理時間が 5 分を超えるとタイムアウトし、処理が強制終了されます。この場合は再度実行をお試しください。再度実行しても結果が表示されない場合は、お手数ですが Node-AI サポートへお問い合わせください。