📘

トップ/マニュアル/📘データ前処理 - カスタム前処理

データ前処理 - カスタム前処理

2024/8/16 15:162025/12/19 17:23

カスタム前処理とは？予測モードの場合異常検知モードの場合カスタム前処理カードの操作方法結線実行コードの設定カスタム前処理で利用可能なライブラリ実行処理結果の確認

カスタム前処理とは？

💡

カスタムカードギャラリー

カスタム前処理でどのようなコードを書けばいいかお悩みでしょうか？

Node-AI では、データサイエンティストが作成した様々なライブラリを紹介するカスタムカードギャラリーを用意しています。

カスタムカードを自由に組み合わせ、ユニークなデータ処理パイプラインを構築しましょう！

データの前処理を任意の Python コードの実行により行います。

カスタム前処理カードに入力されたデータは形式のパラメータで参照できます。この入力データを指定された関数内で処理し、形式で返却すると出力できます。

例えば、独自の補間処理やカラム間の演算といった処理に利用されることを想定しています。

実行コード内でカラムの追加や削除をした場合、予測モード/異常検知モードによって挙動が異なります。

予測モードの場合

カラムの追加をした場合は、説明変数として追加されます。

目的変数のカラムを削除はできません。

目的変数が説明変数に含まれている場合。

目的変数を参照した処理ができます。

目的変数が説明変数に含まれていない場合。

目的変数自体の値の変更は可能ですが、目的変数の値を利用して説明変数の値を変更は出来ません(推論アプリケーション Node-AI Berry で推論する際に目的変数は 0 として扱われます)。

異常検知モードの場合

カラムの追加をした場合は、説明変数と目的変数の両方に追加されます

カラムを削除すると、説明変数と目的変数の両方から削除されます

その他、カスタム前処理の影響範囲は以下となります。

実行コードはレシピに反映されます

カスタム前処理が実行された履歴は実験管理には表示されません

学習モデルダウンロード時の前処理パイプラインに実行コードが保存されます

カスタム前処理カードの操作方法

結線

対象データを結線してください。

実行コードの設定

初期状態では「コード」タブの左領域にの関数定義との返り値定義がされています。引数である df(形式) を入力データとし、返却されたデータ(形式)が前処理結果として利用されます。

入力データと文の間に実行コードを設定することで、独自の前処理を記述できます。

カスタム前処理で利用可能なライブラリ

利用可能なライブラリと利用方法は以下のとおりです。

実行

設定した実行コードに従い前処理が行われます。

処理が成功すると、メッセージが表示されます。

実行コードに標準出力処理（文など）があれば、「コード」タブ右領域に表示されます。

実行コードに文法的なエラーがある場合も右領域に表示されます（一部のエラーはメッセージ領域に表示されます）。

処理時間が 20 分を超えるとタイムアウトし、処理が強制終了されます。

処理結果の確認

必要に応じて、表形式、統計量、グラフ形式で結果を確認してください（統計タブやグラフタブから確認できます）。