📘

トップ/マニュアル/📘データ前処理 - AIアシスト付きカスタム前処理

データ前処理 - AIアシスト付きカスタム前処理

2025/5/2 11:202025/6/24 19:05

AIアシスト付きカスタム前処理とは？AIアシスト付きカスタム前処理カードの操作方法結線実行コードの設定実行処理結果の確認

AIアシスト付きカスタム前処理とは？

AIアシスト付きカスタム前処理カードは、カスタム前処理カード（📘データ前処理 - カスタム前処理）に、生成AIによる補助機能を付与したカードです。

カスタム前処理カードと同様に、データの前処理を任意の Python コードの実行により行いますが、その Python コードの作成を、自然言語によるプロンプトから自動変換で行うことができます。

⚠️

生成AIは不正確なコードを出力することがあるため、出力されたコードを再確認するようにしてください。また、前処理と無関係な指示を入力に入れた場合、正しくコードが出力されないことがあります。

生成AI は Python コードの作成補助の目的でのみ使われており、カードの実行中には用いられません。（そのため、一度作成済みの学習フローを使ってオフライン環境下で推論させる場合にも、このカードを含んでいても問題なく利用できます）

カスタム前処理と同様に、AIアシスト付きカスタム前処理でも以下のような制約があります。

教師あり学習タスクの場合

カラムの追加をした場合は、説明変数として追加されます。
目的変数のカラムを削除はできません。
目的変数が説明変数に含まれている場合。

目的変数を参照した処理ができます。

目的変数が説明変数に含まれていない場合。

目的変数自体の値の変更は可能ですが、目的変数の値を利用して説明変数の値を変更は出来ません(推論アプリケーション Node-AI Berry で推論する際に目的変数は 0 として扱われます)。

教師なし学習タスクの場合

カラムの追加をした場合は、説明変数と目的変数の両方に追加されます
カラムを削除すると、説明変数と目的変数の両方から削除されます

その他、カスタム前処理と同様に、以下のような挙動を示します。

実行コードはレシピに反映されます

カスタム前処理が実行された履歴は実験管理には表示されません

学習モデルダウンロード時の前処理パイプラインに実行コードが保存されます

AIアシスト付きカスタム前処理カードの操作方法

結線

対象データを結線してください。

実行コードの設定

初期状態では左領域にの関数定義との返り値定義がされています。引数である df(形式) を入力データとし、返却されたデータ(形式)が前処理結果として利用されます。

入力データと文の間に実行コードを設定することで、独自の前処理を記述できます。

ここまでは、通常のカスタム前処理カード（📘データ前処理 - カスタム前処理）と同様の挙動になります。

AIアシスト付き前処理カードではさらに、左領域に「コード」タブだけでなく「プロンプト」タブを持っており、「プロンプト」から「コード」を自動変換することができます。変換の際は、「プロンプトをコードに変換する」ボタンをクリックします。

実行

設定した実行コードに従い前処理が行われます。

処理が成功すると、メッセージが表示されます。

実行コードに標準出力処理（文など）があれば、「コード」タブ右領域に表示されます。

実行コードに文法的なエラーがある場合も右領域に表示されます（一部のエラーはメッセージ領域に表示されます）。

処理時間が 20 分を超えるとタイムアウトし、処理が強制終了されます。

処理結果の確認

必要に応じて、表形式、統計量、グラフ形式で結果を確認してください（統計タブやグラフタブから確認できます）。