📘
データ前処理 - AIアシスト付きカスタム前処理
AIアシスト付きカスタム前処理とは?
カスタム前処理カードと同様に、データの前処理を任意の Python コードの実行により行いますが、その Python コードの作成を、自然言語によるプロンプトから自動変換で行うことができます。
生成AIは不正確なコードを出力することがあるため、出力されたコードを再確認するようにしてください。
また、前処理と無関係な指示を入力に入れた場合、正しくコードが出力されないことがあります。
生成AI は Python コードの作成補助の目的でのみ使われており、カードの実行中には用いられません。(そのため、一度作成済みの学習フローを使ってオフライン環境下で推論させる場合にも、このカードを含んでいても問題なく利用できます)
カスタム前処理と同様に、AIアシスト付きカスタム前処理でも以下のような制約があります。
- 教師あり学習タスクの場合
- カラムの追加をした場合は、説明変数として追加されます。
- 目的変数のカラムを削除はできません。
- 目的変数が説明変数に含まれている場合。
- 目的変数を参照した処理ができます。
- 目的変数が説明変数に含まれていない場合。
- 目的変数自体の値の変更は可能ですが、目的変数の値を利用して説明変数の値を変更は出来ません(推論アプリケーション Node-AI Berry で推論する際に目的変数は 0 として扱われます)。
- 教師なし学習タスクの場合
- カラムの追加をした場合は、説明変数と目的変数の両方に追加されます
- カラムを削除すると、説明変数と目的変数の両方から削除されます
その他、カスタム前処理と同様に、以下のような挙動を示します。
- 実行コードはレシピに反映されます
- カスタム前処理が実行された履歴は実験管理には表示されません
- 学習モデルダウンロード時の前処理パイプラインに実行コードが保存されます
AIアシスト付きカスタム前処理カードの操作方法
結線
対象データを結線してください。
実行コードの設定
AIアシスト付きカスタム前処理カードでは、以下のように「プロンプト設定領域」「実行コード設定領域」「出力結果確認領域」の3つにパネルが分かれています。

プロンプト設定領域においてプロンプトを入力し、「プロンプトからコードを生成」ボタンをクリックすると、生成AIによりプロンプトに対応した実行コードが実行コード設定領域に表示されます。

そして、実行ボタンをクリックすると、実行コード設定領域に表示されたコードに対応する処理が実行されます。

生成AIにより自動変換された実行コードを、さらに人手で手直した上で実行することも可能です。ただし、実行コードを修正しても、元のプロンプトがそれに応じて自動修正されることはありません。
実行
- 設定した実行コードに従い前処理が行われます。
- 処理が成功すると、メッセージが表示されます。
- 実行コードに標準出力処理(文など)があれば、「コード」タブ右領域に表示されます。
- 実行コードに文法的なエラーがある場合も右領域に表示されます(一部のエラーはメッセージ領域に表示されます)。
- 処理時間が 20 分を超えるとタイムアウトし、処理が強制終了されます。
処理結果の確認
- 必要に応じて、表形式、統計量、グラフ形式で結果を確認してください(統計 タブや グラフ タブから確認できます)。