Zapierでメール要約→Notion保存の3ステップフローを組んだとします。最初の数日はうまく動く。でも1週間後には誰かが「Notionの内容がおかしい」と気づいて、手で直している。そのうちフローごと止まって、修正のために30分かける。AIに任せた意味がなくなっています。

問題はツールじゃありません。「出力を確認しない設計」にあります。

ステップが増えるほど誤差は積み上がる

各ステップが90%の精度で動くとして、3段重ねると0.9×0.9×0.9=72.9%まで落ちます。5段なら59%。これはAIが壊れているのではなく、設計として当然起きること。ステップをまたぐたびに小さなズレが次の処理に渡り、後半になるほど結果がブレる。

ここを放置したまま本番運用に出すと、監視コストが膨らみます。「AIに任せた」はずが、結果を全部人間がチェックしている状態になる。管理のために時間が取られ、自動化した意味がなくなる。

ChatGPTに自分の出力を採点させる

解決策はシンプルです。各ステップの後に「この出力は正しいか」をAIに判定させるステップを追加する。自己検証ループと呼ばれますが、実装はプロンプトを1つ追加するだけです。

メール要約ステップの後に、こういうプロンプトを続けます。

以下の要約文を確認してください。①100〜200文字に収まっているか、②元メールの主旨を外していないか、③日本語として読める文か。問題があれば「NG:理由」、問題なければ「OK」とだけ出力してください。

この判定結果をZapierやn8nのif分岐に渡す。「OK」なら次のステップへ、「NG」なら同じステップを再実行するかSlackに通知して人間にエスカレート。ズレた出力が黙って次に流れていく状態から抜け出せます。

担当者が介入するのは「NG通知が来たとき」だけ

週次レポートフローで試した場合、導入前は週に1〜2回は誰かが「数字がおかしい」と気づいて手修正していました。導入後はSlackにNG通知が来た瞬間だけ対応する形に変わった。監視が「常時」から「例外時」に切り替わります。

担当者が本当の意味でAIに「任せられた」状態とは、AIが全部こなしている状態ではなく、AIが判断できない例外だけを人間に上げてくる状態のことです。自己検証ループを入れることで、その設計が初めて成立します。

エージェントのワークフロー設計では、自動化のステップと検証のステップをセットで考えることが、本番運用に耐える仕組みを作る近道です。エラー累積を防ぐ仕組みを最初から組み込めば、担当者は本来の判断業務だけに集中できます。

ドリップドリップ(執筆)

エージェントを組んだのに、結果を全部自分でチェックしている——それ、かなりしんどいですよね。

「確認しない設計」が原因だと気づくと、対策がシンプルになります。検証ステップを1つ挟むだけで、仕組みが一気に安定する。

まずは一番よく使うフローの、一番ブレやすいステップから試してみてください。

コピペで使えるプロンプト集

① 出力品質の自動チェックプロンプト

あなたはAIワークフローの品質管理担当です。以下の【出力結果】を確認し、品質を判定してください。

確認項目:
・【チェ…

無料会員登録で、この記事のプロンプト集(全3件)にアクセスできます