つれづれなる Agent OPS
技術メモ

この処理はAIでできますかと聞かれたときに見る観点

AIで処理できるかを、モデル性能ではなく、入力の揺れ、失敗時の影響、人間確認のコストから考えるメモ。

「この処理、AIでできますか」と聞かれることが増えました。

技術的には、できることは多いです。文章を読む、分類する、要約する、候補を出す、次のアクションを提案する。このあたりは、試すだけならすぐできます。

ただ、業務に入れるかどうかは別の話です。最初に見るべきなのは、モデルが賢いかどうかだけではありません。

入力はどれくらい揺れるか
間違えたときの影響はどれくらいか
人間が確認する時間は残るか
判断理由を後から説明できるか
失敗時に元の運用へ戻せるか

この観点で見ると、AIに向いている処理と、まだ人間が見た方がよい処理が分かれます。たとえば、問い合わせを粗く分類するのは向いていても、返金可否を自動決定するのは慎重にした方がよいかもしれません。

AI導入の相談では、「できるか」よりも「間違えたときに運用できるか」を先に考える方が話が早いです。小さく試すのはよいですが、本番の業務フローに入れるなら、確認、差し戻し、ログ、責任範囲を一緒に設計する必要があります。

DUO

Author

DUOps

LLMOps、Agent、MCP、Langfuse、Cloudflare 周辺の実装と運用を、個人で試しながら記録しています。

Xを見る

Related