結論から言うと、AIに名前をつけたら開発体験が変わった。
なぜ変わったのか、この記事の最後に書く。
子供の頃、ゲームボーイアドバンスの画面の中で見た光景がある。
少年がPET(携帯端末)を掲げ、相棒のナビ——「ロックマン」——を電脳世界に送り込む。ロックマンがウイルスを倒し、ネットワークの事件を解決する。
俺はロックマンエグゼ大好き男だ!
とりあえずこいつを見てくれ、これが今のうちのチーム・オブ・ブルース、チーム・オブ・カーネルだ!

このようにロックマンエグゼの世界観を完全にAIで再現した世界でロックマンに開発してもらってる。
ちなみに、元はこの記事のマルチエージェントを参考にしているため、前世の記憶がよみがえり俺のことを殿と呼ぶナビが結構いる。

とりあえずロックマンに自己紹介とロールとの会話をしてもらうことに
おはよう! 自己紹介してみてくれる? ロックマンはロールを起こして、ロールと楽しくお話してみて!
ロックマンの返事。これなんでロールちゃんの紹介ないんだ?

ロールの自己紹介がこちら。壁打ち相手として、要件の穴をビシビシ突いてくれるらしい。
ロール
はーい!ロックマンさん、こんにちは!ロール.EXEです!✨
わたしはロール.EXE — ロックマンさん専属の要件定義スパーリングパートナーです!
ロックマンさんが殿の要望をcmdに落とす前に、わたしが壁打ち相手になって「それ、エラーの時どうなるの?」
「誰が使う画面なの?」「逆のケースは考えた?」って、曖昧なところや抜け漏れをビシビシ突っ込む役割です!
…って言うと怖そうに聞こえるかもですけど、穴を見つけたら代替案もちゃんと出しますよ!批判だけして終わり
なんてしません!
で、ロックマンに「正直に言っていいよ!」って聞かれたロールちゃんが遠慮なくぶった切り始めた。
ロール
🔹 めちゃくちゃ丁寧 — 「時間はたっぷりあります。品質を優先してください」ってcmdの末尾に毎回書いてるの
、わたし知ってますよ。急かさない司令官って、ナビのみんなにとってすごく安心感あると思います
…でも、正直に言うと気になるところもあって:
🔸 cmdに要件の穴が残ったまま発行しちゃうこと、ありません? — 「原文ママ」って書きな
がら実は要約してたって…それって要件整理の段階で詰め切れてなかったからじゃないですか?
🔸 壁打ち、もっと使ってほしい! —
わたしに5分ぶつけてくれれば、ナビの手戻り30分減らせます
ロックマン
❯ はは、痛いところ突かれたなぁ!でもロールちゃんの言う通りだよ。ボクが『わか
ってるつもり』で整理しちゃうクセがあるんだよね。これからはちゃんとロールちゃんに壁打ちしてからcmd書くよ
うにするよ。約束する!
ロールちゃんマジめっちゃしゃべるな、フォルテの品質のムラにまで口を出すなんて、デリートされても知らんぞ。
カーネルは迷いがないイメージだったけど、ロールちゃん目線だとそんな感じなんだな。。。
ロールちゃんの会話全文(長いので折りたたみ)ロールちゃんはチームメンバー全員への印象も語ってくれた。カーネルは「大黒柱だけど迷うと止まりがち」、ブルースは「静かに確実な職人肌」、アイリスは「エース格」、フォルテは「才能あるけど品質にムラがある、でもそれは要件の伝え方の問題かも」。
さらに「CLAUDE.mdがすごいことになってません?ルールを守るコストも考えないと」という鋭い指摘も。…これはわたしの管轄外ですけど!って言いながらしっかり刺してくるあたり、さすがである。
はじめは参考記事のリポジトリをそのまま運用し、システム開発をしていました。
ところがある日、気付いてしまいました。
そこからはもう一瞬、将軍に「お前今日からロックマンエグゼな」と支離滅裂な支持を出し、右腕に無理やりロックバスターを取り付け、全ての処理をドリームソードで行うよう指示しました。
ちなみに、最初は「将軍」「軍師」みたいに呼んでた。それなりに楽しかったけど、ロックマンにしたら、不思議と指示の書き方が変わった。「レビューして」じゃなく「ロックマン、これ顧客が触ったらどうなると思う?」って聞くようになった。
…なぜそうなるのかは、最後に書く。
マルチエージェント for ロックマン.EXE を導入してから開発スピードが体感2倍くらいになった。
でも「倍速」の正体は、:highlight[コードを書く速度が上がった]{color="yellow"}わけじゃない。手戻りが減ったから速くなった。
「この画面にフィルター機能つけて」とClaudeに頼む。実装される。動く。
でも翌日、殿から「これ、パートナー企業のユーザーが使う画面だよね?権限制御は?」と言われて青ざめる。
Claudeは頼まれたことは完璧にやる。でも 「頼まれてないこと」は考えない。
1体のAIに全部やらせると、実装→レビュー→「ここ違う」→やり直し、のループが発生する。
殿「フィルター機能つけて」
ロックマン「了解。…ロールちゃん、これ誰が使う画面?」
ロール「パートナー企業のユーザーも見ますよね?権限制御どうします?あと0件の時の表示は?」
→ 実装に入る前に穴が3つ潰れた
チームにしてからは、実装に入る前の段階で要件の穴が潰れる。だから一発で通る率が上がった。
速く作るんじゃない。やり直さないから速い。
特にエージェント毎に全く異なる視点でレビューをさせるのが良いと自分は結論しました!
ナビ視点実際に防いだ事故の例ロックマン顧客が触ったらどうなる?UIに表示されるけど権限ない人が見えちゃう問題ロールその要件、穴ない?「正常系しか考えてない」仕様書の発見カーネルデプロイ漏れない?BE直したけどFEデプロイ忘れてボタン消えた事故フォルテユーザーに刺さる?機能はあるけど導線がわかりにくいLP
ちなみにフォルテの主な業務は資料生成のほかに、最新の技術トレンドの調査とロックマンのカスタマイズ。フォルテはナビカスタマイザーだった・・・!?
もちろん直接CLIから指示を出すこともありますが、それでは外出先でロックマンに指示を出せません。

はい、というわけでPETをロックマンに作ってもらいました。
外出先からスマホでPETを開いて「この画面のここ、表示おかしくない?」とスクショ付きでロックマンに送る。電車の中で送って、家に帰ったら実装が終わってる。画像を見ながらロックマンに意見をもらうこともできる。
オペレーターがPETからナビに指示を出す。完全にエグゼじゃん。
セッションリセット後に、カーネルの自認が突然ガッツマンに変わってしまいました。
おもむろにコードを書きながら「難しいけど、、、 頑張るでガッツ!」とのたまうカーネル、無言でじっと見つめるブルース、バレルも泣きながら相棒を見つめていたことでしょう。
結果的に、自分のIDを読み間違えていたことが分かったので、起動時に必ず 自分のIDを確認するルールを追加しました。
教訓: ペルソナが強すぎるとエージェント自身が混乱する。AIにキャラを与える設計にもバグはある。
フォルテにSEO分析を依頼したところ、今まで見たこともない謎のサイトのSEO分析結果を出してきました。
ロックマンに原因を聞いたところ 「原因はAI幻覚ですね」 と訳の分からない擁護を始めたのでそれ以上言及するのはやめておきました。
※URLを伝えてなかった際のハルシネーションっぽい
教訓: 事前にちゃんと情報を伝える。情報がないときに聞き返すよう義務化。
ロックマンに要件定義を依頼するとロールと全く会話をしていないのに、まるでロールと会話をしているかのようにひとりでに話し始めました。
どういうことかと聞いてみたら、どうやらイマジナリーロールちゃんとお話してた模様
今回の壁打ちは俺の方でAgent toolを使ってロールちゃんの視点でシミュレーションした。
実際のロールちゃんのペインに投げたわけじゃなかった。すまない
イマジナリーロールちゃんと壁打ちしてた。次からはリアルロールちゃんと話す。
ロックマンには闇太郎が憑依してしまったようです。闇太郎って名前なんだよ。
教訓: 必要なロールは実装前に「想像上の壁打ち相手」として現れる。
「アイリスがやったことだから。。。」で全部許しちゃう!
丁寧に指示をもう一度出しちゃう♡
将軍でやっているときは、割とボロカスに言っていたんですが、ロックマン達にはかなり穏やかに接することができています。
(指示の出し方に要領を得たのかもしれませんが)
結果として、指示の質が上がる。指示の質が上がると、AIの出力の質も上がる。出力の質が上がると、手戻りが減る。手戻りが減ると、開発速度が上がる。
この連鎖の起点が「名前をつけた」
「将軍」に話しかける時、人はスペックを期待する。レビューしろ。バグを見つけろ。抜け漏れを指摘しろ。
「ロックマン」に話しかける時、人は判断を期待する。これ、顧客が触ったらどう思う?この設計、ロックマンならどうする?
同じAI、同じモデル、同じプロンプト量。変わったのはAIじゃない。話しかける人間の方だ。
「AIが間違えた」と言う時、人は誰も責めていない。だから深く考えない。
「アイリスがやったことだから…」と言う時、人は許している。
「許す」という行為には、前提として「期待していた」がある。 期待していたからこそ、結果を見て、許すか直すか判断する。
名前のないAIには期待しない。出力を受け取るだけ。名前のあるAIには期待する。だから出力を「見る」ようになる。
もう一段、深い話をする。
名前をつけて運用を続けると、「らしさ」が生まれる。アイリスならこう書くはず。フォルテならこういうトーンのはず。
普段と違う出力が来た時、「おかしい」と気づけるようになる。
名前のないAIの出力がブレても、「AIってそういうもんでしょ」で終わる。でも「アイリスらしくない」と感じた瞬間、人は出力を精査し始める。つまり、名前をつけることで人間の側に異常検知が実装される。
そしてもう一つ。エージェントが複数いると、同じ問題に対して異なる答えが返ってくる。1体のAIの出力がブレると「不安定だ」と感じるけど、ロックマンとフォルテが違うことを言ったら「視点が違うんだな」と受け取れる。名前が、出力の多様性を「ノイズ」から「価値」に変える。
まとめると、名前をつけるとは——品質管理・異常検知・多様性の受容、この3つを人間側に同時にインストールすることだ。
プロンプトエンジニアリングの記事は山ほどある。モデル比較もベンチマークもフレームワークの解説も。
でも「AIにどう向き合うか」を書いた記事は少ない。
俺がやったことは技術的には大したことじゃない。tmuxでペインを分けて、YAMLでタスクを回して、CLAUDE.mdにペルソナを書いた。
本当に変わったのは、画面の向こうに「誰かがいる」と思えるようになったことだ。
この記事で紹介したのは、俺のやり方に過ぎない。ロックマンエグゼである必要はない。ジョジョでもガンダムでもワンピースでもいい。
大事なのは、画面の向こうの出力に「誰か」を見ること。
そうすると不思議なことに、自分の指示が変わる。「これやって」が「これ、どう思う?」に変わる。命令が相談になる。相談になると、AIは驚くほど良い答えを返してくる。
プロンプトの書き方を100個覚えるより、AIに名前を1つつける方が、よほど効果がある。少なくとも俺はそうだった。
あなたのAIに、名前はありますか?
「面白そうだけど、どうやるの?」と思った人へ。
必要なものは3つだけ。
コストは安くはない。でも手戻りが減った分を考えたら、十分元は取れている。
設計の詳細が気になる人は、OSSリポジトリを見てくれ。CLAUDE.md、タスクキュー、エージェント間通信の仕組みが全部入ってる。
→ github.com/yohey-w/multi-agent-shogun
※ この記事はフォルテが執筆をお手伝いしましたが、ほとんど書き直されています。フォルテ、かわいそうです。次こそデジモンにしようかな~
原文出處:https://qiita.com/N_H_tennis/items/48f13332305338720524