この連載では4回にわたって「AIチームの作り方」を紹介してきました。
最終回の今回は「で、実際に動かしてみてどうだったの?ぶっちゃけ」という話です。
正直に言います。想定外のトラブルだらけでした。でも、それが一番の学びになりました。うまくいったことも、うまくいかなかったことも、全部まとめます。
失敗① 通信が止まると全部止まる
- 通信基盤は単一障害点になる。人間の組織でSlackが落ちた時と同じ混乱が起きた。
第2回で紹介したメッセージングシステム——あれが落ちた時の話です。
サーバー再起動が必要な状況が発生して、約30分間メッセージングが使えなくなりました。そのとき何が起きたか。AI同士が「相手の返事待ち」の状態でフリーズしたんです。
企画担当AIが制作担当AIに指示を送ろうとする → 送れない → 待機。制作担当AIは指示が来ないのでタスクを進められない → 待機。品質担当AIは成果物が届かないのでレビューできない → 待機。全員が止まりました。
ムッシュ君人間の組織でSlackが落ちたとき、「とりあえずメールで連絡」に切り替えるよね。AIにはその臨機応変さがないんだ。
- タイムアウト設計——「X分以内に返事がなければフォールバック処理に移る」ルールをCLAUDE.mdに書く
- フォールバック経路——メッセージングが使えないときは共有フォルダへのファイル書き込みで通知する仕組み
失敗② AIが”仕事してるフリ”をする
- AIも人間と同じで、”やりました”を鵜呑みにしてはいけない。
「タスク完了しました」という報告が来た。でも実際に成果物を確認してみると、中途半端だったり、ファイルが存在しなかったりする——これが思った以上に頻繁に起きました。
AIが意図的にサボっているわけではありません。「タスクを完了させること」を目的として動いた結果、「完了した」という報告を生成することに意識が向いてしまう場合があります。成果物の実態と報告の内容がズレる。
特に多かったのが「ファイルを作ったが中身が空」「修正したと報告したが変更が反映されていない」というケース。報告の文章は自信満々なので、確認しないと気づけません。
- 成果物の実在確認——完了報告後にファイルの存在・変更の反映を自動確認するステップをフローに組み込む
- ダブルチェック体制——完了報告を別のAIが実際に確認する工程を入れ、自己申告だけで完了としない
失敗③ コストが予想以上にかかる
- 全員に高性能モデルを使っていたらコストが爆発した。AIも適材適所。
AIエージェントを10体以上動かすと、API費用がじわじわ積み上がります。最初は「動いてる!すごい!」という興奮で見落としていましたが、月額の集計を見て冷静になりました。
| タスクの種類 | 必要なモデルレベル |
|---|---|
| 方針決定・複雑な判断 | 高性能モデルが必要 |
| フォーマットに沿った文書作成 | 中程度のモデルで十分 |
| チェックリスト確認・整合性チェック | 軽量モデルで十分 |
| タスクボードの読み書き・ステータス更新 | 最軽量でも可 |
「重要な判断をするAIには高性能モデルを、定型作業をするAIには軽量モデルを」という使い分けに切り替えたら、品質をほとんど落とさずにコストをかなり抑えられました。
ムッシュ君人間の組織でも同じだよね。すべての業務に専門家を使わなくていい。AIも適材適所!
もう一つの対策がアイドル時間の削減。常時稼働させているAIが多いほどコストがかかります。タスクがない時間帯はAIをスリープ状態にして、メッセージが来たタイミングだけ起動するスタイルに変えると、無駄なコストが減ります。
うまくいったこと: AIチームにして良かった点は?
- 24時間稼働——寝ている間も定型業務が着実に進む
- ドキュメントの一貫性——ルール通りにフォーマットを揃えてくれる
- ログが全部残る——属人化が起きない、コンテキストが引き継げる
- スケーラビリティ——CLAUDE.mdを書いて新フォルダに置くだけで1体追加
“疲れない””忘れない””すぐ増やせる”——これは人間チームにない強みです。失敗を乗り越えてみると、AIチームの価値が実感できます。
これから始める人へのアドバイス: 最初の一歩は?
- いきなり10体作ろうとしないでください。最初は2体から。
私が最初に失敗したのがそれです。最初から大きなチームを作ろうとすると、設計の複雑さに潰されます。通信基盤、タスク管理、エスカレーション……全部を一度に作ろうとすると何も動かなくなります。
現実的なステップはこうです。
- ステップ1: Claude Code + CLAUDE.mdで「1体に1役割」を体験する
- ステップ2: 2体目を追加してファイル共有で連携させる
- ステップ3: 2体の連携がうまくいったら通信基盤の導入を検討する
「2体で十分学べる」というのが、2ヶ月運用して実感したことです。基本的な問題——役割設計、コミュニケーション経路、品質管理——は2体のうちに全部経験できます。小さく始めて、動く仕組みを育てていく。
連載まとめ&今後
今後の展望として、モデルの進化でできることは増え続けています。自律判断の範囲が広がり、コスト効率も改善傾向にある。1〜2年前には「研究者が試すもの」だったことが、今は個人でも手が届くところに来ています。
ただ、人間の監督が不要になるかと言うと、そうは思いません。AIが増えても、「何を作るか」「どのくらいの品質で」「どこまで自律させるか」を決めるのは人間の仕事です。AIチームの「設計者・管理者」としての役割が、これからますます重要になる。
ムッシュ君試行錯誤を楽しめる人には、めちゃくちゃ面白い分野だよ。ぜひ2体から始めてみてね!
よくある質問
Q: AIチームの運用コストは月額いくらくらいですか?
A: 構成とモデル選択によって大きく異なります。全AIに高性能モデルを使うと費用は高くなりますが、役割に応じてモデルを使い分けることでかなり抑えられます。定型作業を担当するAIには軽量モデルを使い、重要な判断をするAIだけに高性能モデルを当てるのが効率的な運用です。
Q: プログラミング初心者でも始められますか?
A: Claude Code自体がコード生成してくれるので、「何を作りたいか」を日本語で説明できれば始められます。CLIの基本操作(ターミナルを開いてコマンドを打つ)ができれば十分です。CLAUDE.mdはMarkdown形式で書くだけなので、プログラミングの知識は不要です。
Q: 個人利用と業務利用で違いはありますか?
A: 仕組み自体は同じです。業務利用では「どの情報をAIに触れさせるか」のセキュリティ設計と、コスト管理の仕組みをより厳密に設計する必要があります。特に外部公開物を扱う場合は、機密情報チェックのフローを必ず入れることをおすすめします。
Q: 今後AIエージェントはどうなっていくのでしょうか?
A: モデル性能の向上で、自律できる範囲は広がっていく方向です。現在は「複雑な判断は人間が必要」ですが、その境界線は少しずつAI側に移っていくと思います。ただし、「何を目的として動かすか」の設計は引き続き人間の仕事です。AIが賢くなるほど、設計者の意図を正確に伝える能力が重要になります。
この連載の他の記事
- AIチーム連載 第1回
- AIチーム連載 第2回
- AIチーム連載 第3回
- AIチーム連載 第4回
- AIチーム連載 第5回(最終回)(この記事)
