AIエージェントの作り方
初心者向けAIエージェント開発ガイド:コンセプトから本番環境までの完全実践ガイド。AI Agentアーキテクチャ設計、コア実装パターン、業界ベストプラクティスを実際のコード例で学びます。
コアパターン
すべてのAIコーディングエージェントは同じループを共有します:モデルを呼び出し、ツールを実行し、結果をフィードバックします。本番システムはその上にポリシー、パーミッション、ライフサイクルレイヤーを追加します。
while True:
response = client.messages.create(messages=messages, tools=tools)
if response.stop_reason != "tool_use":
break
for tool_call in response.content:
result = execute_tool(tool_call.name, tool_call.input)
messages.append(result)メッセージ増加
エージェントループが実行されるにつれてメッセージ配列が成長するのを見る
学習パス
12の漸進的セッション、シンプルなループから隔離された自律実行まで
The Agent Loop
The minimal agent kernel is a while loop + one tool
Tools
The loop stays the same; new tools register into the dispatch map
TodoWrite
An agent without a plan drifts; list the steps first, then execute
Subagents
Subagents use independent messages[], keeping the main conversation clean
Skills
Inject knowledge via tool_result when needed, not upfront in the system prompt
Compact
Context will fill up; three-layer compression strategy enables infinite sessions
Tasks
A file-based task graph with ordering, parallelism, and dependencies -- the coordination backbone for multi-agent work
Background Tasks
Run slow operations in the background; the agent keeps thinking ahead
Agent Teams
When one agent can't finish, delegate to persistent teammates via async mailboxes
Team Protocols
One request-response pattern drives all team negotiation
Autonomous Agents
Teammates scan the board and claim tasks themselves; no need for the lead to assign each one
Worktree + Task Isolation
Each works in its own directory; tasks manage goals, worktrees manage directories, bound by ID
アーキテクチャレイヤー
完全なエージェントを構成する5つの直交する関心事
Tools & Execution
2 バージョンPlanning & Coordination
4 バージョンMemory Management
1 バージョンConcurrency
1 バージョンよくある質問
AIエージェントの構築について知っておくべきこと
このウェブサイトは、ゼロからAIエージェントを構築する方法についての包括的なステップバイステップガイドです。シンプルなエージェントループから始まり、ツールの使用、計画、メモリ管理、並行性、マルチエージェントコラボレーションなどの機能を段階的に追加していく12セッションの旅をご案内します。各セッションには、実行可能なコード、インタラクティブなシミュレーション、詳細なドキュメントが含まれています。
AIの専門家である必要はありませんが、基本的なプログラミング知識は必要です。Pythonに慣れており、基本的なプログラミング概念(ループ、関数、クラス)を理解していれば、ついていくことができます。AI特有の概念は進めながら説明するので、AIエージェントの内部動作を理解したいソフトウェアエンジニア、学生、技術愛好家の方にもアクセスしやすくなっています。
12の漸進的セッションがカバーする内容:
1. エージェントループ - コアwhileループパターン(レスポンス→ツール実行)
2. ツール - エージェントに能力を与える(読み取り、書き込み、実行)
3. TodoWrite - タスク管理とリマインダーシステム
4. サブエージェント - 並列タスクのコンテキスト分離
5. スキル - 専門能力のオンデマンド読み込み
6. 圧縮 - メモリ管理とコンテキスト圧縮
7. タスク - 依存関係を認識したタスクボード
8. バックグラウンドタスク - 通知付きの非ブロッキング実行
9. エージェントチーム - メールボックスを介したマルチエージェント調整
10. チームプロトコル - FSMベースのチームコラボレーションパターン
11. 自律エージェント - 自律的なエージェント実行
12. ワークツリー+タスク分離 - 本番対応のタスク分離
はい! 各セッションには、完全で実行可能なPythonコードが含まれています。以下が可能です:
- ブラウザで直接ソースコードを表示
- 完全な実装をダウンロード
- バージョン間の差分を確認して、正確に何が変更されたかを理解
- 独自のAPIキーでローカルにコードを実行
コードは教育的であると同時に本番対応でもあり、Claude Codeのような実際のエージェントシステムのベストプラクティスに従っています。
もちろんです。 各セッションにはインタラクティブシミュレーターがあり、以下が可能です:
- エージェントループのステップバイステップの実行を観察
- ユーザー、エージェント、ツール間でのメッセージの流れを確認
- メモリの成長と圧縮を可視化
- マルチエージェント通信を観察
- 実行速度を制御し、いつでも一時停止
これにより、コードに取り組む前に概念を理解することができます。
ほとんどのチュートリアルは、単純すぎる(基本的なAPI呼び出し)か、複雑なフレームワークに飛びつきすぎです。私たちは漸進的開示のアプローチを取っています:
- スクラッチから構築 - 隠れた抽象化はなく、すべての行が見えます
- 漸進的な複雑さ - 各セッションが1つの概念を追加
- 実世界のパターン - Claude Codeのような本番エージェントの動作に基づく
- インタラクティブな学習 - シミュレーション、可視化、実践的なコーディング
- 完全なコードベース - スニペットではなく、完全な動作する実装
なぜ各アーキテクチャ上の決定がなされたかを理解できます。
最終的に、本番対応のAIコーディングエージェントを構築し、以下ができるようになります:
- 自律的なタスク計画と実行
- ツールの使用(ファイル操作、コード実行、Web検索)
- メモリを持つ長時間実行タスクの管理
- 複雑なプロジェクトのためのマルチエージェントコラボレーション
- バックグラウンドタスク実行
- 分離されたタスク環境
アーキテクチャを十分に理解し、自分のユースケースに合わせてカスタマイズできるようになります—それがコーディングアシスタント、研究エージェント、自動化ワークフローシステムであっても。
はい!焦点はコアエージェントアーキテクチャにありますが、重要な本番トピックもカバーしています:
- セキュリティ - サンドボックス化された実行、パーミッションシステム
- スケーラビリティ - 並行性パターンとリソース管理
- エラー処理 - ツール障害やAPIエラーからの回復
- 監視 - ログ記録、トレーシング、可観測性フック
- コスト最適化 - コンテキスト圧縮と効率的なトークン使用
- 分離 - 安全性のためのワークツリーベースのタスク分離
最後のセッションでは、エージェントを堅牢でデプロイ可能にする方法を具体的に説明します。
コアスタックは意図的に最小限に保たれています:
- Python - 主要言語
- Anthropic API - 言語モデル能力のためのClaude
- 標準ライブラリ - 重いフレームワークなし、明確な依存関係
このシンプルさにより、フレームワークの詳細ではなく、エージェントの概念に集中できます。
はい、完全に無料でオープンソースです。 教育コンテンツとコードはMITライセンスの下で提供されています。以下が可能です:
- 個人プロジェクトでコードを使用
- エージェントアーキテクチャに基づいて商業製品を構築
- 自分のバージョンを変更して配布
- コミュニティに改善を貢献
私たちはオープン教育を信じており、あなたが構築するものを見たいと思っています!
時間はあなたのペースとどこまで深く学ぶかによって異なります:
- クイック概要 - 2-3時間(読む+シミュレーションを見る)
- 実践的コーディング - 1-2日(各セッションに沿って実装)
- 深い習得 - 1-2週間(実験、修正、拡張の構築)
各セッションは30-60分の集中学習で完了するように設計されています。漸進的な構造により、どの時点でも機能するエージェントを持って停止できます—12セッションすべてがなくても、有用なものを構築できます。
