How to Build an AI Agent
How to Build an AI Agent
s03

TodoWrite

Planification et coordination

Plan Before You Act

176 LOC5 outilsTodoManager + nag reminder
An agent without a plan drifts; list the steps first, then execute

s01 > s02 > [ s03 ] s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12

"Un agent sans plan dérive" -- listez les étapes d'abord, puis exécutez.

Problème

Sur les tâches multi-étapes, le modèle perd le fil. Il répète le travail, saute des étapes ou s'égare. Les longues conversations aggravent cela -- le prompt système s'estompe au fur et à mesure que les résultats d'outils remplissent le contexte. Un refactoring en 10 étapes pourrait compléter les étapes 1-3, puis le modèle commence à improviser car il a oublié les étapes 4-10.

Solution

+--------+      +-------+      +---------+
|  User  | ---> |  LLM  | ---> | Tools   |
| prompt |      |       |      | + todo  |
+--------+      +---+---+      +----+----+
                    ^                |
                    |   tool_result  |
                    +----------------+
                          |
              +-----------+-----------+
              | TodoManager state     |
              | [ ] task A            |
              | [>] task B  <- doing  |
              | [x] task C            |
              +-----------------------+
                          |
              if rounds_since_todo >= 3:
                inject <reminder> into tool_result

Comment Ça Marche

  1. TodoManager stocke les éléments avec des statuts. Un seul élément peut être in_progress à la fois.
class TodoManager:
    def update(self, items: list) -> str:
        validated, in_progress_count = [], 0
        for item in items:
            status = item.get("status", "pending")
            if status == "in_progress":
                in_progress_count += 1
            validated.append({"id": item["id"], "text": item["text"],
                              "status": status})
        if in_progress_count > 1:
            raise ValueError("Only one task can be in_progress")
        self.items = validated
        return self.render()
  1. L'outil todo va dans la carte de distribution comme n'importe quel autre outil.
TOOL_HANDLERS = {
    # ...base tools...
    "todo": lambda **kw: TODO.update(kw["items"]),
}
  1. Un rappel insère un coup de coude si le modèle passe 3 tours ou plus sans appeler todo.
if rounds_since_todo >= 3 and messages:
    last = messages[-1]
    if last["role"] == "user" and isinstance(last.get("content"), list):
        last["content"].insert(0, {
            "type": "text",
            "text": "<reminder>Update your todos.</reminder>",
        })

La contrainte "un seul in_progress à la fois" force la concentration séquentielle. Le rappel crée la responsabilité.

Qu'est-ce qui a Changé par Rapport à s02

ComposantAvant (s02)Après (s03)
Outils45 (+todo)
PlanificationNoneTodoManager avec statuts
Injection rappelNone<reminder> après 3 tours
Boucle agentDistribution simple+ compteur rounds_since_todo

Essayer

python agents/s03_todo_write.py
  1. Refactorer le fichier hello.py : ajouter des hints de type, docstrings et un main guard
  2. Créer un package Python avec __init__.py, utils.py et tests/test_utils.py
  3. Revoir tous les fichiers Python et corriger les problèmes de style