s03

TodoWrite

Planification et coordination

Plan Before You Act

176 LOC5 outilsTodoManager + nag reminder

An agent without a plan drifts; list the steps first, then execute

Système de rappels TodoWrite

Nag Timer0/3

Pending4

#1pending

Write auth tests

#2pending

Fix mobile layout

#3pending

Add error handling

#4pending

Update config loader

In Progress0

Done0

Progress: 0/4 complete

The Plan

TodoWrite gives the model a visible plan. All tasks start as pending.

1/7

s01 > s02 > [ s03 ] s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12

"Un agent sans plan dérive" -- listez les étapes d'abord, puis exécutez.

Problème

Sur les tâches multi-étapes, le modèle perd le fil. Il répète le travail, saute des étapes ou s'égare. Les longues conversations aggravent cela -- le prompt système s'estompe au fur et à mesure que les résultats d'outils remplissent le contexte. Un refactoring en 10 étapes pourrait compléter les étapes 1-3, puis le modèle commence à improviser car il a oublié les étapes 4-10.

Solution

+--------+      +-------+      +---------+
|  User  | ---> |  LLM  | ---> | Tools   |
| prompt |      |       |      | + todo  |
+--------+      +---+---+      +----+----+
                    ^                |
                    |   tool_result  |
                    +----------------+
                          |
              +-----------+-----------+
              | TodoManager state     |
              | [ ] task A            |
              | [>] task B  <- doing  |
              | [x] task C            |
              +-----------------------+
                          |
              if rounds_since_todo >= 3:
                inject <reminder> into tool_result

Comment Ça Marche

TodoManager stocke les éléments avec des statuts. Un seul élément peut être in_progress à la fois.

class TodoManager:
    def update(self, items: list) -> str:
        validated, in_progress_count = [], 0
        for item in items:
            status = item.get("status", "pending")
            if status == "in_progress":
                in_progress_count += 1
            validated.append({"id": item["id"], "text": item["text"],
                              "status": status})
        if in_progress_count > 1:
            raise ValueError("Only one task can be in_progress")
        self.items = validated
        return self.render()

L'outil todo va dans la carte de distribution comme n'importe quel autre outil.

TOOL_HANDLERS = {
    # ...base tools...
    "todo": lambda **kw: TODO.update(kw["items"]),
}

Un rappel insère un coup de coude si le modèle passe 3 tours ou plus sans appeler todo.

if rounds_since_todo >= 3 and messages:
    last = messages[-1]
    if last["role"] == "user" and isinstance(last.get("content"), list):
        last["content"].insert(0, {
            "type": "text",
            "text": "<reminder>Update your todos.</reminder>",
        })

La contrainte "un seul in_progress à la fois" force la concentration séquentielle. Le rappel crée la responsabilité.

Qu'est-ce qui a Changé par Rapport à s02

Composant	Avant (s02)	Après (s03)
Outils	4	5 (+todo)
Planification	None	TodoManager avec statuts
Injection rappel	None	`<reminder>` après 3 tours
Boucle agent	Distribution simple	+ compteur rounds_since_todo

Essayer

python agents/s03_todo_write.py

Refactorer le fichier hello.py : ajouter des hints de type, docstrings et un main guard
Créer un package Python avec __init__.py, utils.py et tests/test_utils.py
Revoir tous les fichiers Python et corriger les problèmes de style