s03
TodoWrite
Planification et coordinationPlan Before You Act
176 LOC5 outilsTodoManager + nag reminder
An agent without a plan drifts; list the steps first, then execute
s01 > s02 > [ s03 ] s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12
"Un agent sans plan dérive" -- listez les étapes d'abord, puis exécutez.
Problème
Sur les tâches multi-étapes, le modèle perd le fil. Il répète le travail, saute des étapes ou s'égare. Les longues conversations aggravent cela -- le prompt système s'estompe au fur et à mesure que les résultats d'outils remplissent le contexte. Un refactoring en 10 étapes pourrait compléter les étapes 1-3, puis le modèle commence à improviser car il a oublié les étapes 4-10.
Solution
+--------+ +-------+ +---------+
| User | ---> | LLM | ---> | Tools |
| prompt | | | | + todo |
+--------+ +---+---+ +----+----+
^ |
| tool_result |
+----------------+
|
+-----------+-----------+
| TodoManager state |
| [ ] task A |
| [>] task B <- doing |
| [x] task C |
+-----------------------+
|
if rounds_since_todo >= 3:
inject <reminder> into tool_result
Comment Ça Marche
- TodoManager stocke les éléments avec des statuts. Un seul élément peut être
in_progressà la fois.
class TodoManager:
def update(self, items: list) -> str:
validated, in_progress_count = [], 0
for item in items:
status = item.get("status", "pending")
if status == "in_progress":
in_progress_count += 1
validated.append({"id": item["id"], "text": item["text"],
"status": status})
if in_progress_count > 1:
raise ValueError("Only one task can be in_progress")
self.items = validated
return self.render()
- L'outil
todova dans la carte de distribution comme n'importe quel autre outil.
TOOL_HANDLERS = {
# ...base tools...
"todo": lambda **kw: TODO.update(kw["items"]),
}
- Un rappel insère un coup de coude si le modèle passe 3 tours ou plus sans appeler
todo.
if rounds_since_todo >= 3 and messages:
last = messages[-1]
if last["role"] == "user" and isinstance(last.get("content"), list):
last["content"].insert(0, {
"type": "text",
"text": "<reminder>Update your todos.</reminder>",
})
La contrainte "un seul in_progress à la fois" force la concentration séquentielle. Le rappel crée la responsabilité.
Qu'est-ce qui a Changé par Rapport à s02
| Composant | Avant (s02) | Après (s03) |
|---|---|---|
| Outils | 4 | 5 (+todo) |
| Planification | None | TodoManager avec statuts |
| Injection rappel | None | <reminder> après 3 tours |
| Boucle agent | Distribution simple | + compteur rounds_since_todo |
Essayer
python agents/s03_todo_write.py
Refactorer le fichier hello.py : ajouter des hints de type, docstrings et un main guardCréer un package Python avec __init__.py, utils.py et tests/test_utils.pyRevoir tous les fichiers Python et corriger les problèmes de style
