s03

TodoWrite

Pianificazione & Coordinamento

Plan Before You Act

176 LOC5 strumentiTodoManager + nag reminder

An agent without a plan drifts; list the steps first, then execute

Sistema di Promemoria TodoWrite

Nag Timer0/3

Pending4

#1pending

Write auth tests

#2pending

Fix mobile layout

#3pending

Add error handling

#4pending

Update config loader

In Progress0

Done0

Progress: 0/4 complete

The Plan

TodoWrite gives the model a visible plan. All tasks start as pending.

1/7

s01 > s02 > [ s03 ] s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12

"Un agente senza un piano vaga" -- elenca prima i passi, poi esegui.

Problema

Sui task multi-passo, il modello perde traccia. Ripete il lavoro, salta passi o si allontana. Le conversazioni lunghe peggiorano questo -- il prompt di sistema svanisce mentre i risultati degli strumenti riempiono il contesto. Un refactoring di 10 passi potrebbe completare i passi 1-3, poi il modello inizia ad improvvisare perché ha dimenticato i passi 4-10.

Soluzione

+--------+      +-------+      +---------+
|  User  | ---> |  LLM  | ---> | Tools   |
| prompt |      |       |      | + todo  |
+--------+      +---+---+      +----+----+
                    ^                |
                    |   tool_result  |
                    +----------------+
                          |
              +-----------+-----------+
              | TodoManager state     |
              | [ ] task A            |
              | [>] task B  <- doing  |
              | [x] task C            |
              +-----------------------+
                          |
              if rounds_since_todo >= 3:
                inject <reminder> into tool_result

Come Funziona

TodoManager memorizza gli elementi con stati. Solo un elemento può essere in_progress alla volta.

class TodoManager:
    def update(self, items: list) -> str:
        validated, in_progress_count = [], 0
        for item in items:
            status = item.get("status", "pending")
            if status == "in_progress":
                in_progress_count += 1
            validated.append({"id": item["id"], "text": item["text"],
                              "status": status})
        if in_progress_count > 1:
            raise ValueError("Only one task can be in_progress")
        self.items = validated
        return self.render()

Lo strumento todo entra nella mappa di dispatch come qualsiasi altro strumento.

TOOL_HANDLERS = {
    # ...base tools...
    "todo": lambda **kw: TODO.update(kw["items"]),
}

Un promemoria "nag" inietta un sollecito se il modello fa 3+ round senza chiamare todo.

if rounds_since_todo >= 3 and messages:
    last = messages[-1]
    if last["role"] == "user" and isinstance(last.get("content"), list):
        last["content"].insert(0, {
            "type": "text",
            "text": "<reminder>Update your todos.</reminder>",
        })

Il vincolo "uno in_progress alla volta" forza la attenzione sequenziale. Il promemoria crea responsabilità.

Cosa è Cambiato da s02

Componente	Prima (s02)	Dopo (s03)
Strumenti	4	5 (+todo)
Pianificazione	Nessuno	TodoManager con stati
Iniezione nag	Nessuno	`<reminder>` dopo 3 round
Loop agente	Dispatch semplice	+ contatore rounds_since_todo

Provalo

python agents/s03_todo_write.py

Refattorizza il file hello.py: aggiungi type hints, docstrings e un main guard
Crea un pacchetto Python con __init__.py, utils.py e tests/test_utils.py
Rivedi tutti i file Python e correggi eventuali problemi di stile