s03
TodoWrite
Planejamento e CoordenacaoPlan Before You Act
176 LOC5 ferramentasTodoManager + nag reminder
An agent without a plan drifts; list the steps first, then execute
s01 > s02 > [ s03 ] s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12
"Um agente sem um plano deriva" -- liste os passos primeiro, depois execute.
Problema
Em tarefas de múltiplas etapas, o modelo perde o controle. Ele repete trabalho, pula passos ou se perde. Conversas longas pioram isso -- o prompt do sistema enfraquece conforme os resultados das ferramentas preenchem o contexto. Uma refatoração de 10 passos pode completar os passos 1-3, e então o modelo começa a improvisar porque esqueceu os passos 4-10.
Solução
+--------+ +-------+ +---------+
| User | ---> | LLM | ---> | Tools |
| prompt | | | | + todo |
+--------+ +---+---+ +----+----+
^ |
| tool_result |
+----------------+
|
+-----------+-----------+
| TodoManager state |
| [ ] task A |
| [>] task B <- doing |
| [x] task C |
+-----------------------+
|
if rounds_since_todo >= 3:
inject <reminder> into tool_result
Como Funciona
- TodoManager armazena itens com status. Apenas um item pode estar
in_progressde cada vez.
class TodoManager:
def update(self, items: list) -> str:
validated, in_progress_count = [], 0
for item in items:
status = item.get("status", "pending")
if status == "in_progress":
in_progress_count += 1
validated.append({"id": item["id"], "text": item["text"],
"status": status})
if in_progress_count > 1:
raise ValueError("Only one task can be in_progress")
self.items = validated
return self.render()
- A ferramenta
todoentra no mapa de dispatch como qualquer outra ferramenta.
TOOL_HANDLERS = {
# ...base tools...
"todo": lambda **kw: TODO.update(kw["items"]),
}
- Um lembrete de "nag" injeta um empurrão se o modelo passar 3+ rodadas sem chamar
todo.
if rounds_since_todo >= 3 and messages:
last = messages[-1]
if last["role"] == "user" and isinstance(last.get("content"), list):
last["content"].insert(0, {
"type": "text",
"text": "<reminder>Update your todos.</reminder>",
})
A restrição "um in_progress de cada vez" força foco sequencial. O lembrete de nag cria responsabilidade.
O Que Mudou Desde s02
| Componente | Antes (s02) | Depois (s03) |
|---|---|---|
| Ferramentas | 4 | 5 (+todo) |
| Planejamento | Nenhum | TodoManager com statuses |
| Injeção de nag | Nenhum | <reminder> após 3 rodadas |
| Loop do agente | Dispatch simples | + contador rounds_since_todo |
Experimente
python agents/s03_todo_write.py
Refatore o arquivo hello.py: adicione type hints, docstrings e um main guardCrie um pacote Python com __init__.py, utils.py e tests/test_utils.pyRevise todos os arquivos Python e corrija quaisquer problemas de estilo
