s03
TodoWrite
Планирование и координацияPlan Before You Act
176 LOC5 инструментовTodoManager + nag reminder
An agent without a plan drifts; list the steps first, then execute
s01 > s02 > [ s03 ] s04 > s05 > s06 | s07 > s08 > s09 > s10 > s11 > s12
"Агент без плана блуждает" -- сначала перечислите шаги, затем выполняйте.
Проблема
При многошаговых задачах модель теряет след. Она повторяет работу, пропускает шаги или отклоняется. Длинные разговоры усугубляют это — системный промпт затухает, когда контекст заполняется результатами инструментов. 10-шаговый рефакторинг может завершить шаги 1-3, затем модель начинает импровизировать, забыв шаги 4-10.
Решение
+--------+ +-------+ +---------+
| User | ---> | LLM | ---> | Tools |
| prompt | | | | + todo |
+--------+ +---+---+ +----+----+
^ |
| tool_result |
+----------------+
|
+-----------+-----------+
| Состояние TodoManager |
| [ ] задача A |
| [>] задача B <- делает |
| [x] задача C |
+-----------------------+
|
if rounds_since_todo >= 3:
inject <reminder> into tool_result
Как Это Работает
- TodoManager хранит элементы со статусами. Только один элемент может быть
in_progressодновременно.
class TodoManager:
def update(self, items: list) -> str:
validated, in_progress_count = [], 0
for item in items:
status = item.get("status", "pending")
if status == "in_progress":
in_progress_count += 1
validated.append({"id": item["id"], "text": item["text"],
"status": status})
if in_progress_count > 1:
raise ValueError("Only one task can be in_progress")
self.items = validated
return self.render()
- Инструмент
todoдобавляется в карту диспетчеризации как любой другой инструмент.
TOOL_HANDLERS = {
# ...base tools...
"todo": lambda **kw: TODO.update(kw["items"]),
}
- Напоминание "nag" вставляет подсказку, если модель делает 3+ раунда без вызова
todo.
if rounds_since_todo >= 3 and messages:
last = messages[-1]
if last["role"] == "user" and isinstance(last.get("content"), list):
last["content"].insert(0, {
"type": "text",
"text": "<reminder>Update your todos.</reminder>",
})
Ограничение "один in_progress за раз" вынуждает к последовательному фокусу. Напоминание создаёт подотчётность.
Что Изменилось с s02
| Компонент | До (s02) | После (s03) |
|---|---|---|
| Инструменты | 4 | 5 (+todo) |
| Планирование | Нет | TodoManager со статусами |
| Вставка nag | Нет | <reminder> после 3 раундов |
| Цикл агента | Простая диспетчеризация | + счётчик rounds_since_todo |
Попробуйте
python agents/s03_todo_write.py
Рефакторить файл hello.py: добавить type hints, docstrings и main guardСоздать Python-пакет с __init__.py, utils.py и tests/test_utils.pyПроверить все Python-файлы и исправить проблемы со стилем
