How to Build an AI Agent
How to Build an AI Agent
s05

Skills

Planejamento e Coordenacao

Load on Demand

187 LOC5 ferramentasSkillLoader + two-layer injection
Inject knowledge via tool_result when needed, not upfront in the system prompt

s01 > s02 > s03 > s04 > [ s05 ] s06 | s07 > s08 > s09 > s10 > s11 > s12

"Carregue conhecimento quando precisar, não antecipadamente" -- injete via tool_result, não no prompt do sistema.

Problema

Você quer que o agente siga fluxos de trabalho específicos do domínio: convenções de git, padrões de teste, checklists de revisão de código. Colocar tudo no prompt do sistema desperdiça tokens em skills não utilizados. 10 skills a 2000 tokens cada = 20.000 tokens, a maioria dos quais é irrelevante para qualquer tarefa específica.

Solução

System prompt (Layer 1 -- always present):
+--------------------------------------+
| You are a coding agent.              |
| Skills available:                    |
|   - git: Git workflow helpers        |  ~100 tokens/skill
|   - test: Testing best practices     |
+--------------------------------------+

When model calls load_skill("git"):
+--------------------------------------+
| tool_result (Layer 2 -- on demand):  |
| <skill name="git">                   |
|   Full git workflow instructions...  |  ~2000 tokens
|   Step 1: ...                        |
| </skill>                             |
+--------------------------------------+

Layer 1: skill names no prompt do sistema (barato). Layer 2: body completo via tool_result (sob demanda).

Como Funciona

  1. Cada skill é um diretório contendo um SKILL.md com YAML frontmatter.
skills/
  pdf/
    SKILL.md       # ---\n name: pdf\n description: Process PDF files\n ---\n ...
  code-review/
    SKILL.md       # ---\n name: code-review\n description: Review code\n ---\n ...
  1. SkillLoader procura por arquivos SKILL.md, usa o nome do diretório como identificador do skill.
class SkillLoader:
    def __init__(self, skills_dir: Path):
        self.skills = {}
        for f in sorted(skills_dir.rglob("SKILL.md")):
            text = f.read_text()
            meta, body = self._parse_frontmatter(text)
            name = meta.get("name", f.parent.name)
            self.skills[name] = {"meta": meta, "body": body}

    def get_descriptions(self) -> str:
        lines = []
        for name, skill in self.skills.items():
            desc = skill["meta"].get("description", "")
            lines.append(f"  - {name}: {desc}")
        return "\n".join(lines)

    def get_content(self, name: str) -> str:
        skill = self.skills.get(name)
        if not skill:
            return f"Error: Unknown skill '{name}'."
        return f"<skill name=\"{name}\">\n{skill['body']}\n</skill>"
  1. Layer 1 vai para o prompt do sistema. Layer 2 é apenas outro handler de ferramenta.
SYSTEM = f"""You are a coding agent at {WORKDIR}.
Skills available:
{SKILL_LOADER.get_descriptions()}"""

TOOL_HANDLERS = {
    # ...base tools...
    "load_skill": lambda **kw: SKILL_LOADER.get_content(kw["name"]),
}

O modelo aprende quais skills existem (barato) e os carrega quando relevante (caro).

O Que Mudou Desde s04

ComponenteAntes (s04)Depois (s05)
Ferramentas5 (base + task)5 (base + load_skill)
Prompt do sistemaString estática+ descrições de skills
ConhecimentoNenhumarquivos skills/*/SKILL.md
InjeçãoNenhumDuas camadas (system + result)

Experimente

python agents/s05_skill_loading.py
  1. Quais skills estão disponíveis?
  2. Carregue o skill agent-builder e siga suas instruções
  3. Eu preciso fazer uma revisão de código -- carregue o skill relevante primeiro
  4. Construa um servidor MCP usando o skill mcp-builder