How to Build an AI Agent
How to Build an AI Agent
s05

Skills

Pianificazione & Coordinamento

Load on Demand

187 LOC5 strumentiSkillLoader + two-layer injection
Inject knowledge via tool_result when needed, not upfront in the system prompt

s01 > s02 > s03 > s04 > [ s05 ] s06 | s07 > s08 > s09 > s10 > s11 > s12

"Carica la conoscenza quando ti serve, non in anticipo" -- inietta tramite tool_result, non il prompt di sistema.

Problema

Vuoi che l'agente segua workflow specifici del dominio: convenzioni git, pattern di testing, checklist di code review. Mettere tutto nel prompt di sistema spreca token su skill inutilizzati. 10 skill a 2000 token ciascuno = 20.000 token, la maggior parte irrilevante per qualsiasi task specifico.

Soluzione

System prompt (Layer 1 -- always present):
+--------------------------------------+
| You are a coding agent.              |
| Skills available:                    |
|   - git: Git workflow helpers        |  ~100 tokens/skill
|   - test: Testing best practices     |
+--------------------------------------+

When model calls load_skill("git"):
+--------------------------------------+
| tool_result (Layer 2 -- on demand): |
| <skill name="git">                   |
|   Full git workflow instructions...  |  ~2000 tokens
|   Step 1: ...                        |
| </skill>                             |
+--------------------------------------+

Layer 1: nomi skill nel prompt di sistema (economico). Layer 2: body completo via tool_result (on demand).

Come Funziona

  1. Ogni skill è una directory contenente SKILL.md con YAML frontmatter.
skills/
  pdf/
    SKILL.md       # ---
 name: pdf
 description: Process PDF files
 ---
 ...
  code-review/
    SKILL.md       # ---
 name: code-review
 description: Review code
 ---
 ...
  1. SkillLoader cerca file SKILL.md, usa il nome della directory come identificatore dello skill.
class SkillLoader:
    def __init__(self, skills_dir: Path):
        self.skills = {}
        for f in sorted(skills_dir.rglob("SKILL.md")):
            text = f.read_text()
            meta, body = self._parse_frontmatter(text)
            name = meta.get("name", f.parent.name)
            self.skills[name] = {"meta": meta, "body": body}

    def get_descriptions(self) -> str:
        lines = []
        for name, skill in self.skills.items():
            desc = skill["meta"].get("description", "")
            lines.append(f"  - {name}: {desc}")
        return "\n".join(lines)

    def get_content(self, name: str) -> str:
        skill = self.skills.get(name)
        if not skill:
            return f"Error: Unknown skill '{name}'."
        return f"<skill name=\"{name}\">\n{skill['body']}\n</skill>"
  1. Layer 1 va nel prompt di sistema. Layer 2 è solo un altro handler di strumento.
SYSTEM = f"""You are a coding agent at {WORKDIR}.
Skills available:
{SKILL_LOADER.get_descriptions()}"""

TOOL_HANDLERS = {
    # ...base tools...
    "load_skill": lambda **kw: SKILL_LOADER.get_content(kw["name"]),
}

Il modello impara quali skill esistono (economico) e li carica quando rilevante (costoso).

Cosa è Cambiato da s04

ComponentePrima (s04)Dopo (s05)
Strumenti5 (base + task)5 (base + load_skill)
Prompt sistemaStringa statica+ descrizioni skill
ConoscenzaNessunoFile skills/*/SKILL.md
IniezioneNessunoDue layer (system + result)

Provalo

python agents/s05_skill_loading.py
  1. Quali skill sono disponibili?
  2. Carica lo skill agent-builder e segui le sue istruzioni
  3. Devo fare una code review -- prima carica lo skill rilevante
  4. Costruisci un server MCP usando lo skill mcp-builder