Cosa succederebbe se potessi delegare le operazioni quotidiane della tua azienda a un team di agenti AI specializzati? Ognuno con il suo ruolo, il suo modello, i suoi tool — coordinati da un orchestratore centrale. Non e fantascienza: e Paperclip, il framework multi-agent che ho costruito per AiNextStudio.
Il nome: perche Paperclip
Riferimento ironico al pensiero esperimento di Nick Bostrom: un'AI che ottimizza la produzione di graffette fino a esaurire tutte le risorse del pianeta. Paperclip (il framework) fa l'opposto: agenti specializzati con obiettivi precisi e limiti chiari.
L'architettura
Paperclip gira su iMac alla porta 3100 con un'architettura gerarchica a tre livelli.
Livello 1: L'orchestratore
Riceve i task (Telegram, API o cron), li decompone e li assegna agli agenti. Monitora l'esecuzione, gestisce i fallimenti e aggrega i risultati.
Livello 2: Gli agenti specializzati
CEO Agent (Claude Opus): decisioni strategiche, valutazione proposte, definizione priorita. Ha accesso ai dati di business.
CTO Agent (Hermes via OpenRouter): task tecnici — review codice, monitoraggio servizi, identificazione bug.
CMO Agent (Claude Sonnet): marketing e contenuti — post social, analisi campagne, copy, monitoraggio competitor.
ZiClaw Agent (DeepSeek): task ad alto volume e basso costo — ricerche web, sintesi, analisi dati.
Livello 3: Tool condivisi
Telegram, filesystem, API esterne, database. L'orchestratore gestisce i permessi per ruolo.
Un ciclo operativo reale
Task: 'analizza le performance di questa settimana'. L'orchestratore lo riceve dal cron settimanale, assegna metriche al CTO, marketing al CMO, ricerche trend a ZiClaw. CEO Agent riceve i tre report e produce un piano d'azione. Report finale via Telegram in 3-5 minuti, senza intervento umano.
Perche multi-agent
- Costo: modelli economici per task semplici, potenti solo dove serve
- Qualita: agente focalizzato produce output migliori di uno generalista
- Parallelismo: piu agenti lavorano contemporaneamente
Come costruire il tuo sistema
- Identifica i ruoli: quali task si ripetono? Chi li fa? Inizia con un agente solo.
- Scegli i modelli: Claude Opus per decisioni, Hermes per tecnico ricorrente, DeepSeek per volume.
- Definisci i permessi: ogni agente solo i tool di cui ha bisogno.
- Costruisci l'orchestratore: AutoGen o CrewAI come base.
- Telegram dal primo giorno: ogni azione significativa deve generare una notifica.
Limiti da considerare
- Debugging complesso: servono log dettagliati per ogni agente
- Costi: chiamate parallele si accumulano rapidamente
- Allucinazioni propagate: un errore amplificato tra agenti
- Dipendenze: se l'orchestratore va giu, tutto si ferma
Per le basi: Cosa sono gli agenti AI. Per i componenti: OpenClaw e Hermes AI.
Un task end-to-end: la review settimanale di AiNextStudio
Ecco come Paperclip gestisce un lunedì mattina senza intervento umano:
- 07:00 — Cron trigger: l'orchestratore riceve il task "weekly review".
- 07:01 — Dispatch parallelo: assegna contemporaneamente: metriche prodotti a CTO Agent, performance campagne a CMO Agent, news AI della settimana a ZiClaw Agent.
- 07:02-07:05 — Esecuzione parallela: i tre agenti lavorano in simultanea. CTO interroga il database, CMO interroga l'API Meta Ads, ZiClaw fa ricerche web.
- 07:06 — Aggregazione: l'orchestratore riceve i tre report e li passa a CEO Agent con il contesto completo.
- 07:07 — Piano d'azione: CEO Agent (Claude Opus) analizza la settimana e produce: 3 priorità, 1 alert critico se presente, suggerimento per il contenuto LinkedIn del giorno.
- 07:08 — Output finale: report via Telegram, pronto prima che inizi la giornata lavorativa.
Totale: 8 minuti di lavoro agentico automatico che sostituisce 45-60 minuti di analisi manuale.
I tre principi del design multi-agent
1. Ogni agente ha un solo obiettivo
Un agente generalista che fa tutto tende a fare tutto male. Il CTO Agent fa solo review tecnica e monitoraggio servizi. Il CMO solo marketing e contenuti. La specializzazione migliora la qualità dell'output in modo misurabile.
2. I log devono essere ossessivi
In un sistema multi-agent, un errore in un agente può propagarsi e amplificarsi. Senza log dettagliati per ogni chiamata, ogni tool, ogni risposta, il debugging diventa impossibile. Ogni azione significativa deve lasciare una traccia persistente.
3. Il controllo umano deve essere sempre disponibile
Paperclip può essere fermato, rediretto o ridefinito via Telegram in qualsiasi momento. Ogni azione con impatto esterno (post social, email, modifica database) può essere messa in attesa di approvazione umana. Non è un sistema che prende decisioni irreversibili in autonomia.
Quando i sistemi multi-agent falliscono
Paperclip ha avuto i suoi fallimenti in produzione. I pattern più comuni:
- Orchestratore down = sistema down: è il singolo punto di fallimento. Se va offline, nessun agente riceve task. La soluzione: watchdog process e riavvio automatico.
- Errori che si propagano: se CTO Agent restituisce dati corrotti e CEO Agent li usa senza validazione, l'output finale è inutile. Ogni agente deve validare il proprio input.
- Costi fuori controllo: task che generano loop accumulano costi API rapidamente. Serve un budget cap per sessione e alerting su soglie anomale.
- Prompt degradation: nel tempo, aggiungere tool e contesto senza pulizia porta a prompt troppo lunghi e meno efficaci. La manutenzione dei prompt è un lavoro continuo.
Il futuro di Paperclip
La direzione: più agenti specializzati, meno generalisti. Non un solo CTO Agent che monitora tutto, ma un FunnelManager Agent che sa tutto su FunnelManager, un ColloquioAI Agent che conosce in profondità quel prodotto. Prompt più focalizzati, output più precisi.
Per capire i componenti: Cosa sono gli agenti AI, OpenClaw, Hermes AI.
Risorsa gratuita
Vuoi iniziare con l'AI?
Scarica la guida AI da Zero — PDF gratuito, pratico, senza tecnicismi.