Storia Progetti Blog Consulenza Scrivimi →
Home Blog Paperclip: come creare agenti AI che gestiscono un'azienda
Progetti

Paperclip: come creare agenti AI che gestiscono un'azienda

9 min min lettura
Paperclip: come creare agenti AI che gestiscono un'azienda — Raffaele Mele

Cosa succederebbe se potessi delegare le operazioni quotidiane della tua azienda a un team di agenti AI specializzati? Ognuno con il suo ruolo, il suo modello, i suoi tool — coordinati da un orchestratore centrale. Non e fantascienza: e Paperclip, il framework multi-agent che ho costruito per AiNextStudio.

Il nome: perche Paperclip

Riferimento ironico al pensiero esperimento di Nick Bostrom: un'AI che ottimizza la produzione di graffette fino a esaurire tutte le risorse del pianeta. Paperclip (il framework) fa l'opposto: agenti specializzati con obiettivi precisi e limiti chiari.

L'architettura

Paperclip gira su iMac alla porta 3100 con un'architettura gerarchica a tre livelli.

Livello 1: L'orchestratore

Riceve i task (Telegram, API o cron), li decompone e li assegna agli agenti. Monitora l'esecuzione, gestisce i fallimenti e aggrega i risultati.

Livello 2: Gli agenti specializzati

CEO Agent (Claude Opus): decisioni strategiche, valutazione proposte, definizione priorita. Ha accesso ai dati di business.

CTO Agent (Hermes via OpenRouter): task tecnici — review codice, monitoraggio servizi, identificazione bug.

CMO Agent (Claude Sonnet): marketing e contenuti — post social, analisi campagne, copy, monitoraggio competitor.

ZiClaw Agent (DeepSeek): task ad alto volume e basso costo — ricerche web, sintesi, analisi dati.

Livello 3: Tool condivisi

Telegram, filesystem, API esterne, database. L'orchestratore gestisce i permessi per ruolo.

Un ciclo operativo reale

Task: 'analizza le performance di questa settimana'. L'orchestratore lo riceve dal cron settimanale, assegna metriche al CTO, marketing al CMO, ricerche trend a ZiClaw. CEO Agent riceve i tre report e produce un piano d'azione. Report finale via Telegram in 3-5 minuti, senza intervento umano.

Perche multi-agent

  • Costo: modelli economici per task semplici, potenti solo dove serve
  • Qualita: agente focalizzato produce output migliori di uno generalista
  • Parallelismo: piu agenti lavorano contemporaneamente

Come costruire il tuo sistema

  1. Identifica i ruoli: quali task si ripetono? Chi li fa? Inizia con un agente solo.
  2. Scegli i modelli: Claude Opus per decisioni, Hermes per tecnico ricorrente, DeepSeek per volume.
  3. Definisci i permessi: ogni agente solo i tool di cui ha bisogno.
  4. Costruisci l'orchestratore: AutoGen o CrewAI come base.
  5. Telegram dal primo giorno: ogni azione significativa deve generare una notifica.

Limiti da considerare

  • Debugging complesso: servono log dettagliati per ogni agente
  • Costi: chiamate parallele si accumulano rapidamente
  • Allucinazioni propagate: un errore amplificato tra agenti
  • Dipendenze: se l'orchestratore va giu, tutto si ferma

Per le basi: Cosa sono gli agenti AI. Per i componenti: OpenClaw e Hermes AI.

Un task end-to-end: la review settimanale di AiNextStudio

Ecco come Paperclip gestisce un lunedì mattina senza intervento umano:

  1. 07:00 — Cron trigger: l'orchestratore riceve il task "weekly review".
  2. 07:01 — Dispatch parallelo: assegna contemporaneamente: metriche prodotti a CTO Agent, performance campagne a CMO Agent, news AI della settimana a ZiClaw Agent.
  3. 07:02-07:05 — Esecuzione parallela: i tre agenti lavorano in simultanea. CTO interroga il database, CMO interroga l'API Meta Ads, ZiClaw fa ricerche web.
  4. 07:06 — Aggregazione: l'orchestratore riceve i tre report e li passa a CEO Agent con il contesto completo.
  5. 07:07 — Piano d'azione: CEO Agent (Claude Opus) analizza la settimana e produce: 3 priorità, 1 alert critico se presente, suggerimento per il contenuto LinkedIn del giorno.
  6. 07:08 — Output finale: report via Telegram, pronto prima che inizi la giornata lavorativa.

Totale: 8 minuti di lavoro agentico automatico che sostituisce 45-60 minuti di analisi manuale.

I tre principi del design multi-agent

1. Ogni agente ha un solo obiettivo

Un agente generalista che fa tutto tende a fare tutto male. Il CTO Agent fa solo review tecnica e monitoraggio servizi. Il CMO solo marketing e contenuti. La specializzazione migliora la qualità dell'output in modo misurabile.

2. I log devono essere ossessivi

In un sistema multi-agent, un errore in un agente può propagarsi e amplificarsi. Senza log dettagliati per ogni chiamata, ogni tool, ogni risposta, il debugging diventa impossibile. Ogni azione significativa deve lasciare una traccia persistente.

3. Il controllo umano deve essere sempre disponibile

Paperclip può essere fermato, rediretto o ridefinito via Telegram in qualsiasi momento. Ogni azione con impatto esterno (post social, email, modifica database) può essere messa in attesa di approvazione umana. Non è un sistema che prende decisioni irreversibili in autonomia.

Quando i sistemi multi-agent falliscono

Paperclip ha avuto i suoi fallimenti in produzione. I pattern più comuni:

  • Orchestratore down = sistema down: è il singolo punto di fallimento. Se va offline, nessun agente riceve task. La soluzione: watchdog process e riavvio automatico.
  • Errori che si propagano: se CTO Agent restituisce dati corrotti e CEO Agent li usa senza validazione, l'output finale è inutile. Ogni agente deve validare il proprio input.
  • Costi fuori controllo: task che generano loop accumulano costi API rapidamente. Serve un budget cap per sessione e alerting su soglie anomale.
  • Prompt degradation: nel tempo, aggiungere tool e contesto senza pulizia porta a prompt troppo lunghi e meno efficaci. La manutenzione dei prompt è un lavoro continuo.

Il futuro di Paperclip

La direzione: più agenti specializzati, meno generalisti. Non un solo CTO Agent che monitora tutto, ma un FunnelManager Agent che sa tutto su FunnelManager, un ColloquioAI Agent che conosce in profondità quel prodotto. Prompt più focalizzati, output più precisi.

Per capire i componenti: Cosa sono gli agenti AI, OpenClaw, Hermes AI.

Risorsa gratuita

Vuoi iniziare con l'AI?

Scarica la guida AI da Zero — PDF gratuito, pratico, senza tecnicismi.

Domande frequenti
Cos'è Paperclip?
Paperclip è un framework multi-agent sviluppato da AiNextStudio che simula una struttura aziendale con agenti AI specializzati: CEO (Claude Opus per decisioni strategiche), CTO (Hermes per task tecnici), CMO (Claude Sonnet per marketing) e ZiClaw (DeepSeek per task ad alto volume). Gira su iMac locale alla porta 3100.
Come funziona un sistema multi-agent come Paperclip?
Un orchestratore centrale riceve i task, li decompone e li assegna agli agenti specializzati. Ogni agente ha il proprio modello AI, set di tool e area di competenza. Gli agenti lavorano in parallelo e l'orchestratore aggrega i risultati. Tutto è coordinato via Telegram per notifiche e approvazioni.
Posso costruire un sistema multi-agent simile a Paperclip?
Sì. I passi fondamentali sono: identificare i ruoli ricorrenti nella tua operatività, scegliere i modelli giusti per ogni ruolo (modelli economici per volume, potenti per decisioni), definire i permessi per agente, costruire l'orchestratore con AutoGen o CrewAI, e integrare Telegram dal primo giorno per il controllo remoto.
Paperclip è disponibile al pubblico?
Paperclip è un progetto sperimentale sviluppato da Raffaele Mele per gestire internamente i propri business AI. Non è un prodotto disponibile al pubblico o su GitHub. Il progetto serve come proof-of-concept di un'orchestrazione multi-agent applicata a un'azienda reale, non come prodotto commercializzabile.
Quanto costa mantenere un sistema multi-agent come Paperclip?
I costi dipendono principalmente dall'uso delle API AI. Un sistema con 3-5 agenti attivi che lavorano alcune ore al giorno su task come analisi, scrittura e pubblicazione può costare tra $30 e $150 al mese in API. A cui si aggiunge il server (€10-30/mese su un VPS). Molto meno di un team umano equivalente per task strutturati e ripetitivi.
Qual è il rischio principale di un sistema multi-agent autonomo?
Il rischio più concreto è l'azione errata difficile da reversire: un agente che pubblica contenuto sbagliato, manda email di massa con errori, o elimina dati. Per mitigarlo si usano checkpoint di approvazione umana per le azioni critiche, log completi di ogni azione, e permessi minimi per ogni agente. L'autonomia va aumentata gradualmente, validando ogni passo prima di togliere la supervisione umana.