Skip to main content
IperChat
EN
Accedi

Modelli AI

Quale modello LLM scegliere

Confronto fra i 13 modelli AI disponibili: capacità, finestra di contesto, crediti per messaggio e casi d'uso ideali.

Il modello LLM è il “cervello” del tuo agente: decide come capire le domande, come usare la knowledge base e che tono usare nelle risposte. IperChat ti dà accesso a 13 modelli da OpenAI e Anthropic — alcuni sono velocissimi e leggeri, altri ragionano in profondità su problemi complessi. Questa pagina ti aiuta a scegliere il modello giusto in base al tuo caso d’uso.

Imposti il modello dal pannello operativo, sezione “Configurazioni Agenti” (menu laterale → gruppo Agents). Apri la riga del tuo origin e vai in “Comportamento” → “Modello”. Puoi cambiarlo in qualunque momento: il nuovo modello è attivo entro 60 secondi sulle nuove conversazioni.

Tabella comparativa

ModelloProviderContestoCrediti / msgBest for
GPT-5.5OpenAI128k7Ragionamento massimo, casi specialistici
Claude Opus 4.7Anthropic200k5Documenti lunghi, ragionamento esteso
Claude Opus 4.6Anthropic200k5Alternativa Opus, leggermente meno recente
GPT-5.4OpenAI128k3Conversazioni complesse, alta accuratezza
GPT-5.3OpenAI128k3Equilibrio fra qualità e costo
Claude Sonnet 4.6Anthropic200k3Knowledge base grandi, lead qualification
GPT-5.2OpenAI128k2Conversazioni standard con reasoning
GPT-5.2 ChatOpenAI128k2Chat fluida, tono conversazionale
GPT-5 MiniOpenAI128k1Customer support, alto volume
Claude Haiku 4.5Anthropic200k1Risposte rapide su KB grandi
GPT-4.1 MiniOpenAI128k1Generalista economico
GPT-4oOpenAI128k1Modello collaudato, multilingua
GPT-4o MiniOpenAI128k1Volume massimo, costo minimo

Tier 1 — Massima capacità (5–7 crediti)

I modelli premium. Da usare quando l’accuratezza vale più del costo per messaggio: settori regolamentati, consulenze specialistiche, casi in cui un errore costa caro.

GPT-5.5

Il modello più potente di OpenAI nel catalogo. Reasoning effort configurabile per problemi che richiedono più passaggi di pensiero.

Best for:

  • Consulenze legali, sanitarie, finanziarie
  • Ragionamento multi-step su procedure complesse
  • Riassunti analitici di documenti tecnici
  • Settori in cui un’allucinazione costa molto

Claude Opus 4.7

Il flagship Anthropic con extended thinking adattivo: quando la domanda è semplice risponde subito, quando è complessa si prende il tempo di “pensare” prima di rispondere. Finestra di contesto 200k token, ideale per knowledge base molto grandi.

Best for:

  • Domande che spaziano su molti documenti contemporaneamente
  • Analisi di contratti, perizie, report lunghi
  • Conversazioni dove serve memoria del contesto a lungo termine
  • Tono naturale e ragionato

Claude Opus 4.6

Versione precedente di Opus, mantenuta per chi ha già configurazioni e prompt ottimizzati su questa generazione. Stesse caratteristiche di Opus 4.7 (200k contesto, extended thinking, 5 crediti) con risposte leggermente meno raffinate.

Best for:

  • Configurazioni già rodate su 4.6 (per stabilità)
  • Test di confronto fra generazioni Opus

Tier 2 — Bilanciati (2–3 crediti)

Il sweet spot per la maggior parte degli agenti in produzione. Buona qualità di risposta, costi sostenibili anche con volumi medio-alti.

Claude Sonnet 4.6

Sonnet è il “cavallo da lavoro” di Anthropic: 200k token di contesto, extended thinking quando serve, costo moderato. È la scelta di default per agenti che lavorano su knowledge base estese.

Best for:

  • Knowledge base grandi (100+ documenti)
  • Lead qualification con criteri articolati
  • Agenti multilingua con tono curato
  • Booking e gestione di flussi conversazionali

GPT-5.4

Modello recente di OpenAI con reasoning effort. Buon compromesso fra qualità e prezzo, ottimo per conversazioni in cui serve precisione ma non il massimo livello di analisi.

Best for:

  • Conversazioni complesse a costo contenuto
  • Domande che richiedono riferimenti puntuali alla KB
  • Agenti tecnici (IT, ingegneria, software)

GPT-5.3

Versione precedente di GPT-5.4. Stessi 3 crediti, capacità simili. Da considerare se hai test di confronto attivi.

Best for:

  • A/B test fra varianti GPT-5
  • Configurazioni già stabili su 5.3

GPT-5.2

Reasoning effort attivo a 2 crediti per messaggio. Più economico di 5.3 e 5.4 mantenendo capacità di ragionamento.

Best for:

  • Conversazioni standard con un minimo di reasoning
  • Volume medio con budget contenuto

GPT-5.2 Chat

Variante chat-tuned di 5.2: stesso costo (2 crediti) ma ottimizzata per dialoghi fluidi e tono colloquiale.

Best for:

  • Agenti customer-facing dove il tono conta
  • Chat informali, community, supporto self-service
  • Piccoli e-commerce con interazione amichevole

Tier 3 — Veloci ed economici (1 credito)

Per chi gestisce volumi alti: customer support standard, FAQ ripetitive, deflection di traffico. Risposte rapide a basso costo.

GPT-5 Mini

Versione mini di GPT-5 con reasoning effort. Sorprendentemente capace per il prezzo, ottima base se non vuoi pensarci troppo.

Best for:

  • Customer support su FAQ comuni
  • Deflection di richieste ripetitive
  • Traffico alto con budget controllato

Claude Haiku 4.5

Il modello più veloce di Anthropic, con la finestra di contesto da 200k token tipica della famiglia Claude. Niente extended thinking — è progettato per essere rapido. Ottimo per knowledge base estese che non richiedono ragionamento complesso.

Best for:

  • Knowledge base grandi con domande dirette
  • Customer support multicanale ad alto volume
  • Risposte rapide su contenuti ben strutturati

GPT-4.1 Mini

Generalista classico di OpenAI. Niente reasoning, ma supporta i parametri temperature e top_p se vuoi controllare la creatività delle risposte.

Best for:

  • Configurazioni che richiedono temperature personalizzata
  • Agenti con tono molto specifico (creativo o rigoroso)

GPT-4o

Modello multimodale collaudato di OpenAI. Eccellente supporto multilingua, qualità di scrittura naturale.

Best for:

  • Agenti multilingua con utenti internazionali
  • Casi in cui ti fidi di un modello “stabile” da mesi
  • Configurazioni esistenti che già funzionano bene

GPT-4o Mini

La versione mini di 4o: il modello più economico nel pool OpenAI. Massimo volume al costo minimo.

Best for:

  • Demo, prototipi, ambienti di test
  • Traffico altissimo dove il budget conta più della perfezione
  • Agenti di prima linea che fanno solo triage

Come scegliere

Una guida rapida per restringere la scelta in base al tuo caso d’uso:

  • Customer support, FAQ rapide, traffico alto → Tier 3: Claude Haiku 4.5 o GPT-5 Mini.
  • Lead qualification, booking, conversazioni di media complessità → Tier 2: Claude Sonnet 4.6 o GPT-5.4.
  • Settori regolamentati o consulenze specialistiche (legale, sanitario, finanziario) → Tier 1: Claude Opus 4.7 o GPT-5.5.
  • Knowledge base molto grande (100+ documenti, contratti lunghi) → famiglia Claude (200k contesto): Sonnet 4.6 o Opus 4.7.
  • Agente in inglese su contenuti tecniciGPT-5.4 o Claude Sonnet 4.6.
  • Demo, MVP, traffico di testGPT-4o Mini o GPT-5 Mini.

Prossimi passi