Modelli AI
Quale modello LLM scegliere
Confronto fra i 13 modelli AI disponibili: capacità, finestra di contesto, crediti per messaggio e casi d'uso ideali.
Il modello LLM è il “cervello” del tuo agente: decide come capire le domande, come usare la knowledge base e che tono usare nelle risposte. IperChat ti dà accesso a 13 modelli da OpenAI e Anthropic — alcuni sono velocissimi e leggeri, altri ragionano in profondità su problemi complessi. Questa pagina ti aiuta a scegliere il modello giusto in base al tuo caso d’uso.
Imposti il modello dal pannello operativo, sezione “Configurazioni Agenti” (menu laterale → gruppo Agents). Apri la riga del tuo origin e vai in “Comportamento” → “Modello”. Puoi cambiarlo in qualunque momento: il nuovo modello è attivo entro 60 secondi sulle nuove conversazioni.
Tabella comparativa
| Modello | Provider | Contesto | Crediti / msg | Best for |
|---|---|---|---|---|
| GPT-5.5 | OpenAI | 128k | 7 | Ragionamento massimo, casi specialistici |
| Claude Opus 4.7 | Anthropic | 200k | 5 | Documenti lunghi, ragionamento esteso |
| Claude Opus 4.6 | Anthropic | 200k | 5 | Alternativa Opus, leggermente meno recente |
| GPT-5.4 | OpenAI | 128k | 3 | Conversazioni complesse, alta accuratezza |
| GPT-5.3 | OpenAI | 128k | 3 | Equilibrio fra qualità e costo |
| Claude Sonnet 4.6 | Anthropic | 200k | 3 | Knowledge base grandi, lead qualification |
| GPT-5.2 | OpenAI | 128k | 2 | Conversazioni standard con reasoning |
| GPT-5.2 Chat | OpenAI | 128k | 2 | Chat fluida, tono conversazionale |
| GPT-5 Mini | OpenAI | 128k | 1 | Customer support, alto volume |
| Claude Haiku 4.5 | Anthropic | 200k | 1 | Risposte rapide su KB grandi |
| GPT-4.1 Mini | OpenAI | 128k | 1 | Generalista economico |
| GPT-4o | OpenAI | 128k | 1 | Modello collaudato, multilingua |
| GPT-4o Mini | OpenAI | 128k | 1 | Volume massimo, costo minimo |
Tier 1 — Massima capacità (5–7 crediti)
I modelli premium. Da usare quando l’accuratezza vale più del costo per messaggio: settori regolamentati, consulenze specialistiche, casi in cui un errore costa caro.
GPT-5.5
Il modello più potente di OpenAI nel catalogo. Reasoning effort configurabile per problemi che richiedono più passaggi di pensiero.
Best for:
- Consulenze legali, sanitarie, finanziarie
- Ragionamento multi-step su procedure complesse
- Riassunti analitici di documenti tecnici
- Settori in cui un’allucinazione costa molto
Claude Opus 4.7
Il flagship Anthropic con extended thinking adattivo: quando la domanda è semplice risponde subito, quando è complessa si prende il tempo di “pensare” prima di rispondere. Finestra di contesto 200k token, ideale per knowledge base molto grandi.
Best for:
- Domande che spaziano su molti documenti contemporaneamente
- Analisi di contratti, perizie, report lunghi
- Conversazioni dove serve memoria del contesto a lungo termine
- Tono naturale e ragionato
Claude Opus 4.6
Versione precedente di Opus, mantenuta per chi ha già configurazioni e prompt ottimizzati su questa generazione. Stesse caratteristiche di Opus 4.7 (200k contesto, extended thinking, 5 crediti) con risposte leggermente meno raffinate.
Best for:
- Configurazioni già rodate su 4.6 (per stabilità)
- Test di confronto fra generazioni Opus
Tier 2 — Bilanciati (2–3 crediti)
Il sweet spot per la maggior parte degli agenti in produzione. Buona qualità di risposta, costi sostenibili anche con volumi medio-alti.
Claude Sonnet 4.6
Sonnet è il “cavallo da lavoro” di Anthropic: 200k token di contesto, extended thinking quando serve, costo moderato. È la scelta di default per agenti che lavorano su knowledge base estese.
Best for:
- Knowledge base grandi (100+ documenti)
- Lead qualification con criteri articolati
- Agenti multilingua con tono curato
- Booking e gestione di flussi conversazionali
GPT-5.4
Modello recente di OpenAI con reasoning effort. Buon compromesso fra qualità e prezzo, ottimo per conversazioni in cui serve precisione ma non il massimo livello di analisi.
Best for:
- Conversazioni complesse a costo contenuto
- Domande che richiedono riferimenti puntuali alla KB
- Agenti tecnici (IT, ingegneria, software)
GPT-5.3
Versione precedente di GPT-5.4. Stessi 3 crediti, capacità simili. Da considerare se hai test di confronto attivi.
Best for:
- A/B test fra varianti GPT-5
- Configurazioni già stabili su 5.3
GPT-5.2
Reasoning effort attivo a 2 crediti per messaggio. Più economico di 5.3 e 5.4 mantenendo capacità di ragionamento.
Best for:
- Conversazioni standard con un minimo di reasoning
- Volume medio con budget contenuto
GPT-5.2 Chat
Variante chat-tuned di 5.2: stesso costo (2 crediti) ma ottimizzata per dialoghi fluidi e tono colloquiale.
Best for:
- Agenti customer-facing dove il tono conta
- Chat informali, community, supporto self-service
- Piccoli e-commerce con interazione amichevole
Tier 3 — Veloci ed economici (1 credito)
Per chi gestisce volumi alti: customer support standard, FAQ ripetitive, deflection di traffico. Risposte rapide a basso costo.
GPT-5 Mini
Versione mini di GPT-5 con reasoning effort. Sorprendentemente capace per il prezzo, ottima base se non vuoi pensarci troppo.
Best for:
- Customer support su FAQ comuni
- Deflection di richieste ripetitive
- Traffico alto con budget controllato
Claude Haiku 4.5
Il modello più veloce di Anthropic, con la finestra di contesto da 200k token tipica della famiglia Claude. Niente extended thinking — è progettato per essere rapido. Ottimo per knowledge base estese che non richiedono ragionamento complesso.
Best for:
- Knowledge base grandi con domande dirette
- Customer support multicanale ad alto volume
- Risposte rapide su contenuti ben strutturati
GPT-4.1 Mini
Generalista classico di OpenAI. Niente reasoning, ma supporta i parametri temperature e top_p se vuoi controllare la creatività delle risposte.
Best for:
- Configurazioni che richiedono temperature personalizzata
- Agenti con tono molto specifico (creativo o rigoroso)
GPT-4o
Modello multimodale collaudato di OpenAI. Eccellente supporto multilingua, qualità di scrittura naturale.
Best for:
- Agenti multilingua con utenti internazionali
- Casi in cui ti fidi di un modello “stabile” da mesi
- Configurazioni esistenti che già funzionano bene
GPT-4o Mini
La versione mini di 4o: il modello più economico nel pool OpenAI. Massimo volume al costo minimo.
Best for:
- Demo, prototipi, ambienti di test
- Traffico altissimo dove il budget conta più della perfezione
- Agenti di prima linea che fanno solo triage
Come scegliere
Una guida rapida per restringere la scelta in base al tuo caso d’uso:
- Customer support, FAQ rapide, traffico alto → Tier 3: Claude Haiku 4.5 o GPT-5 Mini.
- Lead qualification, booking, conversazioni di media complessità → Tier 2: Claude Sonnet 4.6 o GPT-5.4.
- Settori regolamentati o consulenze specialistiche (legale, sanitario, finanziario) → Tier 1: Claude Opus 4.7 o GPT-5.5.
- Knowledge base molto grande (100+ documenti, contratti lunghi) → famiglia Claude (200k contesto): Sonnet 4.6 o Opus 4.7.
- Agente in inglese su contenuti tecnici → GPT-5.4 o Claude Sonnet 4.6.
- Demo, MVP, traffico di test → GPT-4o Mini o GPT-5 Mini.