Quale modello LLM scegliere

Il modello LLM è il “cervello” del tuo agente: decide come capire le domande, come usare la knowledge base e che tono usare nelle risposte. IperChat ti dà accesso a 13 modelli da OpenAI e Anthropic — alcuni sono velocissimi e leggeri, altri ragionano in profondità su problemi complessi. Questa pagina ti aiuta a scegliere il modello giusto in base al tuo caso d’uso.

Imposti il modello dal pannello operativo, sezione “Configurazioni Agenti” (menu laterale → gruppo Agents). Apri la riga del tuo origin e vai in “Comportamento” → “Modello”. Puoi cambiarlo in qualunque momento: il nuovo modello è attivo entro 60 secondi sulle nuove conversazioni.

Tabella comparativa

Modello	Provider	Contesto	Crediti / msg	Best for
GPT-5.5	OpenAI	128k	7	Ragionamento massimo, casi specialistici
Claude Opus 4.7	Anthropic	200k	5	Documenti lunghi, ragionamento esteso
Claude Opus 4.6	Anthropic	200k	5	Alternativa Opus, leggermente meno recente
GPT-5.4	OpenAI	128k	3	Conversazioni complesse, alta accuratezza
GPT-5.3	OpenAI	128k	3	Equilibrio fra qualità e costo
Claude Sonnet 4.6	Anthropic	200k	3	Knowledge base grandi, lead qualification
GPT-5.2	OpenAI	128k	2	Conversazioni standard con reasoning
GPT-5.2 Chat	OpenAI	128k	2	Chat fluida, tono conversazionale
GPT-5 Mini	OpenAI	128k	1	Customer support, alto volume
Claude Haiku 4.5	Anthropic	200k	1	Risposte rapide su KB grandi
GPT-4.1 Mini	OpenAI	128k	1	Generalista economico
GPT-4o	OpenAI	128k	1	Modello collaudato, multilingua
GPT-4o Mini	OpenAI	128k	1	Volume massimo, costo minimo

Tier 1 — Massima capacità (5–7 crediti)

I modelli premium. Da usare quando l’accuratezza vale più del costo per messaggio: settori regolamentati, consulenze specialistiche, casi in cui un errore costa caro.

GPT-5.5

Il modello più potente di OpenAI nel catalogo. Reasoning effort configurabile per problemi che richiedono più passaggi di pensiero.

Best for:

Consulenze legali, sanitarie, finanziarie
Ragionamento multi-step su procedure complesse
Riassunti analitici di documenti tecnici
Settori in cui un’allucinazione costa molto

Claude Opus 4.7

Il flagship Anthropic con extended thinking adattivo: quando la domanda è semplice risponde subito, quando è complessa si prende il tempo di “pensare” prima di rispondere. Finestra di contesto 200k token, ideale per knowledge base molto grandi.

Best for:

Domande che spaziano su molti documenti contemporaneamente
Analisi di contratti, perizie, report lunghi
Conversazioni dove serve memoria del contesto a lungo termine
Tono naturale e ragionato

Claude Opus 4.6

Versione precedente di Opus, mantenuta per chi ha già configurazioni e prompt ottimizzati su questa generazione. Stesse caratteristiche di Opus 4.7 (200k contesto, extended thinking, 5 crediti) con risposte leggermente meno raffinate.

Best for:

Configurazioni già rodate su 4.6 (per stabilità)
Test di confronto fra generazioni Opus

Tier 2 — Bilanciati (2–3 crediti)

Il sweet spot per la maggior parte degli agenti in produzione. Buona qualità di risposta, costi sostenibili anche con volumi medio-alti.

Claude Sonnet 4.6

Sonnet è il “cavallo da lavoro” di Anthropic: 200k token di contesto, extended thinking quando serve, costo moderato. È la scelta di default per agenti che lavorano su knowledge base estese.

Best for:

Knowledge base grandi (100+ documenti)
Lead qualification con criteri articolati
Agenti multilingua con tono curato
Booking e gestione di flussi conversazionali

GPT-5.4

Modello recente di OpenAI con reasoning effort. Buon compromesso fra qualità e prezzo, ottimo per conversazioni in cui serve precisione ma non il massimo livello di analisi.

Best for:

Conversazioni complesse a costo contenuto
Domande che richiedono riferimenti puntuali alla KB
Agenti tecnici (IT, ingegneria, software)

GPT-5.3

Versione precedente di GPT-5.4. Stessi 3 crediti, capacità simili. Da considerare se hai test di confronto attivi.

Best for:

A/B test fra varianti GPT-5
Configurazioni già stabili su 5.3

GPT-5.2

Reasoning effort attivo a 2 crediti per messaggio. Più economico di 5.3 e 5.4 mantenendo capacità di ragionamento.

Best for:

Conversazioni standard con un minimo di reasoning
Volume medio con budget contenuto

GPT-5.2 Chat

Variante chat-tuned di 5.2: stesso costo (2 crediti) ma ottimizzata per dialoghi fluidi e tono colloquiale.

Best for:

Agenti customer-facing dove il tono conta
Chat informali, community, supporto self-service
Piccoli e-commerce con interazione amichevole

Tier 3 — Veloci ed economici (1 credito)

Per chi gestisce volumi alti: customer support standard, FAQ ripetitive, deflection di traffico. Risposte rapide a basso costo.

GPT-5 Mini

Versione mini di GPT-5 con reasoning effort. Sorprendentemente capace per il prezzo, ottima base se non vuoi pensarci troppo.

Best for:

Customer support su FAQ comuni
Deflection di richieste ripetitive
Traffico alto con budget controllato

Claude Haiku 4.5

Il modello più veloce di Anthropic, con la finestra di contesto da 200k token tipica della famiglia Claude. Niente extended thinking — è progettato per essere rapido. Ottimo per knowledge base estese che non richiedono ragionamento complesso.

Best for:

Knowledge base grandi con domande dirette
Customer support multicanale ad alto volume
Risposte rapide su contenuti ben strutturati

GPT-4.1 Mini

Generalista classico di OpenAI. Niente reasoning, ma supporta i parametri temperature e top_p se vuoi controllare la creatività delle risposte.

Best for:

Configurazioni che richiedono temperature personalizzata
Agenti con tono molto specifico (creativo o rigoroso)

GPT-4o

Modello multimodale collaudato di OpenAI. Eccellente supporto multilingua, qualità di scrittura naturale.

Best for:

Agenti multilingua con utenti internazionali
Casi in cui ti fidi di un modello “stabile” da mesi
Configurazioni esistenti che già funzionano bene

GPT-4o Mini

La versione mini di 4o: il modello più economico nel pool OpenAI. Massimo volume al costo minimo.

Best for:

Demo, prototipi, ambienti di test
Traffico altissimo dove il budget conta più della perfezione
Agenti di prima linea che fanno solo triage

Come scegliere

Una guida rapida per restringere la scelta in base al tuo caso d’uso:

Customer support, FAQ rapide, traffico alto → Tier 3: Claude Haiku 4.5 o GPT-5 Mini.
Lead qualification, booking, conversazioni di media complessità → Tier 2: Claude Sonnet 4.6 o GPT-5.4.
Settori regolamentati o consulenze specialistiche (legale, sanitario, finanziario) → Tier 1: Claude Opus 4.7 o GPT-5.5.
Knowledge base molto grande (100+ documenti, contratti lunghi) → famiglia Claude (200k contesto): Sonnet 4.6 o Opus 4.7.
Agente in inglese su contenuti tecnici → GPT-5.4 o Claude Sonnet 4.6.
Demo, MVP, traffico di test → GPT-4o Mini o GPT-5 Mini.

Tabella comparativa

Tier 1 — Massima capacità (5–7 crediti)

GPT-5.5

Claude Opus 4.7

Claude Opus 4.6

Tier 2 — Bilanciati (2–3 crediti)

Claude Sonnet 4.6

GPT-5.4

GPT-5.3

GPT-5.2

GPT-5.2 Chat

Tier 3 — Veloci ed economici (1 credito)

GPT-5 Mini

Claude Haiku 4.5

GPT-4.1 Mini

GPT-4o

GPT-4o Mini

Come scegliere

Prossimi passi