Il colosso hi-tech cinese Tencent ha rilasciato un nuovo modello di intelligenza artificiale, Hunyuan Turbo S, presentandolo come più veloce rispetto a DeepSeek. Secondo Tencent, Hunyuan Turbo S sarebbe capace di replicare alle richieste entro un secondo, distinguendosi da altre AI più lente. Scopriamo, più nel dettaglio, come funziona questo nuovo modello.
Leggi anche: Bitcoin, la cripto scende sotto gli 80mila dollari. Che cosa sta succedendo?
Tencent vs DeepSeek
A differenza dei tradizionali modelli slow-thinking come Deepseek R1 e Hunyuan T1, Tencent afferma che Hunyuan Turbo S dà “risposte istantanee”, migliorando la velocità di output e riducendo la latenza della prima parola del 44%: prestazioni che pesano in più aree come conoscenza, matematica e creazione, fornendo una nuova soluzione per la capacità di reazione dei modelli di grandi dimensioni.
L’ispirazione progettuale per Hunyuan Turbo S deriva dalla modalità fast-thinking, contraria, appunto, a quella messa a punto dagli altri modelli, su cui gli esseri umani fanno affidamento per il 90%-95% delle decisioni quotidiane basate sull’intuizione. In combinazione con la modalità slow-thinking dell’analisi razionale, fornisce al modello di grandi dimensioni capacità di risoluzione dei problemi più intelligenti ed efficienti.
In termini di architettura innovativa, Hunyuan Turbo S adotta una modalità di fusione Hybrid-Mamba-Transformer, riducendo la complessità computazionale e l’occupazione della cache KV-Cache dello schema Transformer tradizionale.
Attualmente, sviluppatori e utenti aziendali possono accedere a Hunyuan Turbo S tramite API sul sito Web di Tencent Cloud e usufruire di una prova gratuita di una settimana. Il prezzo è di 0,8 yuan/milione di token per l’input e 2 yuan/milione di token per l’output, con una significativa riduzione di prezzo rispetto al modello Hunyuan Turbo della generazione precedente.