SubQ 1M-Preview: Il Primo LLM Subquadratico per AI a Contesto Lungo

Alex Rivera • Pubblicato il 15/05/2026 - 23:16 • Aggiornato 07/06/2026 - 03:12 • 4 min di lettura • 234,395 • 15,583

3D render of glowing data streams forming a vast, infinite neural network landscape.

Indice

SubQ 1M-Preview Arriva con una Finestra di Contesto da 12 Milioni di Token
Perché l'Attenzione Subquadratica Cambia l'Economia dei Prompt Lunghi
Verifica Reale dei Benchmark Contro GPT-5.5 e Claude Opus
Cosa Significa per i Creatori che Realizzano Scene Estese

SubQ 1M-Preview Arriva con una Finestra di Contesto da 12 Milioni di Token

A partire dal 14 maggio 2026 Subquadratic Labs ha rilasciato SubQ 1M-Preview, il primo modello linguistico di grandi dimensioni subquadratico commerciale. Offre una finestra di contesto da 12 milioni di token e raggiunge prestazioni all'avanguardia consumando circa un quinto del calcolo di inferenza dei transformer convenzionali. L'accesso API è stato aperto subito dopo l'annuncio del 5 maggio, mirato specificamente a pipeline generative agentiche e a lungo contesto. I benchmark interni iniziali mostrano già il modello che gestisce catene di ragionamento estese e input multimodali senza il consueto aumento quadratico dei costi. Per chi ha visto i limiti di contesto soffocare storyboard dettagliati, i numeri sembrano un vero cambiamento radicale piuttosto che semplice marketing incrementale.

Perché l'Attenzione Subquadratica Cambia l'Economia dei Prompt Lunghi

I transformer tradizionali pagano una tassa quadratica per ogni token aggiunto. SubQ aggira questo muro di scalabilità grazie a un meccanismo di attenzione il cui costo computazionale cresce in modo molto più lineare. Il risultato pratico è che i creatori possono inserire intere breakdown di scene, script multi-shot o trascrizioni di riferimento di un'ora senza che il conto esploda. Ho trascorso un pomeriggio a testare la preview con un prompt video da 40.000 token che normalmente causerebbe timeout altrove. Ha restituito indicazioni coerenti fotogramma per fotogramma in un'unica passata. Onestamente, quel singolo test ha reso il cambio di architettura meno una curiosità di ricerca e più il nuovo standard.

Verifica Reale dei Benchmark Contro GPT-5.5 e Claude Opus

Nelle suite di ragionamento a lungo contesto la preview registra punteggi entro il 3-4% di GPT-5.5 utilizzando il 78% in meno di risorse al segno di 1 milione di token. Rispetto all'ultima variante di Claude Opus resta leggermente indietro sulla scrittura creativa ma guida sulla coerenza multimodale sostenuta una volta che i prompt superano i 200k token. Il costo per milione di token si attesta intorno al 22% delle tariffe frontier attuali secondo il listino prezzi pubblicato. Questi margini contano quando si iterano outline video da 10 minuti o si assemblano storyboard da 50 immagini. Il divario non è teorico; si manifesta nell'impatto reale sul portafoglio dopo una settimana di uso intensivo.

Cosa Significa per i Creatori che Realizzano Scene Estese

I prompt lunghi e coerenti sono improvvisamente abbastanza economici da essere trattati come materiale creativo di prima classe invece che un lusso costoso. I registi possono ora inserire bibbie complete dei personaggi, riferimenti di illuminazione e tracce di dialogo in una singola chiamata e ricevere liste di inquadrature utilizzabili senza acrobazie con i token. Gli stessi guadagni di efficienza stanno già emergendo in domini creativi adiacenti. I progressi nell'AI multimodale vengono già applicati alla creazione di contenuti per adulti come in questa analisi di Seedance 2.0. Il mio campione del tutto non scientifico di uno suggerisce che il vero vincitore saranno i flussi di lavoro iterativi: genera, rivedi, perfeziona attraverso decine di passaggi senza vedere il contatore salire al vecchio ritmo quadratico.

Domande Aperte sul Rilascio di SubQ

Che cos'è esattamente un modello subquadratico?

Un modello subquadratico sostituisce l'attenzione standard dei transformer con un meccanismo il cui costo computazionale cresce molto più lentamente del quadrato della lunghezza della sequenza. SubQ 1M-Preview utilizza uno di questi approcci per fornire risultati di livello frontier a circa un quinto del solito costo di inferenza per input molto lunghi.

Come aiuta una finestra di contesto da 12 milioni di token nei prompt video?

Permette ai creatori di incollare interi script di diversi minuti, liste di inquadrature, immagini di riferimento e trascrizioni audio in un'unica volta. Il modello mantiene la coerenza per tutta la lunghezza invece di costringere gli utenti a dividere il materiale e perdere la consistenza tra le scene.

SubQ 1M-Preview è disponibile per l'uso subito?

Sì. L'accesso API è stato lanciato il 5 maggio insieme all'annuncio della preview. Gli sviluppatori possono iscriversi direttamente tramite Subquadratic Labs e iniziare a testare la finestra di contesto da 12 M immediatamente.

Come si confronta il pricing con i modelli frontier attuali?

Le tariffe pubblicate in anticipo collocano SubQ a circa il 22% del costo per token di GPT-5.5 o degli equivalenti Claude Opus una volta che la lunghezza del contesto supera qualche centinaio di migliaia di token. Il risparmio aumenta con la dimensione del prompt, ed è qui che il vantaggio dell'architettura si mostra più chiaramente.

Crea il tuo video porno AI

Trasforma qualsiasi fantasia in un video Full HD realistico. 1.000+ scenari, posizioni e kink — 100% privato.

Inizia a Creare

🔒 100% Privato 🎬 Full HD fino a 60s 🔥 1.000+ Azioni

Condividi: X Reddit Telegram WhatsApp

L'autore

Alex Rivera

Giornalista di Tecnologia AI

Giornalista tech AI che dice quello che gli altri non osano. Copre AI generativa, modelli video e deep learning — senza hype, senza filtri.