SubQ 1M-Preview: Първият субквадратичен LLM за дългоконекстен AI

Alex Rivera • Публикувано на 15.05.2026 - 23:16 • Актуализирано 8.06.2026 - 17:02 • 1 мин четене • 233,006 • 15,490

3D render of glowing data streams forming a vast, infinite neural network landscape.

Съдържание

SubQ 1M-Preview се появява с контекстен прозорец от 12 милиона токена
Защо субквадратичната attention променя икономиката на дългите промптове
Реална проверка на бенчмарковете спрямо GPT-5.5 и Claude Opus
Какво означава това за създателите на разширени сцени

SubQ 1M-Preview се появява с контекстен прозорец от 12 милиона токена

Към 14 май 2026 г. Subquadratic Labs пусна SubQ 1M-Preview – първия търговски субквадратичен голям езиков модел. Той разполага с контекстен прозорец от 12 милиона токена и достига производителността на водещи модели, като използва приблизително една пета от изчислителните ресурси за инференция в сравнение с конвенционалните трансформери. Достъпът до API беше отворен веднага след обявяването на 5 май, насочен изцяло към агентни и генеративни пайплайни с дълъг контекст. Ранните вътрешни бенчмаркове вече показват, че моделът обработва удължени вериги за разсъждение и мултимодални входове без обичайното квадратично нарастване на разходите. За всеки, който е наблюдавал как ограниченията на контекста задушават детайлните сторибордове, числата се чувстват като истинска стъпка напред, а не като поредния маркетингов трик.

Защо субквадратичната attention променя икономиката на дългите промптове

Традиционните трансформери плащат квадратичен данък за всеки добавен токен. SubQ заобикаля тази бариера чрез attention механизъм, чиито изчисления нарастват много по-линейно. Практическият резултат е, че създателите могат да подават цели разпределения на сцени, мултишот скриптове или часови референтни транскрипти, без сметката да експлодира. Прекарах един следобед, тествайки превюто с 40 000-токенен видео промпт, който обикновено предизвиква таймаути другаде. Моделът върна съгласувана кадър по кадър насока само в един проход. Честно казано, този единствен тест превърна архитектурната промяна от научна любопитност в новия стандарт.

Реална проверка на бенчмарковете спрямо GPT-5.5 и Claude Opus

В тестовете за дълъг контекст превюто постига резултати в рамките на 3-4 % от GPT-5.5, като използва 78 % по-малко изчисления при 1 M токена. В сравнение с най-новия вариант на Claude Opus леко изостава по креативно писане, но води по устойчива мултимодална съгласуваност, когато промптовете надхвърлят 200 k токена. Цената на милион токена е приблизително 22 % от текущите цени на водещи модели според публикуваните цени. Тези маржове са важни, когато итерирате 10-минутни видео очертания или свързвате 50-изображения сторибордове. Разликата не е теоретична – тя се усеща реално в портфейла след седмица интензивна употреба.

Какво означава това за създателите на разширени сцени

Дългите, съгласувани промптове внезапно станаха достатъчно евтини, за да се третират като първокласен творчески материал, а не като скъп лукс. Режисьорите вече могат да вкарат цели библейски описания на герои, референции за осветление и диалогови пътеки в едно обаждане и да получат готови списъци с кадри без токенни гимнастики. Същите икономии вече се появяват и в съседни творчески области. Напредъкът в мултимодалния AI вече се прилага в създаването на adult съдържание, както се вижда в този анализ на Seedance 2.0. Напълно ненаучната ми извадка от един човек подсказва, че истинският победител ще бъдат итеративните работни процеси: генериране, преглед и усъвършенстване през десетки проходи, без да се наблюдава как броячът расте със старата квадратична скорост.

Отворени въпроси около пускането на SubQ

Какво точно представлява субквадратичният модел?

Субквадратичният модел заменя стандартното attention на трансформера с механизъм, чиято изчислителна цена нараства значително по-бавно от квадрата на дължината на последователността. SubQ 1M-Preview използва точно такъв подход, за да постигне резултати на ниво водещи модели при приблизително една пета от обичайната цена за инференция при много дълги входове.

Как помага контекстният прозорец от 12 милиона токена при видео промптове?

Позволява на създателите да поставят цели мултиминутни сценарии, списъци с кадри, референтни изображения и аудио транскрипти наведнъж. Моделът поддържа съгласуваност по цялата дължина, вместо да принуждава потребителите да разделят материала и да губят последователността между сцените.

Достъпен ли е SubQ 1M-Preview за ползване още сега?

Да. Достъпът до API беше пуснат на 5 май заедно с обявяването на превюто. Разработчиците могат да се регистрират директно чрез Subquadratic Labs и да започнат тестването на 12 M контекстния прозорец веднага.

Как се сравнява цената с текущите водещи модели?

Първоначално публикуваните цени поставят SubQ на около 22 % от цената на токен на GPT-5.5 или Claude Opus еквиваленти, когато дължината на контекста надхвърля няколкостотин хиляди токена. Спестяванията нарастват с размера на промпта – точно там архитектурното предимство се проявява най-ясно.

Създайте свое AI порно видео

Превърнете всяка фантазия в реалистично Full HD видео. 1,000+ сценария, пози и фетиши — 100% поверително.

Започнете Сега

🔒 100% Поверително 🎬 Full HD до 60 сек 🔥 1 000+ действия

Споделяне: X Reddit Telegram WhatsApp

За автора

Alex Rivera

Журналист по AI технологии

AI журналист по технологии, който казва онова, което другите не посмяват. Покрива генеративен AI, видео модели и deep learning — без хайп, без филтър.