SubQ 1M-Preview: LLM Subkuadratik Pertama untuk AI Konteks Panjang
Daftar Isi
SubQ 1M-Preview Hadir dengan Window Konteks 12 Juta Token
Per 14 Mei 2026, Subquadratic Labs telah merilis SubQ 1M-Preview, model bahasa besar subkuadratik komersial pertama. Ia membawa jendela konteks 12 juta token dan menyamai performa frontier sambil menggunakan sekitar seperlima komputasi inferensi dari transformer konvensional. Akses API dibuka segera setelah pengumuman 5 Mei, ditargetkan untuk pipeline generatif agentik dan konteks panjang. Benchmark internal awal sudah menunjukkan model ini menangani rantai penalaran panjang dan input multimodal tanpa ledakan biaya kuadratik biasa. Bagi siapa pun yang pernah melihat batas konteks membatasi storyboard detail, angka-angka ini terasa seperti perubahan langkah nyata daripada pemasaran bertahap.
Mengapa Perhatian Subkuadratik Mengubah Ekonomi Prompt Panjang
Transformer tradisional membayar pajak kuadratik untuk setiap token yang ditambahkan. SubQ menghindari dinding penskalaan itu melalui mekanisme perhatian yang komputasinya tumbuh jauh lebih linear. Hasil praktisnya adalah kreator dapat memasukkan seluruh breakdown adegan, skrip multi-shot atau transkrip referensi berjam-jam tanpa tagihan meledak. Saya menghabiskan sore menguji preview pada prompt video 40.000 token yang biasanya memicu timeout di tempat lain. Ia mengembalikan panduan frame-by-frame yang koheren dalam satu kali proses. Jujur saja, tes tunggal itu membuat pergeseran arsitektur terasa kurang seperti keingintahuan riset dan lebih seperti baseline baru.
Pemeriksaan Realitas Benchmark Melawan GPT-5.5 dan Claude Opus
Pada suite penalaran konteks panjang, preview ini mencetak skor dalam 3-4% dari GPT-5.5 sambil menggunakan 78% lebih sedikit komputasi pada tanda 1 M token. Melawan varian Claude Opus terbaru, ia sedikit tertinggal pada penulisan kreatif tetapi memimpin pada koherensi multimodal berkelanjutan begitu prompt melebihi 200 k token. Biaya per juta token berada di sekitar 22% dari tarif frontier saat ini menurut lembar harga yang diterbitkan. Margin itu penting saat Anda mengiterasi outline video 10 menit atau menyatukan storyboard 50 gambar. Kesenjangan ini bukan teoretis; ia muncul dalam dampak dompet nyata setelah seminggu penggunaan berat.
Apa Artinya Ini bagi Kreator yang Membangun Adegan yang Diperpanjang
Prompt panjang dan koheren tiba-tiba cukup murah untuk diperlakukan sebagai material kreatif kelas satu daripada kemewahan mahal. Sutradara kini dapat menjatuhkan bibles karakter lengkap, referensi pencahayaan dan trek dialog ke dalam satu panggilan dan menerima daftar shot yang dapat digunakan tanpa senam token. Keuntungan efisiensi yang sama sudah muncul di domain kreatif yang berdekatan. Kemajuan dalam AI multimodal sudah diterapkan pada pembuatan konten dewasa seperti dalam analisis Seedance 2.0 ini. Sampel saya yang sama sekali tidak ilmiah dari satu menunjukkan pemenang sebenarnya akan menjadi alur kerja iteratif: menghasilkan, meninjau, menyempurnakan melintasi puluhan kali tanpa melihat meter naik pada tingkat kuadratik lama.
Pertanyaan Terbuka tentang Rilis SubQ
Apa sebenarnya model subkuadratik itu?
Model subkuadratik menggantikan perhatian transformer standar dengan mekanisme yang biaya komputasinya tumbuh jauh lebih lambat daripada kuadrat panjang urutan. SubQ 1M-Preview menggunakan salah satu pendekatan tersebut untuk memberikan hasil tingkat frontier pada sekitar seperlima biaya inferensi biasa untuk input yang sangat panjang.
Bagaimana window konteks 12 juta token membantu prompt video?
Ini memungkinkan kreator menempelkan seluruh skrip multi-menit, daftar shot, gambar referensi dan transkrip audio sekaligus. Model mempertahankan koherensi di seluruh panjangnya alih-alih memaksa pengguna untuk memotong material dan kehilangan konsistensi antar adegan.
Apakah SubQ 1M-Preview tersedia untuk digunakan sekarang?
Ya. Akses API diluncurkan pada 5 Mei bersamaan dengan pengumuman preview. Pengembang dapat mendaftar langsung melalui Subquadratic Labs dan mulai menguji window konteks 12 M segera.
Bagaimana harga dibandingkan dengan model frontier saat ini?
Tarif yang diterbitkan awal menempatkan SubQ pada sekitar 22% dari biaya per token GPT-5.5 atau Claude Opus setara begitu panjang konteks melebihi beberapa ratus ribu token. Penghematan meningkat seiring ukuran prompt, yang merupakan tempat keunggulan arsitektur paling jelas terlihat.
Buat Video Porno AI Anda Sendiri
Ubah fantasi apa pun menjadi video Full HD realistis. 1.000+ skenario, posisi & fetish — 100% pribadi.
Mulai MembuatTentang Penulis
Jurnalis Teknologi AI
Jurnalis tech AI yang berani bilang apa yang orang lain nggak mau. Meliput AI generatif, model video, dan deep learning — tanpa hype, tanpa filter.