📰 Tin tức AI

SubQ 1M-Preview: LLM Subquadratic Đầu Tiên cho AI Ngữ Cảnh Dài

Alex Rivera Alex Rivera 6 phút đọc 233,656 15,533
3D render of glowing data streams forming a vast, infinite neural network landscape.

Mục lục

  1. SubQ 1M-Preview Ra Mắt Với Cửa Sổ Context 12 Triệu Token
  2. Tại Sao Subquadratic Attention Thay Đổi Kinh Tế Của Prompt Dài
  3. Kiểm Chứng Benchmark So Với GPT-5.5 Và Claude Opus
  4. Điều Này Có Ý Nghĩa Gì Đối Với Nhà Sáng Tạo Xây Dựng Cảnh Dài

SubQ 1M-Preview Ra Mắt Với Cửa Sổ Context 12 Triệu Token

Tính đến ngày 14 tháng 5 năm 2026, Subquadratic Labs đã chính thức phát hành SubQ 1M-Preview, mô hình ngôn ngữ lớn subquadratic đầu tiên trên thị trường thương mại. Mô hình sở hữu cửa sổ ngữ cảnh 12 triệu token và đạt hiệu suất ngang ngửa các mô hình tiên phong, đồng thời chỉ tiêu tốn khoảng một phần năm chi phí suy luận so với transformer truyền thống. API đã được mở ngay sau thông báo ngày 5 tháng 5, nhắm thẳng vào các pipeline tạo sinh agentic và ngữ cảnh dài. Các benchmark nội bộ ban đầu cho thấy mô hình xử lý chuỗi suy luận mở rộng và đầu vào đa phương tiện mà không gặp tình trạng bùng nổ chi phí quadratic như thường thấy. Đối với những ai từng chứng kiến giới hạn ngữ cảnh làm nghẽn các storyboard chi tiết, những con số này thực sự là bước nhảy vọt chứ không chỉ là tiếp thị gia tăng.

Tại Sao Subquadratic Attention Thay Đổi Kinh Tế Của Prompt Dài

Transformer truyền thống phải chịu thuế quadratic mỗi khi thêm token. SubQ vượt qua rào cản này nhờ cơ chế attention có chi phí tính toán tăng gần như tuyến tính. Kết quả thực tế là người sáng tạo có thể đưa toàn bộ phân tích cảnh, kịch bản multi-shot hay bản ghi tham chiếu dài hàng giờ mà không lo chi phí tăng vọt. Tôi đã dành một buổi chiều stress-test bản preview với prompt video 40.000 token – thứ thường gây timeout ở nơi khác – và nhận được hướng dẫn chi tiết từng khung hình chỉ trong một lần chạy. Thử nghiệm này khiến sự chuyển đổi kiến trúc không còn là nghiên cứu tò mò mà trở thành tiêu chuẩn mới.

Kiểm Chứng Benchmark So Với GPT-5.5 Và Claude Opus

Trên các bộ benchmark suy luận ngữ cảnh dài, bản preview đạt điểm số chỉ thấp hơn 3-4% so với GPT-5.5 nhưng tiết kiệm tới 78% chi phí tính toán ở mức 1 triệu token. So với biến thể Claude Opus mới nhất, nó nhỉnh hơn một chút về độ mạch lạc đa phương tiện khi prompt vượt 200k token, dù hơi thua ở mảng viết sáng tạo. Chi phí mỗi triệu token chỉ bằng khoảng 22% so với mức frontier hiện tại theo bảng giá công khai. Khoản chênh lệch này rất đáng kể khi bạn lặp lại các dàn ý video 10 phút hoặc ghép 50 hình storyboard. Đây không phải lý thuyết mà là tác động thực tế lên ví tiền sau một tuần sử dụng mạnh.

Điều Này Có Ý Nghĩa Gì Đối Với Nhà Sáng Tạo Xây Dựng Cảnh Dài

Prompt dài và mạch lạc đột nhiên trở nên rẻ đến mức có thể coi là chất liệu sáng tạo hạng nhất thay vì xa xỉ. Đạo diễn giờ có thể đưa toàn bộ bible nhân vật, tham chiếu ánh sáng và track thoại vào một lần gọi duy nhất để nhận shot list usable mà không cần thủ thuật token. Hiệu quả tương tự cũng đang lan sang các lĩnh vực sáng tạo lân cận. Những tiến bộ trong AI đa phương tiện đã được áp dụng cho việc tạo nội dung người lớn như phân tích về Seedance 2.0. Theo quan sát cá nhân hoàn toàn không khoa học của tôi, người thắng cuộc thực sự sẽ là quy trình lặp lại: tạo – xem xét – tinh chỉnh qua hàng chục lần mà không lo đồng hồ chi phí chạy theo tốc độ quadratic cũ.

Những Câu Hỏi Mở Về Bản Phát Hành SubQ

Mô hình subquadratic chính xác là gì?

Mô hình subquadratic thay thế attention transformer tiêu chuẩn bằng cơ chế có chi phí tính toán tăng chậm hơn nhiều so với bình phương độ dài chuỗi. SubQ 1M-Preview sử dụng một phương pháp như vậy để mang lại kết quả cấp frontier với chi phí suy luận chỉ khoảng một phần năm so với mức thông thường cho đầu vào rất dài.

Cửa sổ context 12 triệu token giúp ích gì cho prompt video?

Nó cho phép nhà sáng tạo dán toàn bộ kịch bản nhiều phút, danh sách shot, hình ảnh tham chiếu và bản ghi âm thanh chỉ trong một lần. Mô hình duy trì độ mạch lạc xuyên suốt độ dài thay vì buộc người dùng phải chia nhỏ tài liệu và mất tính nhất quán giữa các cảnh.

SubQ 1M-Preview đã có thể sử dụng ngay bây giờ chưa?

Đúng vậy. API đã được mở từ ngày 5 tháng 5 cùng lúc với thông báo preview. Nhà phát triển có thể đăng ký trực tiếp qua Subquadratic Labs và bắt đầu thử nghiệm cửa sổ context 12 triệu token ngay lập tức.

Giá cả so với các mô hình frontier hiện tại như thế nào?

Mức giá công khai ban đầu đặt SubQ ở khoảng 22% chi phí mỗi token so với GPT-5.5 hoặc Claude Opus khi độ dài context vượt vài trăm nghìn token. Mức tiết kiệm tăng theo kích thước prompt, đây chính là nơi lợi thế kiến trúc thể hiện rõ nét nhất.

Tạo video khiêu dâm AI của riêng bạn

Biến mọi tưởng tượng thành video Full HD chân thực. 1.000+ kịch bản, tư thế & sở thích — 100% riêng tư.

Bắt Đầu Tạo Ngay
🔒 100% Riêng tư 🎬 Full HD lên đến 60 giây 🔥 1.000+ Hành động
Chia sẻ:

Về tác giả

Alex Rivera
Alex Rivera

Nhà báo Công nghệ AI

Nhà báo công nghệ AI nói thẳng những gì người khác ngại ngùng. Chuyên về generative AI, video models, và deep learning — không hype, không lọc.

Gói
2
Đăng nhập
Tạo

Video AI của bạn đã sẵn sàng để tạo

Video dài Rên rỉ & giọng nói Sáng tạo không giới hạn Ảnh thành Video

Tạo video phim porno AI đầu tiên của bạn

Không kiểm duyệt · HD 60s · mọi fantasy

Từ $8/tháng · Không hài lòng? Hoàn tiền đầy đủ, không cần lý do.

Tạo riêng tư · Thanh toán kín đáo

hoặc

Bằng việc tiếp tục, bạn đồng ý với Điều khoản Sử dụngChính sách Bảo mật của chúng tôi.

Từ $8/tháng Thanh toán kín đáo Hủy bất cứ lúc nào
hoặc khám phá mọi fetish