Pelancaran Gemini 3.5 Flash Omni

Apa yang Google Dedahkan di I/O 2026

Sehingga 20 Mei 2026, habuk masih belum reda di Google I/O 2026, dan pengumuman tersebut sudah terasa seperti langkah maju yang bermakna untuk alat multimodal. Gemini 3.5 Flash kini menjadi model lalai merentas aplikasi Gemini dan mod AI dalam Carian. Ia menghantar kira-kira empat kali kelajuan pendahulunya sambil mempertajamkan bantuan pengekodan dan tingkah laku agentik, semuanya pada kos inferens yang lebih rendah. Pada acara yang sama Google memperkenalkan Gemini Omni, model dunia multimodal yang mampu menukar sebarang campuran teks, imej pegun, klip video dan audio menjadi output video yang koheren. Demo awal menunjukkan model tersebut menjahit prompt teks pendek dengan foto rujukan dan beberapa saat bunyi ambien menjadi gerakan yang stabil secara mengejutkan. Pelancaran segera Gemini Omni Flash menyasarkan pelanggan Google AI Plus, Pro dan Ultra melalui aplikasi utama, Google Flow dan YouTube Shorts, dengan akses API yang lebih luas dijangka dalam beberapa minggu akan datang.

Iterasi Lebih Pantas dan Kawalan Lebih Ketat untuk Aliran Kerja Harian

Kelajuan dan konsistensi lebih penting kepada pencipta berbanding spesifikasi utama. Peningkatan prestasi Gemini 3.5 Flash seharusnya memendekkan masa antara prompt dan output yang boleh digunakan, yang penting apabila anda sedang memperhalusi jujukan merentas beberapa ambil. Naik taraf agentik juga membolehkan model merancang tugas pelbagai langkah mudah, seperti menjana papan cerita kemudian melanjutkan bingkai terpilih menjadi klip pendek. Pendekatan input campuran Gemini Omni terasa sangat berguna untuk saluran paip imej-ke-video. Pencipta boleh menyuapkan imej pegun sedia ada, video rujukan gaya dan nota suara pendek yang menerangkan pergerakan kamera, kemudian menerima output yang menghormati ketiga-tiga isyarat sekaligus. Tahap kawalan tersebut sebelum ini sukar dicapai tanpa pasca-pengeluaran yang berat.

Kelebihan Praktikal untuk Pencipta Imej, Video dan Multimodal

Pematuhan prompt yang lebih baik dan konsistensi watak adalah dua penambahbaikan yang paling kerap disebut pencipta dalam ujian awal. Apabila gerakan kekal berlabuh pada subjek yang sama merentas shot, masa penyuntingan menurun dengan ketara. Prompt media campuran juga membuka eksperimen kreatif yang lebih kecil: memasukkan render produk ke dalam adegan gaya hidup, atau melapisi dialog di atas footage yang dijana, tanpa membina semula keseluruhan shot dari awal. Sejujurnya, selepas menjalankan beberapa ujian input campuran sendiri, saya mendapati hasilnya lebih boleh digunakan daripada jangkaan, walaupun masih jauh dari sempurna untuk pergerakan kamera yang kompleks. Kemajuan multimodal seperti ini sudah membentuk alat video generasi seterusnya, termasuk perbincangan berterusan mengenai pengendalian kandungan eksplisit oleh Gemini Omni, yang saya terokai dengan lebih terperinci di sini: Gemini omni nsfw: Mengapa Model Video AI Google Menyekat Kandungan Eksplisit.

Soalan yang Pencipta Tanya Sekarang

Bagaimana saya mengakses Gemini 3.5 Flash dan Gemini Omni hari ini?

Gemini 3.5 Flash sudah aktif sebagai model lalai dalam aplikasi Gemini dan mod AI Carian. Gemini Omni Flash tersedia serta-merta kepada pelanggan Google AI Plus, Pro dan Ultra di dalam aplikasi, Google Flow dan YouTube Shorts.

Teknik prompt manakah yang paling berkesan dengan ciri multimodal baharu?

Gabungkan penerangan subjek yang jelas dengan imej rujukan atau klip pendek dan, jika boleh, isyarat audio ringkas untuk masa atau nada. Model ini bertindak balas dengan baik kepada arahan eksplisit tentang pergerakan kamera dan kesinambungan pencahayaan.

Bagaimana Gemini 3.5 Flash berbeza daripada versi Gemini sebelumnya?

Keluaran 3.5 Flash memfokuskan pada kelajuan, perancangan agentik yang lebih kukuh dan kos yang dikurangkan. Bantuan pengekodan dan pengendalian tugas pelbagai langkah telah bertambah baik dengan ketara berbanding generasi sebelumnya.

Bilakah akses API dan enterprise akan tiba?

Akses API yang lebih luas dijangka dalam beberapa minggu akan datang, walaupun Google belum menerbitkan tarikh pelancaran enterprise yang tepat lagi.

Pelancaran Gemini 3.5 Flash Omni: Kemas Kini AI Multimodal Google untuk Pencipta

Jadual Kandungan

Apa yang Google Dedahkan di I/O 2026

Iterasi Lebih Pantas dan Kawalan Lebih Ketat untuk Aliran Kerja Harian

Kelebihan Praktikal untuk Pencipta Imej, Video dan Multimodal

Soalan yang Pencipta Tanya Sekarang

Bagaimana saya mengakses Gemini 3.5 Flash dan Gemini Omni hari ini?

Teknik prompt manakah yang paling berkesan dengan ciri multimodal baharu?

Bagaimana Gemini 3.5 Flash berbeza daripada versi Gemini sebelumnya?

Bilakah akses API dan enterprise akan tiba?

Cipta Video Lucah AI Anda Sendiri

Tentang Penulis

Video AI anda sedia untuk dicipta

Cipta video porno AI pertama anda

Semak peti masuk anda