Lançamento do Gemini 3.5 Flash Omni: Atualização de IA Multimodal da Google para Criadores
Índice
O que o Google Revelou no I/O 2026
A partir de 20 de maio de 2026, a poeira mal assentou no Google I/O 2026, e os anúncios já parecem um passo significativo para ferramentas multimodais. O Gemini 3.5 Flash agora é o modelo padrão no app Gemini e no modo de IA no Search. Ele oferece aproximadamente quatro vezes a velocidade do seu antecessor, melhorando a assistência de codificação e comportamentos agenticos, tudo com custos de inferência mais baixos. No mesmo evento, o Google apresentou o Gemini Omni, um modelo de mundo multimodal capaz de transformar qualquer mistura de texto, imagens estáticas, clipes de vídeo e áudio em saída de vídeo coerente. Os primeiros demos mostraram o modelo combinando um prompt de texto curto com uma fotografia de referência e alguns segundos de som ambiente em um movimento surpreendentemente estável. O lançamento imediato do Gemini Omni Flash é direcionado aos assinantes do Google AI Plus, Pro e Ultra através do app principal, Google Flow e YouTube Shorts, com acesso mais amplo à API esperado nas próximas semanas.
Iteração Mais Rápida e Controle Mais Preciso para Fluxos de Trabalho Diários
Velocidade e consistência importam mais para criadores do que especificações de destaque. O ganho de desempenho do Gemini 3.5 Flash deve reduzir o tempo entre o prompt e uma saída utilizável, o que faz diferença quando você está refinando uma sequência em várias tomadas. As melhorias agenticas também permitem que o modelo planeje tarefas simples de várias etapas, como gerar um storyboard e depois estender frames selecionados em clipes curtos. A abordagem de entrada mista do Gemini Omni parece especialmente útil para pipelines de imagem para vídeo. Um criador pode fornecer uma imagem estática existente, um vídeo de referência de estilo e uma breve nota de voz descrevendo o movimento da câmera, e receber uma saída que respeita todos os três sinais ao mesmo tempo. Esse nível de controlabilidade era difícil de alcançar antes sem uma pós-produção pesada.
Vitórias Práticas para Criadores de Imagens, Vídeos e Multimodais
Melhor aderência ao prompt e consistência de personagens são as duas melhorias que os criadores mencionam com mais frequência nos testes iniciais. Quando o movimento permanece ancorado no mesmo assunto em diferentes tomadas, o tempo de edição cai visivelmente. Os prompts de mídia mista também abrem experimentos criativos menores: inserir uma renderização de produto em uma cena de estilo de vida ou sobrepor diálogo em footage gerado, sem reconstruir toda a cena do zero. Honestamente, depois de executar alguns testes de entrada mista, achei os resultados mais utilizáveis do que eu esperava, embora ainda longe de perfeitos em movimentos complexos de câmera. Avanços multimodais como esses já estão moldando ferramentas de vídeo de próxima geração, incluindo a conversa em andamento sobre o tratamento do Gemini Omni de conteúdo explícito, que explorei com mais detalhes aqui: Gemini omni nsfw: Por que o Modelo de Vídeo IA da Google Bloqueia Conteúdo Explícito.
Perguntas que os Criadores Estão Fazendo Agora
Como acesso o Gemini 3.5 Flash e o Gemini Omni hoje?
O Gemini 3.5 Flash está ativo como modelo padrão no app Gemini e no modo de IA do Search. O Gemini Omni Flash está disponível imediatamente para assinantes do Google AI Plus, Pro e Ultra dentro do app, Google Flow e YouTube Shorts.
Quais técnicas de prompt funcionam melhor com os novos recursos multimodais?
Combine uma descrição clara do assunto com uma imagem de referência ou clipe curto e, sempre que possível, um breve sinal de áudio para timing ou tom. O modelo responde bem a instruções explícitas sobre movimento da câmera e continuidade de iluminação.
Como o Gemini 3.5 Flash difere das versões anteriores do Gemini?
O lançamento do 3.5 Flash foca em velocidade, planejamento agentico mais forte e custo reduzido. A assistência de codificação e o manuseio de tarefas de várias etapas melhoraram visivelmente em comparação com a geração anterior.
Quando chegarão o acesso à API e para empresas?
Espera-se um acesso mais amplo à API nas próximas semanas, embora o Google ainda não tenha publicado uma data exata para o lançamento empresarial.
Crie seu próprio vídeo pornô IA
Transforme qualquer fantasia em um vídeo Full HD realista. 1.000+ cenários, posições e fetiches — 100% privado.
Comece a Criar AgoraSobre o autor
Analista de Tecnologia Independente
Analista de tecnologia baseado em Londres. Cobre tendências da indústria de AI e AI criativa com uma honestidade incomum — incluindo admitir que ele realmente gosta dos produtos que revisa.