Google Разкрива Скрити Модели Gemini Live AI Преди I/O 2026
Съдържание
Скрити варианти на Gemini Live се появяват в приложението Google
Към 10 май 2026 г., случайно ровене из приложението на Google разкри седем неиздадени AI модели на Gemini Live. Кодовите имена включваха A2A_Rev25_RC2, A2A_Nitrogen_Rev23 и няколко варианта на A2A_Capybara. Те изглежда са специализирани аудио-към-аудио и разсъждаващи двигатели, забелязани само ден преди голямата презентация на I/O. Времето предполага, че Google ускорява вътрешния си ритъм, вместо да чака полиранни съобщения. Може би съм прекарал повече време в ровене из бета менюта, отколкото строго необходимо, но моделът е ясен: постепенни, целеви актуализации пристигат по-бързо от обичайните шестмесечни цикли.
Технически последици за мултимодални работни процеси
Честно казано, тези кодови имена сочат сериозни подобрения в обработката на глас в реално време и контекстуалното разсъждение. Аудио-към-аудио моделите трябва да намалят латентността, докато подобряват персонализацията, позволявайки на създателите да подадат кратка гласова проба и да получат последователна доставка на персонажа в клиповете. Слоевете за разсъждение вероятно подобряват разбирането на промптове за сложни сцени, намалявайки обичайния напред-назад, който забавя генерирането на видео и аудио. Да, знам как звучи това, но практическата полза за всеки, който създава съдържание с много диалози или наративно, е трудно да се игнорира.
Къде се вписва това в пейзажа на моделите през 2026 г.
Бързите итерации като разкритията на моделите Gemini Live на Google са точно това, което захранва мултимодални инструменти от следващо поколение за създателите, позволявайки по-прецизен контрол върху реалистично видео, аудио и генериране на интерактивно съдържание. По-широкият календар за издаване тази година е необичайно гъст, със специализирани варианти, появяващи се заедно с флагманските издания. За създателите съобщението е просто: инструментите се движат към гранулиран контрол, а не към универсални модели. Подобни напредъци в мултимодалния AI вече се прилагат към създаването на възрастно съдържание, както е изследвано в експертния анализ на Seedance 2.0.
Какво питат създателите
Какво всъщност означават кодовите имена на моделите?
Стринговете като A2A_Rev25_RC2 и A2A_Nitrogen_Rev23 са вътрешни етикети. A2A сигнализира фокус върху аудио-към-аудио, докато останалото следи номера на ревизии и тестови клонове. Те рядко оцеляват в публичното именуване.
Кога ще бъдат пуснати тези модели Gemini Live?
Още няма официална дата. Изтичането се появи един ден преди I/O 2026, така че контролирано пускане или допълнителен преглед по време на keynote остава най-вероятната следваща стъпка.
Как могат да подобрят генерирането на видео и аудио?
По-добра последователност на гласа в реално време и контекстуално разсъждение трябва да намалят повторните заснемания. Създателите могат да поддържат тона на персонажа в по-дълги последователности с по-малко ръчни корекции.
Ще бъде ли скоро налично публично тестване?
Програмите за ранен достъп за функции на Gemini са се отваряли бързо в миналото. Следете списъка за изчакване на Google AI Studio, след като моделите излязат от скритите менюта.
Практически стъпки за създателите още сега
Започнете да експериментирате с днешните гласови функции на Gemini Live, докато новите варианти се подготвят. Тествайте кратки диалогови сцени и отбелязвайте къде персонализацията все още не достига. Този цикъл на обратна връзка ще ви помогне да започнете веднага, щом актуализациите пристигнат. Ще бъда откровен с вас: да останете напред тук е по-малко за чакане на перфектния модел и повече за усъвършенстване на промптове спрямо текущите ограничения. Пропастта между скритото и публичното се свива бързо.
Създайте свое AI порно видео
Превърнете всяка фантазия в реалистично Full HD видео. 1,000+ сценария, пози и фетиши — 100% поверително.
Започнете СегаЗа автора
Независим технологичен анализатор
Технологичен анализатор, базиран в Лондон. Анализира тенденции в AI индустрията и креативен AI с необичайна честност — включително признанието, че наистина му харесват продуктите, които преглежда.