Minuto a Minuto

Ciencia y Tecnología Google evoluciona Gemini a ‘Omni’, capaz de “crear cualquier cosa”
Gemini Omni puede combinar imágenes, audio, video y texto como entrada para generar videos de alta calidad
Internacional Cuatro presidentes (de derecha) en apuros: Milei, Kast, Paz y Trump
El analista internacional Daniel Zovatto, detalló que los presidentes Milei, Kast, Paz y Trump enfrentan una paradoja que la historia conoce bien: ganar elecciones es mucho más sencillo que gobernar.​​​​​​​​​​​​​​​
Nacional Sin cajas registradoras y universal: Así operará el nuevo Hospital O’Horán en Yucatán
Joaquín Díaz Mena, gobernador de Yucatán, calificó como histórica la sustitución del Hospital General Dr. Agustín O'Horán
Internacional Suman 134 muertes sospechosas por el brote de ébola en RD del Congo
Mientras crece el número de muertos en República Democrática del Congo, los CDC de África trabajan en tres tipos de vacunas contra el ébola
Internacional Trump asegura que a EE.UU. no le será “difícil” resolver la situación en la “fallida” Cuba
Donald Trump, presidente de los Estados Unidos, consideró a Cuba como una "nación fallida" y que "necesita ayuda"
Google evoluciona Gemini a ‘Omni’, capaz de “crear cualquier cosa”
Gemini Omni. Captura de pantalla

Google presentó Gemini Omni, un nuevo modelo capaz de crear cualquier cosa a partir de cualquier entrada.

Tras ayudar a millones de personas a restaurar fotos antiguas, diseñar a partir de bocetos y visualizar ideas con Nano Banana, Omni puede combinar imágenes, audio, video y texto como entrada para generar videos de alta calidad.

También permite editar fácilmente videos mediante una conversación.

La primer versión de este nuevo modelo es Gemini Omni Flash para Gemini, Google Flow y YouTube Shorts.

 Editar videos a través de la conversación

Gemini Omni se caracteriza por la edición de video con lenguaje natural. Cada instrucción se basa en la anterior, lo que permite mantener la coherencia.

  • Transforma el mundo que te rodea. Cambiar detalles específicos o cambiarlo todo. El video se convierte en el punto de partida de algo que jamás se habría podido filmar.
  • Reimagina la acción. Tomar un video ya grabado y pedirle a Omni que cambie lo que está sucediendo. Editar la acción, agregar nuevos personajes u objetos, o transformar un momento en algo inesperado.
  • Perfecciona tus videos a lo largo de múltiples etapas. Cambiar el entorno, el ángulo, el estilo o incluso detalles específicos, sin perder nunca el hilo conductor de la escena original.

 Dar vida a las ideas

Gemini Omni también razona sobre lo que debería suceder a continuación; esto es, permite al usuario combinar una comprensión intuitiva de la física con el conocimiento de Gemini sobre historia, ciencia y contexto cultural, tendiendo un puente entre el fotorrealismo y la narración significativa.

  • Crea imágenes con una física más precisa. Omni ofrece una comprensión intuitiva mejorada de fuerzas como la gravedad, la energía cinética y la dinámica de fluidos, lo que te permite crear escenas más realistas.
  • Combina conocimiento y creatividad. Omni se inspira en el conocimiento de Gemini para conectar lenguaje, imágenes y significado de maneras que van mucho más allá de la simple coincidencia de patrones.
  • Ideas complejas convertidas en imágenes. Omni puede crear explicaciones convincentes a partir de breves indicaciones, generando elementos visuales que desglosan ideas más complejas.

 Crear videos a partir de cualquier combinación de entradas

  • Haz referencia a cualquier cosa. Omni convierte cualquier imagen, texto, video o audio de referencia en un único resultado coherente. Si bien inicialmente solo se admitirán referencias de voz para el audio, pronto implementaremos otros tipos de entradas de audio.
  • Empieza con lo que tienes. Mediante referencias de entrada, se pueden utilizar imágenes de personajes, escenas o dibujos para crear de una manera que se ajuste a la visión del usuario.
  • Aplica estilos, movimiento o efectos. Definir el lenguaje visual mediante referencias de entrada o simplemente describirlo con lenguaje natural. Omni combina las referencias de entrada para crear un video coherente.

 Crear videos con avatar digital

Google cuenta con políticas claras para proteger a los usuarios y regular el uso de sus herramientas de inteligencia artificial.

Así, se pueden crear videos con la voz propia utilizando avatares, una versión digital para generar videos que se vean y suenen como los usuarios.

Además, todos los videos creados con Omni incluyen la marca de agua digital SynthID para verificar fácilmente que los videos se generaron con Gemini Omni a través de Gemini, Gemini en Chrome y Búsqueda de Google.

 Gemini Omni, ya disponible

Gemini Omni Flash ya se encuentra disponible para suscriptores de Google IA Plus, Pro y Ultra, a través de la aplicación de Gemini y Google Flow.

Sin embargo, también se implementa sin costo alguno para usuarios en YouTube Shorts y la aplicación YouTube Create.

Próximamente estará disponible para desarrolladores y clientes empresariales a través de API.