Google VEO 3 YA ESTÁ AQUÍ y no viene solo... NUEVA IA de Google CREA VIDEOS CON SONIDO Y VOZ

Date Un Top
21 May 202506:07

TLDRGoogle ha lanzado Google BO3, un nuevo modelo de video IA que puede generar audio nativo, incluyendo diálogos y efectos de sonido, y ofrece una mejor adherencia a las físicas de movimiento y realismo, con soporte para video en 4K. Además, Google BO2 ha sido mejorado con nuevas características como imágenes de referencia para escenas, adaptación de estilo visual, consistencia de personajes, controles de cámara, out painting y la capacidad de agregar o eliminar objetos. Ahora puedes controlar personajes con tu cuerpo y voz. Estas características están integradas en Google Flow.

Takeaways

  • 😀 Google BO3 permite generar videos con audioGoogle BO3 y BO2 y voz sincronizados, manteniendo la consistencia de los personajes y mejorando las físicas de movimiento.
  • 🎬 BO3 ahora ofrece video en calidad 4K, con control creativo mejorado y mayor precisión en las escenas y acciones.
  • 🎶 El modelo BO3 puede generar efectos de sonido, ruido ambiental y diálogos de forma nativa, mejorando la experiencia inmersiva.
  • 🖼️ BO2 ahora puede combinar imágenes de referencia y adaptarlas a diferentes estilos visuales, desde pinturas hasta cine.
  • 🎥 Google BO2 incluye control de cámara para encuadrar y mover la cámara con precisión, incluyendo zooms y desplazamientos.
  • 🔄 Con BO2 ahora es posible hacer Out Painting, expandiendo el video más allá del fotograma original de forma realista.
  • 🧳 Puedes agregar y eliminar objetos en los videos de BO2, considerando la escala, las físicas y las sombras de manera natural.
  • 🤖 Los personajes pueden ser animados con la voz y los movimientos del usuario, usando la tecnología de Google BO2 y BO3.
  • 👀 La creación de videos con audio natural para diálogos muy cortos sigue siendo un área de desarrollo, con posibles errores en la sincronización.
  • 🌐 Para probar estas características de BO3 y BO2, Google ha lanzado la herramienta Flow, accesible a través de Gemini, Google AI Studio o Vertex AI Studio.

Q & A

  • ¿Qué es Google BO3 y qué características nuevas ofrece?

    -Google BO3 es el nuevo modelo de video de Google que permite añadir efectos de sonido, ruido ambiental e incluso diálogos a las creaciones de video, generando todo el audio de forma nativa. Además, ofrece la mejor calidad en términos de física de movimiento y realismo, y permite una salida de video de hasta 4K. También presenta una adherencia mejorada siguiendo cada serie de escenas y acciones con mayor precisión.

  • ¿Qué mejoras se han realizado en Google BO2?

    -Google BO2 ha sido mejorado con más control, consistencia y creatividad. Ahora puede combinar imágenes de referencia en una misma escena, adaptar videos a cualquier estilo visual, mantener la consistencia de personajes en diferentes escenas, controlar el movimiento de la cámara con precisión, añadir frames de inicio y final para transiciones más naturales, realizar out painting para expandir el video, agregar y eliminar objetos de manera realista, y controlar personajes usando la cara, cuerpo y voz del usuario.

  • ¿Qué es el Out Painting en el contexto de Google BO2?

    -El Out Painting en Google BO2 es una función que permite ampliar el video más allá del fotograma original, añadiendo nuevas partes que se ven realistas y se integran perfectamente con la generación original. Esto permite adaptar el video a diferentes formatos o tamaños de pantalla.

  • ¿Cómo se puede controlar el movimiento de los personajes en Google BO2?

    -En Google BO2, puedes controlar el movimiento de los personajes usando tu cara, cuerpo y voz. Esto permite generar movimientos realistas y acciones expresivas que responden a tus movimientos y señales vocales. Además, puedes seleccionar objetos específicos en el video, definir su trayectoria y darles vida en movimiento.

  • ¿Qué es Google Flow y cómo se relaciona con Google BO3 y Google BO2?

    -Google Flow es una nueva IA lanzada por Google que permite probar y utilizar las características de Google BO3 y Google BO2. Todas las funciones de estos modelos están implementadas al 100% en Google Flow, lo que facilita la creación de videos con audio y efectos de manera integrada.

  • ¿Qué limitaciones tienen Google BO3 y Google BO2 en la generación de audio?

    -Aunque Google BO3 y Google BO2 han avanzado en la generación de audio, aún tienen limitaciones en la sincronización del audio para segmentos de voz muy cortos. Esto puede generar errores en la sincronización y incoherencias en el habla, un área que sigue en constante desarrollo.

  • ¿Qué es el nuevo modelo de imagen Image 4 y cómo se relaciona con los modelos de video?

    -El nuevo modelo de imagen Image 4 es un modelo de generación de imágenes que ha sido lanzado por Google. Aunque no se detalla su relación directa con los modelos de video, es parte de los avances en la generación de contenido mediante IA que Google está desarrollando.

  • ¿Cómo se puede acceder a las funciones de Google BO3 y Google BO2?

    -Puedes acceder a las funciones de Google BO3 y Google BO2 a través de Google Flow, Gemini, Google AI Studio o Vertex AI Studio. Sin embargo, todas las características están implementadas al 100% en Google Flow.

  • ¿Qué tipo de estilos visuales puede adaptar Google BO2 a los videos?

    -Google BO2 puede adaptar videos a una amplia variedad de estilos visuales, desde pinturas hasta looks completamente cinematográficos. Solo necesitas proporcionar una imagen de referencia de estilo y el modelo generará videos con ese estilo específico.

  • ¿Qué ventajas tiene Google BO3 en términos de calidad de video?

    -Google BO3 ofrece una mejor calidad en términos de física de movimiento y realismo. Además, permite una salida de video de hasta 4K y tiene una adherencia mejorada para seguir series de escenas y acciones con mayor precisión.

Outlines

00:00

🚀 Introduction to Google BO3 and BO2

The video script introduces Google's latest advancements in AI video generation with the release of Google BO3 and enhancements to Google BO2. Google BO3 is highlighted for its ability to maintain character consistency, improve motion physics, generate native audio, and synchronize it with video content. It also offers improved scene adherence and supports up to 4K video output. Additionally, BO3 allows for the addition of sound effects, ambient noise, and dialogues. Google BO2 has been upgraded with new features such as combining reference images in a single scene, adapting videos to different styles, maintaining character consistency across scenes, and adding precise camera controls. It also supports out painting to expand video frames and adding or removing objects while preserving natural interactions and shadows. The script emphasizes the ability to animate characters using facial expressions, body movements, and voice, as well as controlling specific object movements. Both models are benchmarked above current top video generators, though they still face challenges in audio synchronization for short voice segments.

05:01

🎉 How to Access and Additional Features

The script explains how users can access the new features of Google BO3 and BO2 through Google's Flow platform, which is fully integrated with these models. It mentions that users can also access these features through Gemini, Google AI Studio, or Vertex AI Studio, but Flow is highlighted as the primary tool. The script directs viewers to another video for more information on Google Flow. Additionally, it mentions the launch of a new image model called Image 4, described as exceptionally incredible, and invites viewers to check out a related video for more details. The script concludes by encouraging viewers to leave a comment and thanking them for watching, promising to address any questions in the comments.

Mindmap

Keywords

💡Google Veo 3

Google Veo 3 es el nuevo modelo de generación de video con inteligencia artificial desarrollado por Google. En el video, se destaca como una evolución significativa respecto a sus versiones anteriores, ofreciendo mejoras en físicas de movimiento, consistencia de personajes, calidad visual (hasta 4K), y lo más innovador: la generación nativa de audio, incluyendo diálogos y sonidos ambientales. Es el eje central de las novedades presentadas en el video.

💡Google Veo 2

Google Veo 2 es la versión anterior del modelo de generación de video por IA de Google, que ha sido mejorada con nuevas capacidades. Aunque BO3 es la nueva versión, BO2 recibe actualizaciones importantes como el uso de imágenes de referencia, estilos visuales adaptativos, control de cámara y edición avanzada (como añadir o quitar objetos). El video lo presenta como aún muy potente y útil, incluso frente a su sucesor.

💡Consistencia de personajes

La consistencia de personajes se refiere a la capacidad del modelo de IA para mantener la apariencia y características de un personaje a lo largo de varias escenas. En el video, se menciona que tanto BO2 como BO3 ahora pueden lograr esta coherencia usando imágenesCorrección JSON Google Veo de referencia, lo cual es fundamental para narrativas visuales donde los personajes deben ser reconocibles en todo momento.

💡Físicas de movimiento

Este término se refiere a cómo el modelo de IA representa el movimiento de objetos o personajes de forma realista. Veo 3 mejora significativamente en este aspecto, logrando que las animaciones respeten las leyes físicas naturales (como gravedad e inercia), lo que hace que los videos generados sean más creíbles y atractivos visualmente.

💡Audio nativo

El audio nativo es la capacidad del modelo de generar sonido directamente junto con el video, en lugar de requerir una pista de audio externa. En Veo 3, esto incluye efectos de sonido, ambientes sonoros e incluso voces, todo sincronizado automáticamente. Es una de las características más destacadas en esta nueva versión.

💡Out painting

Out painting es una técnica que permite extender un video más allá de sus bordes originales, generando contenido adicional que mantiene la coherencia visual. El video explica que BO2 ahora puede realizar esta función, lo cual permite adaptar los videos a diferentes formatos o crear escenas más amplias sin perder calidad o consistencia.

💡Control de cámara

El control de cámara hace referencia a la capacidad del usuario para definir movimientos de cámara dentro del video generado, como zooms, paneos o encuadres específicos. BO2 ha incorporado esta función, permitiendo un nivel de personalización y dirección más cercano al cine profesional.

💡Imagen de referencia

Una imagen de referencia es una herramienta visual que se proporciona al modelo para guiar el estilo, los personajes o los objetos en el video generado. BO2 puede utilizar estas imágenes para mantener consistencia o replicar estilos visuales como pinturas o cinematografía, según se explica en el video.

💡Google Flow

Google Flow es la nueva interfaz o plataforma donde se puede acceder a todas las funciones avanzadas de Google Veo 2 y 3. El video menciona que a través de Flow (además de Gemini y otros estudios de IA de Google), los usuarios pueden probar estas herramientas, lo cual facilita la experimentación y uso creativo de la tecnología.

💡Animación por movimiento y voz

Esta funcionalidad permite a los usuarios animar personajes utilizando sus propios movimientos corporales y voz. Según el video, se puede usar la cara, cuerpo o voz para dar vida a un personaje de manera realista y expresiva, lo cual representa un avance en la interacción humana con los modelos generativos de video.

Highlights

Google ha lanzado un nuevo modelo de video llamado Google BO3.

Google BO3 puede generar audio de forma nativa, incluyendo efectos de sonido, ruido ambiental y diálogos.

BO3 ofrece mejor calidad en físicas de movimiento y realismo.

BO3 permite una salida de video de hasta 4K y mejora el control creativo.

Google BO2 ha sido mejorado con más control, consistencia y creatividad.

BO2 ahora puede combinar imágenes de referencia en una misma escena.

BO2 puede adaptar videos a cualquier estilo visual, desde pinturas hasta looks cinematográficos.

BO2 mantiene la consistencia de personajes en diferentes escenas.

Se han añadido controles de cámara para controlar el encuadre y movimiento de tomas.

BO2 permite crear transiciones naturales entre imágenes con frames de inicio y final.

Se ha implementado el Out Painting para expandir videos con partes realistas.

BO2 puede agregar y eliminar objetos de manera realista, considerando escala, interacciones y sombras.

Los usuarios pueden controlar personajes usando su cara, cuerpo y voz para animarlos.

Se puede definir la trayectoria de objetos específicos en el video para darles movimiento.

Google BO3 y BO2 se posicionan por encima de los mejores generadores de video actuales.