El año pasado 2022 y este 2023 me han sido muy productivos en cuanto a trabajo personal (y profesional ni te cuento!!). Si bien es cierto que no he publicado mucha info al respecto en Variedalia, sí que he acumulado contenido que iré compartiendo poquito a poco a medida que me apetece escribir y publicar entradas aquí.
En este caso quiero compartir una de mis primeras pruebas usando la IA como tecnología para la edición de vídeo, tal como hace DEEPFAKE, pero en este caso es para animar fotografías inmóviles como han heredado muchas aplicaciones de tipo mobile como REFACE o MYHERITAGE...
Y en este caso quise poner a prueba la tecnología para ver si detectaba rostros en muñecos. Y aproveché una de mis fotografías de mi viejo 365 Nostalgic Items. La Foto #201 que cerraba la quincena que dedique a Tolkien y el El Señor de los Anillos.
Lo que más me gusta de esto, es que sigo abriendo puertas y ventanas al desarrollo de mi propia creatividad, y estos minidesarrollos forman parte de mis pequeños placeres cotidianos que tan feliz me hacen:
El programa es potente hasta para detectar varios rostros a la vez. Muy enamorado del resultado:
Es cierto que utilicé motores de IA ya educados para aprender a funcionar muy bien, y no he tenido que investigar como educar yo mismo la IA usando mi propio ordenador. Pero teniendo en cuenta que siendo un I7 de primera generación de 2011, el tiempo de aprendizaje que tendría que invertir la IA tirando de mi equipo es bastante tosco.
Sé que existe la posibilidad de usar máquinas virtualizadas remotas en Internet para realizar este aprendizaje en equipos remoto. Pero la mayoría son cosas de pago, y estoy en AHORRO MODE para poder realizar planes a futuro con mi prometida. Así que solo diré algo que me nace tras haber revisitado mi viejo 365... Y esto es:
En los últimos 2 años he visto pasos de gigante en cuanto a la disponibilidad de la IAque nos está llegando al consumidor medio, ya sea en formato de herramientas conversacionales, como herramientas de generación de voz, imágenes e incluso modelos 3D. Y si bien es cierto que la IA cada vez más sigue creciendo en cuanto a desarrollo tecnológico, la parte multimedia de la misma es la que más me fascina. Eso de poder recrear voces conocidas, o incluso rostros completos a insertar en clips de vídeo, la IA puede ser una herramienta tan potente como directamente proporcional al peligro que conforta respecto al uso ético de la persona que la utilice...
No es la primera vez que hablo sobre Inteligencia Artificial en Variedalia, pero hoy quiero hablar de un vídeo que me ha resultado espectacular, y que debido a su duración, y que está en inglés probablemente no muchas personas se pararán a verlo en condiciones. Pero hago un resumen rápido, enseñamos a una inteligencia artificial a moverse por el juego TOMB RAIDER clásico, y a interactuar con su entorno. Es más, una vez bien entrenada en el manejo del personaje, incluso vamos a recrear con IA la voz original de Lara en ese juego, para que nos vaya relatando lo que Lara piensa en cada paso que de...
¿El resultado? Un maravilloso vídeo, donde podríamos quedarnos enganchados simplemente escuchando esas reflexiones durante el primer episodio de su aventura, y lo más divertido es ver como Lara se va dando cuenta cada vez más que se encuentra en un videojuego a algún tipo de sueño extraño:
¿No os parece brutalísimo? Es que incluso la IA repara en detalles que nosotros como jugadores no reparamos en su día. "Si hay vegetación, es porque hay agua cerca. Si hay plantas, es porque en algún momento ese lugar recibe luz. Si hay unos puentes antiguos para cruzar, lo cruzaremos despacio no sea que se rompan..." ¡Brutal! ¡Brutalísimo! ¡¡Te mete de lleno en la historia y el diseño de escenarios!!
Incluso aunque para este vídeo el creador haya tenido que pausar la grabación para insertar estos diálogos generados por la IA durante la jugabilidad.
Como es normal, ya han salido vídeos debatiendo que el vídeo es Fake, y de todos ellos me quedo con uno que han usado el mismo proceder que el original a la hora de generar la voz con la IA:
Sea de verdad o no el vídeo original (algo que dejaré a vuestro criterio), la idea que se presenta es interesante. No el hecho de poner a una IA a aprender a jugar un juego. Sino el hecho de que se puedan generar diálogos por IA y que a su vez sean leídos en voz alta por una voz generada con IA.
Es cierto que como amante del doblaje, esta idea no facilitaría puestos de trabajo a actores de doblaje. Pero el potencial de la idea es enorme para hacer juegos más interactivos sin necesidad de pregrabar diálogos que de otro modo igual resultan insuficientes (y quizá con IA son demasiados). ¿Quién sabe?
Por ejemplo en la futura Actualización v4.0de mi juego FotoMuseo 3D, he tenido que grabar un buen porrón de diálogos en todos los niveles para darle más veracidad a la historia que quiero contar en la Primera Expo del juego.
Pero si tuviera la capacidad de generarlo con la IA a medida que nos desplazamos por el juego, sería brutalísimo. Pero claro no tengo los medios necesarios, y adquirir los conocimientos para desarrollarlos me requeriría de un tiempo que tampoco estoy disponible a ceder en estos momentos...
Así que mis pensamientos se derivan en lo siguiente:
Si no fuera porque el 96% de las grandes empresas que tienen el poder de desarrollo suficiente, solo piensan en la rapidez de sacar productos para llenarse los bolsillos; podrían llegar a desarrollarse videojuegos donde los diálogos del mismo pudieran completarse de manera artificial consiguiendo que una partida en un mapa o escenario nunca sea la misma en cuanto a la narración y siempre con una coherencia informativa que solo la IA con acceso a Internet podría obtener...
No sé, yo veo vídeos como estos, y me explota la cabeza de hasta donde podríamos llegar...
Así que en vez de dejar mis esperanzas en las grandes desarrolladoras que tienen los medios suficientes para llevar a cabo productos brutales, seguiré volcándolas en los desarrolladores INDIES que a pesar de no tener los medios suficientes desarrollan joyas que superan con creces a muchos productos triple A.
Hace ya 1 año, hablé aquí en Variedaliasobre la tecnología que se nos está acercando cada vez más sobre la edición AUDIOVISUAL y de IMAGEN. Tecnología que utiliza la INTELIGENCIA ARTIFICIAL para llevar a cabo sus objetivos, ilustrándolo con 3 grandiosos vídeos del canal Dot CSV del que soy suscriptor. (Click aquí si quieres leer aquella entrada.)
Pues bien, he realizado mis primeras pruebas con una pequeña parte de esta tecnología. La referente a la RESTAURACIÓN, COLORIZACIÓN y ANIMACIÓN de fotografías antiguas...
Y para ello he utilizado 3 fotos antiguas de las mujeres más importantes en mi vida. Este es el resultado:
Tengo que reconocer que estos últimos días han sido provechosos. Si bien es cierto que vuelvo a estar con más de 2 frentes abiertos en los que trabajar, al menos no paro quieto y en pocos días puedo ir finiquitándolos sin demasiado problema.
No obstante, aprovechando que me he tomado un pequeño descanso en el desarrollo de los nuevos contenidos de FotoMuseo 3D; como ya he dicho arriba; he podido lanzarme a enredar con la tecnología DEEP.
Muchos conocerán uno de sus módulos. El módulo DEEP FAKE que se utiliza en vídeo para insertar el rostro de alguien sobre el cuerpo de otra persona. No solo insertarlo, sino adaptarlo e integrarlo de manera que quede muy natural.
Es algo de lo que ya he hablado más de una vez en el Blog o en mis Redes Sociales. Esas escenas de películas donde sus protagonistas son cambiados por los de otros actores, o inclusive los de alguna versión de ellos mismos; dando lugar a versiones increíbles y jocosas de esas escenas. Basta con buscar DEEP FAKE en Google y encontraréis un montón de vídeos.
Sin embargo, para este vídeo; y sabiendo como soy a nivel nostálgico; he optado por probar el módulo DEEP NOSTALGIA dentro de una serie de herramientas integradas para probar insitu de primera mano el funcionamiento de estas...
¡¡Y estoy brutalmente sorprendido!! Ya que desde restaurar fotos antiguas, a colorear fotos en Blanco y Negro, ¡¡el resultado obtenido con la mayoría de ellas es increíble!!
***IMPORTANTE OBSERVACIÓN: Sí que es cierto, que para COLOREAR las fotos, no vale cualquier tono. Si tenemos alguna vieja foto amarillenta o color sepia, las fotos coloreadas con esta herramienta quedan con un horrible color ICTERICIA o SIMPSON que queda bastante irreal.
Por lo que personalmente recomiendo que; para esas fotos en amarillento, sepia o con los colores muy viejos y estropeados; las editemos primero con Photoshop o cualquier herramienta de diseño para DESATURAR la imagen o pasarlas a BLANCO Y NEGRO. Ello nos ayudará a que el COLOREADO mediante DEEP NOSTALGIA sea más natural.
De hecho insisto en que funciona mejor sobre fotos en B/N que en fotos amarillentas o con colores muy diluídos.***
En resumidas cuentas, esta tecnología todavía está en pañales a pesar de que los resultados que se consiguen sean de una calidad incuestionable... Por lo que miedo me da a lo que vamos a llegar en un futuro cada vez más cercano...
En el estado actual, solo puedo decir que si a estas herramientas además le añadimos un buen manejo de Photoshop para ayudar con la restauración y mejora de las fotografías, el uso complementario de esta herramienta puede dar resultados profesionales de manera increíble!!
De verdad os lo digo, no solo es el restaurado de viejas fotos, no. El haber podido ver en movimiento a muchos de mis seres queridos fallecidos cuando yo era niño o adolescente; y de los que no tenía apenas ningún vídeo porque antaño no teníamos la tecnología que tenemos ahora; ha sido algo que me ha impactado sobremanera!!
Por razones de BACKUPS y ALMACENAMIENTO, hoy he tenido que revisar viejo material fotográfico y audiovisual. En su mayor parte fotografías de mi época académica, laboral y familiar. Fotografías con amigos, con compañeros y con familia básicamente...
Así que, estoy en modo nostálgico. Pero ojo!! NO melancólico. Sino nostálgico en plan recordando momentos con una sonrisa y recreándome en mis recuerdos. Que desgraciadamente y felizmente; a partes iguales; los tengo con todo lujo de detalles porque mi memoria es una caja fotográfica sin fondo...
Pero bueno, no me afecta la morriña a pesar de estar sentimental. Al final, la melancolía cuando echas la mirada atrás no nos aporta nada. Así que prefiero quedarme con lo positivo que hubo. Eso sí, el haber encontrado viejos vídeos y fotografías; y sobretodo, viendo mis primeras ediciones de vídeo en 2002 y 2004, me ha hecho echar la mirada atrás a todo lo que he aprendido en años.
Es irónico, porque cuando empecé a editar vídeos los primeros los hacía con una herramienta llamada ULEAD VIDEOSTUDIO (bastante limitada en cuanto opciones, ya que se apoyaba sobre Net Framework, en vez de ser una aplicación nativa). Pero ya en el 2005 me puse las pilas con PREMIERE y en 2007 comencé a utilizar también AFTER EFFECTS para crear algunos efectos en los vídeos que editaba en Premiere. Y he dicho "IRÓNICO", porque ayer revisando vídeos pendientes que tenía por ver de algunos canales de Youtube a los que estoy suscrito, di con estos del canal DOT CSV que aún no había revisado por todo el berenjenal montado con el Estado de Alarma, y todo el trabajo que he tenido con el lanzamiento de FOTOMUSEO 3D en STEAM.
Y quiero compartir 3 de sus vídeos que forman un todo. Vídeos que si bien son de radiante actualidad en los estándares de hoy y añaden los conceptos de IA que se tratan en el canal, nos facilitan 3 temáticas que seguramente si editas videos con frecuencia y es algo que te gusta, los conceptos y términos que escucharás en los vídeos te sonarán muy familiares...
Resolución de vídeo:
En mi caso, nunca he utilizado herramientas con IA para editar mis vídeos porque hasta ahora mis vídeos siempre se ajustan a mis necesidades creativas. Sin embargo, conocer que disponemos de estas herramientas, y que son relativamente accesibles a nada que conozcamos un poco de integración y codificación, me hace sentirme enganchado a todas las posibilidades que nos brindan.
Framerate FPS - Fotogramas por segundo:
Estos vídeos me resultan impresionantes, quizá porque me muevo habitualmente en ese ámbito de edición en mis proyectos, pero más aún por la forma de explicarlos del creador del canal. Que siendo un canal relativo a todos los temas que tocan la Inteligencia Artificial, muchos de los vídeos van más allá.
Siempre me han gustado los canales de Divulgación, los canales Nostálgicos y de Reviews y los de Curiosidades en el Cine, Libros y Videojuegos.
El tercer vídeo de esta trilogía de Edición, ya termina de hablar del COLOR, solo que para hacerlo se apoya en la restauración de un vídeo antiguo retomando los conceptos que ya se han expuesto en los 2 anteriores.
Resmaterización con IA (FPS + Resolucion + COLOR)
Sinceramente... ¿Ya os he dicho alguna vez que me encanta editar vídeos?
No, verdad???
Como CURIOSIDAD añadida a la temática de la INTELIGENCIA ARTIFICIAL, os contaré algo que podemos ver en los Extras de las Extendidas de EL SEÑOR DE LOS ANILLOS.
Para algunas de las batallas, utilizaron un software de Inteligencia Artificial donde cada uno de las entidades (guerreros de la batalla, uruks, orcos, etc) tenían la misión de combatir contra las entidades del equipo enemigo. Con lo cúal, muchas de estas entidades hacían los suyo. Algo ideal cuando quieres filmar grandes batallas y no quieres dejarte una vida animando en 3D y renderizando animaciones una por una para luego integrarlas por capas en la escena. Que si bien, básicamente en muchos puntos se hizo esto, las batallas más grandes se filmaron con esta herramienta de IA.
Pues bueno, la curiosidad viene aquí...
La IA como tal funcionaba por equipos. Cada equipo tenía un número X de entidades. Y cada una de las entidades era un guerrero que tenía su voluntad programada. Voluntad de buscar una entidad ENEMIGA cercana y combatir con ella.
Pues en una de las batallas, se mostró que algunas de las Entidades más alejadas del centro de batalla (las que estaban en los bordes del mapeado), no fueron capaces de encontrar una entidad enemiga cercana con la que combatir, y acabaron saliendo del campo de batalla como si estuvieran huyendo de él.
Algo muy curioso, que no puedo recordar si al final se utilizaron en las filmaciones finales, pero que SIN ESPERARLO por parte del equipo, les daba una sensación de verosimilitud en el combate que valía su peso en oro.