OpenAI presenta su generador de videos Sora
La Cofece frena a Amazon y Mercado Libre, Nvidia duplica su producción y Sora pone a temblar a la industria del entretenimiento
Puedes encontrar las versiones tanto en audio como en video de este contenido en sus respectivas ligas.
En México, la Comisión Federal de Competencia Económica le ordenó a Amazon y Mercado Libre desvincular sus sistemas de vídeo en línea, Prime video y Meli+, de sus paquetes de membresías, los cuales también incluyen ventajas para envío de productos. La COFECE acusó este martes a Amazon y MercadoLibre de “imponer barreras a sus competidores en el comercio electrónico” debido a que, entre ambas, tienen el 61% del mercado de compraventa en línea gracias a que ofrecen servicios complementarios de streaming, además de que imponen sus propios sistemas de logísticas a los vendedores.
Por su parte, tanto Amazon como MercadoLibre han declarado que sus operaciones “promueven la competencia e innovación en la industria minorista” al ofrecer herramientas para aumentar el alcance de venta de vendedores independientes. Los 5 marketplaces más grandes en México son Mercado Libre, Amazon, Walmart, Liverpool y Coppel, tiendas que también ofrece espacio a vendedores independientes.
El fabricante de automóviles BYD (Build Your Dreams), rival de Tesla en el sector eléctrico, reveló en un reporte que está revisando opciones para abrir una planta en México y actualmente está negociando términos con funcionarios locales. La apertura de esta facilitaría la venta de sus vehículos en Estados Unidos. BYD planea construir fábricas también en Tailandia, Hungría y Brasil.
Samsung anunció que la actualización de febrero para su Galaxy S24 mejorará sus experiencias de pantalla y cámara, implementará un nuevo control de intensidad de saturación de color, así como mejoras en la cámara en las funciones de zoom, modo retrato, foto nocturna y opciones de grabación de video con la cámara posterior.
Fuentes de Reuters dicen que Nvidia está incrementando al doble los procesos de diseños de chips personalizados para empresas de cómputo en la nube y procesadores avanzados para Inteligencia Artificial. Nvidia controla cerca del 80% del mercado de chips para IAs de gama alta, lo que incrementó su valor en la bolsa hasta en un 40%, llegando a los 1.73 billones de dólares. Entre las empresas que usan chips de Nvidia están OpenAI, Microsoft, Alphabet y Meta.
OpenAI lanzó Sora, un modelo de generación de video a partir de texto, en donde el usuario puede crear escenas realistas e imaginativas en donde aparezcan personajes, tipos específicos de movimientos tanto de estos como de cámara y otras opciones. Sora puede comprender la forma en que “existen objetos en el plano físico” así como “interpretar con precisión los accesorios y generar personajes convincentes que expresen emociones vibrantes”. Algunos videos generados por la herramienta, presentes en la publicación del blog de OpenAI, muestran detalles que evidencian el uso de IAs pero los resultados en general son notables. Sora solo está disponible para equipos de prueba, en donde también incluye a artistas visuales, diseñadores y cineastas, los cuales están evaluando el modelo para detectar los riesgos y daños que se puedan ocasionar por su uso.
El prompt “mató” al artista audiovisual
“El que sabe hace, el que no sabe, enseña”, a este dicho popular le podríamos agregar una tercera parte en donde el que no es capaz de hacer ni de enseñar, podrá escribir un prompt y un modelo basado en inteligencia artificial lo hará por él.
Con la presentación de Sora, la herramienta generadora de texto a video, OpenAI muestra un avance importante en este terreno, en donde lejos quedan las pesadillas provocadas por un Will Smith comiendo espagueti, y el nivel de realismo de las imágenes llega a niveles aceptables por el espectador en general.
En la página del producto de OpenAI, uno puede ver distintos ejemplos así como los promps utilizados ara generarlos, los cuales han despertado reacciones tanto de preocupación como de entusiasmo. Si la generación de imágenes basadas en texto llego a mover sensibilidades en los bancos de imágenes y fotógrafos, ahora los videografos y animadores pueden preocuparse de manera similar a estos, así como los guionistas y redactores de textos. La Inteligencia Artificial puede reemplazarnos en esas labores creativas. Excepto que… no es así.
Por el lado de los escépticos, tendremos a quienes nos podremos quejar sobre las imperfecciones que se siguen mostrando, sin importar lo mucho que avancen los modelos generadores, haciendo que sea fácil de detectar un material generado artificialmente, en contraposición con algo generado por humanos responsables y trabajadores. Esto es irrelevante para el consumidor que, si es entusiasta, en este momento ignorará esos errores y dirá que avanzamos de manera impresionante, lo cual es cierto, pero también tenemos al espectador de a pie que no se preocupa por dichos detalles, y en donde estas herramientas podrían ser abusadas de manera preocupante, especialmente en años electorales como el 2024, en donde Estados Unidos, México y muchos países más, verán campañas polícitas en donde se puedan usar estas herramientas, aunque OpenAI usará marcas de agua en herramientas como DALL-E 3 y se espera que haya algo similar con los generadores de video, pero un actor malicioso puede editar esto en caso que quiera engañar a alguien.
En buena parte, por eso es que Sora no se ha lanzado al público, lo cual es peculiar, ya que OpenAI logró que su herramienta más conocida, ChatGPT, se popularizara al lanzarla al público, mientras que Google tenía herramientas más avanzadas pero para usos privados. Ahora es Google quien lanza sus nuevas herramientas a todos los usuarios, mienras que OpenAI ahora se ve más responsable y busca analizar con un equipo de pruebas las implicaciones del uso y generación de contenidos, aunque el mismo Sam Altman publica en X videos generados con los prompts que recibe en la misma plataforma.
¿Qué implicaciones vienen con estas herramientas? De entrada los apocalípticos que ven industrias como la de Hollywood o la publicidad cambiando radicalmente tendrán un choque de realidad al ver que dicho cambio no será tan catastrófico. Claro, ya han habido manifestaciones en contra de este tipo de tecnologías, presentes después de las huelgas de guionistas y actores, mientras que artistas de efectos visuales buscan asociarse pero parece que la amenaza más grande no será Disney con jornadas explotadoras, sino la posibilidad de que estas empresas los reemplacen con “ingenieros de prompts” que podrán hacer su trabajo.
¿Qué tanto faltará para tener una película nominada al Óscar generada por Sora o herramientas similares? Pues es como preguntarse qué tanto pasó para que un escritor que tiene un diccionario a la mano gane un Pulitzer o un premio Nébula. Estas son solo herramientas, y es el autor quien le da sentido. Tristemente hay personas fácilmente impresionables como el mismo doctor Jordan Peterson, que tras ver un post de Brian Roemmele en donde incluía un clip de video de una película india, así como un supuesto prompt con el que se generó, mostraban asombro ante lo que esta supuesta inteligencia artificial podía crear, sin considerar que hay narrativa, edición, actuación, trabajo de cámara y… todo eso fue hecho por humanos para una película real, que quien quiera creer que fue algo artificial, sin cuestionarlo lo pueden aceptar.
Es un hecho que estas herramientas al ser lanzadas traen muchas implicaciones. Desde su abuso para generar desinformación, pasando por la reducción de trabajos en terrenos creativos, en donde dicha creatividad pasará a manos de ejecutivos y mercadólogos en lugar de las verdaderas mentes creadoras que hacen en lugar de manipular el trabajo ajeno para su beneficio, hasta la optimización de distintas labores por los sectores especializados. Es pertinente que se hagan revisiones y manejen legislaciones, especialmente cuando el mismo OpenAI no ha sido transparente sobre la información que usa para entrenar sus modelos generadores, abusando de información que originalmente fue compartida para que se consumiera por humanos, en algunos casos tras plataformas de paga, y que al final se usaron de modos no permitidos para generar herramientas que lucran con el trabajo ajeno. Es muy distinto si yo publico un libro con el propósito de que sea leído, a que alguien más lo copie ilegalmente, no me de crédito sino que se lo robe, y lucre con mi trabajo.
Como consumidores no sabemos lo que queremos hasta que lo vemos, y aunque podamos generar un promp descriptivo para que distintas herramientas puedan “generar una película con todos los elementos que queremos”, el resultado siempre será inferior a lo que una verdadera mente creativa pueda producir para sorprendernos. Nadie creería que una persecución de autos con acróbatas en el desierto fuera algo atractivo, hasta que vemos a un guitarrista con lanzallamas musicalizando una escena vertiginosa en Mad Max: Fury Road sacada de la mente de George Miller.
A casi un año del Will Smith que come espagueti, tenemos a la chica que camina en Tokio en una escena generada. Imágenes que mejoran pero que no cuentan una historia. Esta es creada por nosotros como espectadores y dependerá de si queremos aceptar la artificialidad como parte de nuestra normalidad, o encontramos algo de valor en algo hecho, no generado con prompts, con creatividad y esfuerzo humano.
Si quieres saber desde cuando OpenAI pudo hacer acuerdos para alimentarse con los videos e imágenes que son la base de sus generadores, revisa nuestro episodio 235 en donde encontrarás más información.
Eso es todo por hoy. Gracias por tu atención. Nos escuchamos en el siguiente programa y gracias por acompañarnos por estos 350 episodios.