El pasado viernes, OpenAI volvió a dar la campanada al presentar Sora, una nueva herramienta que se sirve de la inteligencia artificial (IA) para generar vídeos realistas a partir de las peticiones escritas de los usuarios. El anuncio se viralizó casi al instante, despertando entre prensa y gran público una oleada de fascinación sobre las capacidades de esta tecnología similar a la que se produjo antes con ChatGPT y el generador de imágenes DALL-E. Sin embargo, muchos expertos también han planteado dudas cada vez más recurrentes: ¿Con qué datos se ha entrenado ese modelo? ¿Viola los derechos de autor? Sora quiere ser un producto, pero de momento solo hemos visto publicidad. El anuncio promocional de OpenAI muestra imágenes en movimiento que habrían sido creadas por esta IA a partir de prompts de texto, un aparente logro con un nivel de precisión y coherencia nunca visto hasta ahora. Los resultados son realmente asombrosos, si bien imperfectos. Aun así, Sora es un misterio. De momento, la compañía ha limitado su acceso a un reducido grupo de artistas y a un equipo interno que «evalúa las áreas críticas en busca de daños o riesgos». OpenAI está vendiendo Sora como un avance científico, pero casi no ha dado detalles técnicos que puedan ser revisados y contrastados por parte de la comunidad académica. «Esto no es un avance para la sociedad, sino para OpenAI y sus intereses», advierte Albert Sabater Coll, director del Observatori d’Ètica en IA de Catalunya. En la web de la compañía no se explica qué datos usa y solo indica que «se inspira en grandes modelos lingüísticos que adquieren capacidades generalistas entrenándose con datos a escala de internet». ¿Se trata de contenidos protegidos por el ‘copyright’? La falta de información no permite resolver las dudas éticas y legales que plantea esa pregunta. Todo apunta a que Sora se entrena, en parte, con datos de Shutterstock, una biblioteca de imágenes, vídeos y música con el que OpenAI trabaja desde 2021. Ambas acordaron el año pasado extender su alianza hasta 2029. Sin embargo, el modelo podría acceder a otros contenidos como fotografías compartidas en Reddit, vídeos de Youtube o videojuegos sin el consentimiento de los artistas, como ha advertido la científica informática Margaret Mitchell. Otros expertos señalan que los vídeos creados con Sora se asemejan a los de Midjourney, un generador de imágenes ya denunciado por violación de los derechos de autor. «Es de suponer que los artistas están siendo realmente jodidos», ha señalado Gary Marcus, profesor emérito de la Universidad de Nueva York y experto en IA. El buque insignia de OpenAI, ChatGPT, ha recibido múltiples denuncias por posibles violaciones de la privacidad y de los derechos de autor, entre ellas de autores como John Grisham o de medios como The New York Times. Con Sora podría pasar lo mismo. «Gremios e industrias como Hollywood entrarán de pleno en la lucha por sus derechos para frenar esa competencia desleal», cree Sabater. La propia OpenAI ha señalado a los legisladores que «sería imposible entrenar los modelos actuales de IA sin material con derechos de autor».