-
Una investigación de The New York Times asegura que OpenAI ha utilizado mÔs de un millón de horas de video para entrenar a su IA.
-
YouTube aseguró que no quiere que OpenAI use sus vĆdeos para entrenar a Sora
-
OpenAI no ha clarificado completamente los métodos utilizados para entrenar su nueva inteligencia artificial.
Recientemente, el director ejecutivo de YouTube, Neal Mohan, ha manifestado que, en caso de que los videos de creadores de contenido publicados en su plataforma hayan sido utilizados por OpenAI para entrenar su modelo de Inteligencia Artificial (IA) Sora, la compaƱĆa estarĆa llevando a cabo una āclara violaciónā de las polĆticas de YouTube.
Precisamente, Mohan ha explicado que se trata de un uso indebido del contenido de la plataforma ya que los creadores de contenido que deciden publicar videos en YouTube esperan que su trabajo estĆ© realmente protegido por los tĆ©rminos del servicio. āCuando un creador sube su arduo trabajo a nuestra plataforma, tiene ciertas expectativasā, seƱaló el lĆder, al tiempo que ha especificado que una de estas expectativas es que no se permita la descarga de su contenido, como transcripciones o fragmentos de video.Hay que tener en cuenta que esta advertencia surge en un contexto donde OpenAIĀ no ha clarificado completamente los mĆ©todos utilizados para entrenar su nueva inteligencia artificial. Mohan seƱaló que, si bien ciertos datos como el nombre del canal o el tĆtulo del video pueden ser rastreados para aparecer en motores de bĆŗsqueda, los tĆ©rminos de uso de YouTube prohĆben la descarga de videos y transcripciones.
Aumenta tensión entre OpenAI y Youtube
Un estudio de The New York Times afirma que OpenAI ha empleado mÔs de un millón de horas de video para el entrenamiento de Whisper, su inteligencia artificial encargada de convertir audio en texto. Esta iniciativa tiene como objetivo aprovechar las transcripciones generadas para contribuir al desarrollo de GPT-4.
SegĆŗn lo afirmó el medio, el laboratorio de inteligencia artificial habĆa agotado todos los recursos de textos confiables en inglĆ©s disponibles en Internet durante el desarrollo de su Ćŗltima generación de sistemas de IA, requerĆan de mĆ”s datos para entrenar la próxima iteración de su tecnologĆa.
Por ello, los investigadores de OpenAI idearon una herramienta de reconocimiento de voz llamada Whisper. Esta herramienta serĆa capaz de transcribir el audio de videos de YouTube, generando nuevo texto conversacional que potenciarĆa la inteligencia de los sistemas de IA.
Algunos empleados de OpenAI debatieron sobre cómo esta medida podrĆa violar las reglas de YouTube, segĆŗn tres personas familiarizadas con las conversaciones.Ā Y es que YouTube, propiedad de Google, prohĆbe el uso de sus videos para aplicaciones “independientes” de la plataforma.
Es asĆ que un equipo de OpenAI transcribió mĆ”s de un millón de horas de videos de YouTube, afirmaron las fuentes. Este equipo incluĆa a Greg Brockman, presidente de OpenAI, quien participó personalmente en la recopilación de los videos. Posteriormente, los textos se integraron en un sistema llamado GPT-4, que fue ampliamente reconocido como uno de los modelos de IA mĆ”s poderosos del mundo y sirvió de base para la Ćŗltima versión del chatbot ChatGPT.