O New York Times (NYT) decidiu tomar medidas para evitar que seu conteúdo seja utilizado para treinamento de modelos de inteligência artificial (IA). Conforme publicado pelo Adweek, o jornal norte-americano atualizou seus Termos de Serviço no dia 3 de agosto para proibir a extração de seu conteúdo para treinar um aprendizado de máquina ou sistema de IA.
A proibição inclui conteúdos como texto, fotografias, imagens, ilustrações, designs, clipes de áudio, videoclipes, “aparência” e metadados, incluindo a parte creditada como fornecedora de tais conteúdos.
Os Termos de Serviço também proíbe que rastreadores de sites usem o conteúdo do NYT para treinar modelos de linguagem (LLMs) ou sistemas de IA.
Em um trecho do documento, o NYT alerta sobre os riscos para quem infringir as regras de uso.
“Envolver-se em um uso proibido dos Serviços pode resultar em penalidades civis, criminais e/ou administrativas, multas ou sanções contra o usuário e aqueles que o auxiliam”, diz um dos artigos dos Termos de Serviço do jornal.
Recentemente, a OpenAI lançou o seu rastreador de web, o GPTBot, que permite que desenvolvedores e editores autorizem ou proíbam a coleta de informações do seu site para potencial uso em treinamento de modelos de IA.