Meta discutiu uso de conteúdo pirata para treinar IA, revelam documentos
Documentos judiciais revelados recentemente mostram que a Meta discutiu internamente o uso de obras protegidas por direitos autorais, obtidas de maneira questionável, para treinar seus modelos de IA.
O caso Kadrey v. Meta, que envolve disputas de direitos autorais relacionadas à IA, mostra que a empresa alegou que o uso de material protegido por copyright, como livros, seria “uso justo”, enquanto os demandantes, incluindo autores como Sarah Silverman e Ta-Nehisi Coates, discordam.
Conversas internas indicam que a Meta estava ciente de que usar dados protegidos por direitos autorais poderia ser problemático legalmente, mas a equipe de IA, liderada por Melanie Kambadur, considerou a possibilidade de adquirir e-books e usar fontes como Libgen, um site conhecido por fornecer acesso a conteúdo pirata.
Leia mais:
Facebook classifica Linux como ‘ameaça à segurança cibernética’ e gera polêmica
Meta planeja investir US$ 60 bilhões ou mais em IA no ano de 2025
Meta é acusada de baixar mais de 80 TB em torrent para treinar modelo de IA
Meta discutiu métodos para evitar consequências legais
A empresa chegou a discutir maneiras de mitigar os riscos legais, incluindo evitar o uso de dados claramente identificados como pirateados.
Em outros registros, a Meta mencionou que estava em negociações com editoras e plataformas para licenciar dados, mas, internamente, havia pressões para encontrar alternativas rápidas e mais acessíveis.
A Meta também ajustou seus modelos para evitar perguntas relacionadas a direitos autorais, como solicitar trechos de livros protegidos.
O caso revela a tensão entre os avanços rápidos no campo da IA e as questões legais complexas sobre o uso de dados protegidos, refletindo os riscos que a Meta e outras empresas de tecnologia enfrentam ao usar grandes volumes de dados para treinar seus modelos de IA.
O post Meta discutiu uso de conteúdo pirata para treinar IA, revelam documentos apareceu primeiro em Olhar Digital.