Um novo projeto de lei quer revelar o que realmente está dentro dos dados de treinamento de IA

Um novo projeto de lei obrigaria as empresas de tecnologia a divulgar quaisquer materiais protegidos por direitos autorais usados ​​para treinar seus modelos de IA.

O projeto de divulgação de direitos autorais de IA generativa do deputado Adam Schiff (D-CA) exigiria que qualquer pessoa que fizesse um conjunto de dados de treinamento para IA enviasse relatórios sobre seu conteúdo ao Registro de Direitos Autorais. Os relatórios devem incluir um resumo detalhado do material protegido por direitos autorais no conjunto de dados e o URL do conjunto de dados, se estiver disponível publicamente. Este requisito será estendido a quaisquer alterações feitas no conjunto de dados.

As empresas devem enviar um relatório “no máximo 30 dias” antes que o modelo de IA que utilizou o conjunto de dados de treinamento seja divulgado ao público. O projeto de lei não será retroativo às plataformas de IA existentes, a menos que sejam feitas alterações nos seus conjuntos de dados de treinamento depois que se tornar lei.

O projeto de lei de Schiff aborda um problema do qual artistas, autores e outros criadores têm reclamado desde o surgimento da IA ​​generativa: que os modelos de IA são frequentemente treinados em material protegido por direitos autorais sem permissão. Os direitos autorais e a IA sempre foram difíceis de navegar, especialmente porque a questão de quanto os modelos de IA mudam ou imitam o conteúdo protegido ainda não foi resolvida. Artistas e autores recorreram a ações judiciais para fazer valer seus direitos.

Os desenvolvedores de modelos de IA afirmam que seus modelos são treinados em dados disponíveis publicamente, mas a grande quantidade de informações significa que eles não sabem especificamente quais dados estão protegidos por direitos autorais. As empresas afirmaram que qualquer material protegido por direitos autorais se enquadra no uso justo. Enquanto isso, muitas dessas empresas começaram a oferecer cobertura legal a alguns clientes caso fossem processados ​​por violação de direitos autorais.

O projeto de lei de Schiff atraiu apoio de grupos da indústria como o Writers Guild of America (WGA), a Recording Industry Association of America (RIAA), o Directors Guild of America (DGA), o Screen Actors Guild – Federação Americana de Artistas de Televisão e Rádio (SAG -AFTRA) e a Associação de Autores. Notavelmente ausente da lista de apoiadores está a Motion Picture Association (MPA), que normalmente apóia medidas para proteger da pirataria obras protegidas por direitos autorais. (Divulgação: A beira a equipe editorial é sindicalizada com o Writers Guild of America, Leste.)

Outros grupos procuraram trazer mais transparência aos conjuntos de dados de formação. O grupo Fairly Trained quer adicionar rótulos aos modelos de IA se eles provarem que pediram permissão para usar dados protegidos por direitos autorais.

theverge