Tecnologia

Reddit processa a Perplexity AI e alega “roubo de dados em escala industrial”

Reddit processa a Perplexity AI ao alegar coleta ilícita de conteúdo de usuários em “escala industrial” para treinar sistemas de IA, reacendendo o debate sobre licenças, direitos autorais e governança de dados. O caso expõe tensões entre plataformas, parceiros de dados e desenvolvedores de IA, e aponta para soluções que incluem rastreabilidade e modelos de licenciamento.

Por BlockTrends 23 out 2025

Reddit processa a Perplexity AI e alega “roubo de dados em escala industrial”

Plataforma acusa a Perplexity e parceiros de dados de coletarem indevidamente conteúdo de usuários para treinar sistemas de IA.

O Reddit entrou com uma ação contra a Perplexity AI, afirmando que a empresa e seus parceiros de dados praticaram “roubo de dados em escala industrial”. Segundo a queixa, a rede social acusa a Perplexity e terceiros de coletarem de forma ilícita conteúdo gerado por usuários para treinar sistemas de inteligência artificial. A disputa destaca o embate crescente entre plataformas que hospedam comunidades e empresas de IA que dependem de grandes volumes de dados para aprimorar modelos. No centro do caso está a alegação de que a extração de conteúdo violou regras e direitos associados à origem e ao uso desse material.

Do ponto de vista técnico, sistemas de IA, especialmente modelos de linguagem, exigem vastos conjuntos de dados para aprender padrões, linguagem e contexto. A coleta automatizada de conteúdo, ou web scraping, é um método comum para formar esses repositórios, mas esbarra em termos de uso, sinais de exclusão (como robots.txt) e limites de consentimento. Como discutido em fundamentos de IA, o aprendizado de máquina depende da qualidade e da legitimidade dos dados: sem clareza sobre licenças e origem, os modelos carregam riscos legais e reputacionais. Nesse cenário, a fronteira entre uso justo, direito autoral e contratos de plataforma torna-se central.

Casos como este podem moldar um precedente para a forma como empresas de IA obtêm dados e como plataformas articulam licenciamento, remuneração e proteção de comunidades. Em disputas semelhantes, os argumentos costumam girar em torno de quebra de contrato (por violação de termos), direitos autorais e acesso não autorizado. Ao mesmo tempo, parte do mercado tem buscado soluções por meio de acordos de licenciamento, enquanto outras partes testam a elasticidade das exceções legais. Para usuários e criadores, a questão-chave é se e como seu conteúdo pode ser incorporado a modelos comerciais sem consentimento explícito ou compensação.

Há também um componente operacional relevante: parceiros de dados e agregadores frequentemente intermediariam o acesso a grandes volumes de informações, o que amplia a discussão sobre responsabilidade compartilhada. Em termos técnicos, garantir a proveniência dos dados, registrar permissões e auditar fluxos de coleta são práticas que reduzem riscos. Ferramentas de marcação, políticas de acesso e controles de taxa ajudam a respeitar limites estabelecidos por plataformas. Por outro lado, restringir fontes pode afetar diversidade de dados, influenciando vieses e a capacidade dos modelos de generalizar.

Na interseção entre IA e blockchain, ganham força propostas de trilhas de auditoria imutáveis, registros de licenças e mecanismos de remuneração programável para criadores. A rastreabilidade on-chain pode facilitar a comprovação de origem e o gerenciamento de direitos, ao mesmo tempo em que viabiliza modelos mais transparentes de uso de conteúdo. Para quem deseja compreender melhor como a coleta de dados alimenta a IA e como tecnologias de confiança podem mediar direitos e incentivos, o BlockTrends oferece o curso AI e Blockchain: o Novo Jornalismo, que explora a natureza da IA, seu impacto, e caminhos para integridade e governança de dados.

Este conteúdo é informativo e educacional e não constitui recomendação de investimento. Rentabilidade passada não é garantia de resultados futuros.

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.