data scraping e coleta de Dados nas redes sociais

data scraping e coleta de Dados nas redes sociais

Quando o assunto é coletar dados, o termo “data scraping” é bastante familiar. Mas o que é exatamente data scraping?

O que é Data Scraping?

Data scraping, ou raspagem de dados, é uma técnica bem conhecida, que consiste em usar bots, crawlers e outras técnicas para vasculhar redes sociais e coletar informações públicas, sistematizando tudo em um banco de dados.

O objetivo da data scraping são óbvios. A coleta de dados automatizada permite que as empresas coletem uma grande quantidade de dados de uma só vez. Além disso, a coleta de dados automatizada pode ser feita em uma grande variedade de formatos. Os formatos mais comuns são CSV, JSON e XML.

Por outro lado, a coleta de dados automatizada pode ser usada para coletar dados sensíveis. Dados sensíveis são aqueles que podem ser usados para identificar uma pessoa ou organização. Existem vários riscos associados à coleta de dados sensíveis, principalmente em função das diretrizes e sanções previstas pela Lei Geral de Proteção de Dados (LGPD).

Ou seja, a coleta de dados automatizada pode ser usada para coletar dados privados. Dados privados são dados que não devem ser revelados. Por isso, é importante que os controladores de dados estejam cientes dos riscos associados à data scraping.

Data scraping nas redes sociais: Facebook, Club House e Linkedin 

Recentemente foram divulgadas ações de data scraping, em três redes sociais diferentes.

Na rede social de Mark Zuckerberg foram expostos dados pessoais de 533 milhões de contas.

O @Facebook confirmou que a base de dados contendo informações de usuários da rede social trata-se de uma coleta de dados que são públicos, mas feita por agentes maliciosos, que disponibilizam os dados em fóruns online. 

Na mesma onda, o @ClubHouse também foi alvo de data scraping eum banco de dados contendo 1,3 milhão de registros de usuários foram tornados públicos gratuitamente. 

Ainda, Na semana passada, na rede social para relacionamento profissional @Linkedin, um arquivo contendo dados supostamente retirados de 500 milhões de perfis também foi colocado à venda.

Vazamento de Dados Pessoais

Seria essa técnica considerada um incidente de segurança, que acarretaria no vazamento de dados pessoais? Ou, haveria a responsabilidade das redes sociais em prever mecanismos de inibir esta prática? 

Os termos de uso das plataformas vedam essa prática, mas ao mesmo tempo são elas que viabilizam que os dados públicos sejam extraídos e sistematizados. O que precisa vir ao debate é se as plataformas devem criar mecanismos para dificultar ou impossibilitar essa técnica.

É provável que discussões nesse sentido sejam cada vez mais frequentes.

Veja mais insights do slap.LAW