Hendrik Macedo
02/09/2016

Anonimato. [1]
Anonimato. [1]
Às vésperas do início dos Jogos Olímpicos Rio 2016, fomos surpreendidos aqui no Brasil por uma ação da Polícia Federal que prendeu um grupo suspeito de ligações com a facção terrorista Estado Islâmico (EI) e de planejar ações terroristas no País durante os referidos Jogos. O serviço de Inteligência brasileira afirma que os suspeitos já vinham sendo monitorados pelo engajamento em redes sociais virtuais. As notícias não informam quais redes sociais especificamente estavam sendo monitoradas e tampouco esclarecem os métodos de monitoramento usualmente utilizados por estes serviços de Inteligência. Entretanto, como veremos, é possível que por detrás destes métodos exista uma máquina bem “esperta”.

O EI se caracterizou por um grupo que faz uso intensivo das redes sociais como mecanismo de propaganda de suas diretrizes e ações e como mecanismo para aliciamento de novos integrantes em todo o mundo. Isto motivou um grupo de pesquisadores [2] a tentar compreender o que acontece com usuários europeus do Twitter antes, durante e após os mesmos exibirem comportamento pró-EI (uso de linguagem extremista ou compartilhamento de conteúdo proveniente de contas relacionadas ao EI), ou seja, sinais de radicalização no comportamento. A abordagem adotou técnicas de mineração de dados sociais (do inglês, Social Media Mining) para determinar os pontos temporais de ativação do comportamento, caracterizar o comportamento divergente tanto lexicalmente quanto socialmente e quantificar a dinâmica de influência à medida que menções pró-EI são adotadas nos tweets do usuário. Os resultados do trabalho mostram que dos 154 mil usuários examinados, 727 exibiram sinais de comportamento radical e a grande maioria destes realmente se tornaram ativistas, mostrando que o método chegou a altos índices de precisão. Os resultados ainda mostram que usuários que se tornaram ativistas apresentaram comportamento bastante divergente ao longo do processo e a homofilia social exerce uma forte influência sobre o processo de difusão de mensagens de Twitter pró-EI. Os pesquisadores conseguiram ainda correlacionar o momento de ativação do comportamento com eventos de ampla repercussão na grande mídia envolvendo o EI. As técnicas computacionais utilizadas podem ser aplicadas a qualquer trabalho de pesquisa interessado em modelar a difusão em grande-escala de dados de séries temporais de qualquer domínio.

O trabalho não trata, entretanto, de uma outra métrica de qualidade muito importante: a cobertura. Ao contrário da precisão, a cobertura mediria neste caso qual percentual de indivíduos que realmente são ativistas seriam encontrados a partir da mineração de dados em redes sociais. Ou seja, qual a capacidade de uma dada máquina inteligente automaticamente identificar suspeitos a partir da análise de seus perfis sociais? Isto serve para suspeitos de terrorismo, pedófilos, traficantes e outros. A cobertura nesse tipo de contexto é dificultada pela tentativa deliberada por parte de criminosos de criar naturalmente falsos perfis sociais para disseminar ideologias, se relacionar com seus pares e planejar ações.

Independentemente de motivações criminosas, observa-se atualmente um conjunto não pequeno de pessoas que variam seu perfil social em cada rede social virtual na qual possuem conta. A problemática de se reconhecer diferentes perfis sociais como pertencentes a um mesmo indivíduo na vida real já possui nome na literatura científica relacionada: Resolução de Entidade (RE) (do inglês, Entity Resolution). Felizmente, trabalhos recentes também já resolvem o problema da RE. Em um desses trabalhos [3], novos métodos baseados em aprendizado de máquina supervisionado extraem características relevantes desses perfis e classificadores são construídos para RE nos seguintes diferentes cenários: (i) reconhecer um mesmo indivíduo em duas redes sociais distintas, (ii) procurar por um usuário através de nomes similares e (iii) descobrir identidade de perfis anônimos. No trabalho em questão, 27 diferentes características foram consideradas e estão relacionadas a 3 diferentes categorias: similaridade de nomenclaturas utilizadas, similaridade dos perfis do usuário e topologia da rede social, como por exemplo o número de amigos em comum. A performance do classificador desenvolvido atingiu mais de 95% de acurácia ao ser testado em usuários pertencentes a duas grandes e populares redes sociais virtuais: o Facebook e a Xing (rede social chinesa).

Em um outro trabalho [4], pesquisadores introduzem o conceito de limitações de comportamento humano em redes sociais para mostrar porque a despeito de toda energia desprendida para elaborar diferentes perfis, usuários sempre deixam rastros de sua personalidade por onde passam, o que permite o processo de Resolução de Entidade por parte de uma máquina treinada para tal. Os autores elencam quais são essas limitações de comportamento: (1) seres humanos possuem interesses limitados entre os quais, os de longo termo (centrais e estáveis) e os marginais (temporários), (2) quando os interesses centrais das pessoas mudam, suas identidades virtuais são atualizadas naturalmente, (3) pessoas são mais suscetíveis a fazer amigos com opiniões ou interesses em comum e, consequentemente, compartilhar informações com estes. Os pesquisadores criaram um algoritmo inteligente para mapear a dinâmica dos interesses de longo termo em diferentes redes sociais. Resultados mostraram que a máquina foi efetiva em mapear usuários a partir de duas fontes distintas, o Twitter e o BlogCatalog, e significantemente mais efetiva que métodos de baseline.

O desempenho das máquinas inteligentes supra-citadas só reforça que, em tempos de disseminação indiscriminada de conteúdo cuja veracidade não foi atestada em redes sociais virtuais, mensagens de ódio racial, social ou xenofobia, manifestações de intolerância política ou religiosa, todos devemos provar da velha e boa receita de duas colheres de bom senso para cada xícara de ponderação ao transitarmos na grande rede. Afinal de contas, parafraseando Abraham Lincoln, eu diria que você pode enganar uma pessoa por muito tempo, algumas por algum tempo, mas não consegue enganar todas por todo o tempo, sobretudo se uma delas for artificial e bastante inteligente.

[1] Crédito da imagem: geralt (Pixabay) / Creative Commons CC0. URL: https://pixabay.com/pt/cabeça-silhueta-capô-resumo-1292291/.

[2] M Rowe and H Saif. Mining pro-ISIS radicalisation signals from social media users. In Proceedings of the 10th International Conference on Web and Social Media. AAAI (2016).

[3] O Peled et al. Matching Entities Across Online Social Networks. Neurocomputing (2016).

[4] Y Nie et al. Identifying Users Across Social Networks Based on Dynamic Core Interests. Neurocomputing  (2016).

Como citar este artigo: Hendrik Macedo. As redes sociais virtuais dizem quem você realmente é! Saense. URL: http://www.saense.com.br/2016/09/as-redes-sociais-virtuais-dizem-quem-voce-realmente-e/. Publicado em 02 de setembro (2016).

Artigos de Hendrik Macedo     Home