Pesquisadores da USP criam modelo para identificação de fake news no Twitter

Morfologia do compartilhamento de informações na rede social são tratados na identificação de informações que podem ser falsas

A Rede Social foi escolhida por ter um banco de dados abundante para desenvolvimento do projeto. Fonte: Pixabay

As fake news dominam os debates públicos recentes por possuírem um poder perigoso de disseminar informações falsas e incitarem os usuários das mídias a acreditar em contextos paralelos. 4 em cada 10 brasileiros afirmam receber fake news diariamente. Identificar e limitar a circulação deste tipo de conteúdo tornou-se tema central na esfera do Estado e das redes sociais para evitar danos às instituições e às pessoas alvo desta prática. 

Nesta linha, o projeto “LIBRA – Modelos hierárquicos para detecção de fake news no Twitter usando características de propagação” busca identificar o compartilhamento de informações possivelmente falsas a partir das suas características de propagação.

A ideia do projeto surgiu, segundo Thomas Palmeira, aluno de doutorado da École Polytechnique, na França, e pesquisador voluntário do Escola Politécnica da USP, a partir de uma preocupação dos alunos de engenharia sobre como as informações estavam sendo moderadas na internet. Os objetivos eram criar um modelo de moderação transparente, em que a pessoa entendesse os motivos que levaram uma publicação a ser limitada ou excluída, e otimizar a maneira com que esse tipo de conteúdo era monitorado na internet.

Isso porque, segundo Palmeira, os modelos de identificação de fake news já existentes focam no conteúdo escrito e não em suas características de disseminação.

Existem particularidades que também ajudam a detectar notícias falsas e podem ser mais importantes, como: o compartilhamento de uma publicação recém postada por vários bots; uma notícia sobre o Brasil muito compartilhada no exterior, mas somente em uma cidade específica; o título não ter relação com o restante do conteúdo do texto; muitas citações sem fonte; ou mesmo o histórico dos perfis que estão propagando a informação. “Esse tipo de característica está fora do que está no texto e é mais sobre como um post está sendo propagado no texto”, completa o pesquisador. 

 

“É por isso que a gente foi estudar estruturas de dados que modelassem isso. Sequências ou gráficos que não olhassem só o post específico, mas o todo”
Thomas Palmeira

 

O projeto se baseou em experiências de Inteligência Artificial que já existem no exterior, porém em inglês. Adaptar esse tipo de conteúdo ao português era necessário, pois a tecnologia não era eficiente para o idioma. 

Por essa carência de tecnologia do tipo em língua portuguesa, um dos focos era gerar datasets, uma ferramenta-base para que um algoritmo consiga aprender, evoluir e proporcionar resultados, para esses modelos de aprendizado supervisionado que necessitam de dados e notícias marcados como verdadeiras ou falsas para que se fixasse o padrão.

Palmeira, ressalta que o modelo não realiza a verificação dos fatos e dados, o fact checking. “O que a gente está fazendo em computação chamada detecção de fake news é, na verdade, estimar uma probabilidade de ser verdadeiro ou falso com base em características do modelo hierárquico”, no entanto, ele completa afirmando que o LIBRA tem interesse em adicionar esta funcionalidade no futuro, em parceria com veículos de comunicação. 

Seja o primeiro a comentar

Faça um comentário

Seu e-mail não será divulgado.


*