Neural Networks from the beginnings

After reading several books that deal with the topic of neural networks with different levels of complexity, I have proposed to put together this post for those who wish to understand this topic from…

Smartphone

独家优惠奖金 100% 高达 1 BTC + 180 免费旋转




Monitoramento de LGBTfobia em redes sociais com Elastic Stack

No dia 13 de Junho de 2019, o Brasil presenciava um grande passo na luta por justiça à comunidade LGBTQIA+. Nesta data, o Supremo Tribunal Federal (STF) entendeu que havia uma demora do Congresso Nacional em promulgar leis que criminalizassem atos homotransfóbicos e aprovou a inclusão desses crimes na Lei do Racismo (Lei 7.716/1989), até que o Legislativo promulgasse uma lei específica.

Esta conquista, mesmo que tardia, significa avanços para um país que, desde 2008, lidera o ranking mundial de assassinatos a pessoas trans, segundo a ONG Transgender Europe. E ainda, segundo os últimos dados divulgados pelo Grupo Gay da Bahia (GGB) — importante entidade que atua no combate à homofobia — a cada 26 horas alguém é morto vítima de LGBTQfobia.

A popularização das grandes mídias sociais significou para sociedade o encurtamento do relacionamento interpessoal. Entretanto, para grupos minorizados, isso também pode revelar uma aproximação com seus agressores.

Com a popularização do acesso à internet, diversos comportamentos agressivos e odiosos que a população LGBTQIA+ já sofria nas ruas, foram transferidos para o meio digital. Dessa forma, devido a poucas políticas de proteção a população LGBTQIA+, existe a necessidade de assegurar um ambiente mais seguro e que viabilize a coleta de insumos e evidências que possam comprovar a autoria de crimes homotransfobicos.

A necessidade de identificação de atos homofóbicos nas redes sociais foi o que deu origem ao trabalho, utilizando algumas ferramentas da Elastic Stack que ajudaram a impulsionar o projeto.

A iniciativa consiste em uma proposta de arquitetura para a coleta de postagens realizadas na rede social Twitter, suas avaliações através da análise de sentimento, o armazenamento e por fim a evidenciação através de screenshots de comentários possivelmente homofóbicos.

A configuração “keywords” foi responsável por limitar a coleta a apenas aqueles tweets que faziam parte do escopo, com a escolha das palavras que seriam coletadas, dividindo-as em 3 grupos, resultando em 22 termos:

· Comuns: palavras populares para a identificação da comunidade LGBTQIA+, como: gay, lésbica, transexuais;

· Pejorativas: palavras que são normalmente utilizadas para a depreciação da comunidade, como: traveco, boiola;

· Ortograficamente incorretas: palavras com a escrita incorreta, como: bisexual, transsexual.

A utilização de apenas o radical da palavra foi algo que ampliou o escopo de coleta de maneira satisfatória, pois apenas com o termo “travec”, muitas outras palavras foram incluídas, como: “traveco”, “traveca”, “travecão”, “travecona”, por exemplo.

O código consiste na varredura por todo o documento coletado e a verificação de quais dos termos da configuração “keywords” estão contidas no tweet. Dessa forma, em caso de exame nos dados obtidos, poderia haver mais facilidades em busca de documentos que incluem palavras mais pejorativas e, portanto, tem mais possibilidade de estarem ligados com comentários homofóbicos.

Após a coleta dos tweets, há a análise de cada um dos documentos para desvendar o seu sentimento. Com uma quantidade milenária de documentos coletados por dia, é possível através desse processo dar destaque para postagens potencialmente ofensivas.

Para o contexto dos tweets, a magnitude foi desprezada, pois os tweets tem limitação de 280 caracteres e, portanto, magnitudes muito baixas, com pouca variação entre as postagens.

Como exemplo, temos dois tweets coletados durante o desenvolvimento desse projeto. O primeiro com pontuação positiva de +0,80 e o segundo com pontuação negativa de -0,80:

Ainda na tentativa de facilitar a investigação dos tweets, foi adotada uma classificação com base em sua pontuação:

Tabela de Classificação

Com o resultado da análise de sentimento já disponíveis, documentos que tenham sua classificação mais próxima do -1, “Claramente Negativo”, são encaminhados para a evidenciação. A evidenciação significa que daquele tweet, por ter mais chance de conter comentários de ódio, é retirado um screenshot da página e a imagem é armazenada, para que posteriormente possa servir como provas.

Evidência de um tweet possivelmente Homotransfóbico

Com o Kibana, foi possível identificar que fazendo uma média da pontuação dos comentários e agrupando-os pelos termos (“word”), definidos na configuração “keywords”, as palavras “efeminado” e “travesti” foram as que tiveram médias mais baixas, -0,059 e -0,021 respectivamente, ou seja, a média das pontuações de cada tweets relacionado com esses dois termos são os mais baixos entre os outros 20 termos selecionados para esse projeto.

Resultado da média

Pontuações menores do que 0 eram classificadas em um novo campo como “Negativo” e pontuações menores do que -0,8 como “Claramente Negativo”. Sendo assim, pontuações que estivessem abaixo de -0,80 poderiam ter mais ênfase nas investigações.

O presente projeto traz como centro de estudo a identificação de atividades LGBTfóbicas dentro de uma nova sociedade chamada “sociedade do conhecimento”, caracterizada pelo uso das redes sociais.

Junto com o surgimento dessas mídias sociais, diversos comportamentos agressivos e odiosos que a comunidade LGBTQIA+ já sofria nas ruas, foram transferidos para o meio digital.

Sendo assim, o trabalho, utilizando publicações no Twitter como base, traz uma proposta de identificação de comentários possivelmente LGBTfóbicos e como pode ser feita a sua evidenciação. Todos esses objetivos foram alcançados junto com o Logstash para a coleta dos tweets, ElasticSearch para o armazenamento, Kibana para a investigação e a análise de sentimento do Google.

Evidência de Tweet “Claramente Negativo” (-0.9)

Add a comment

Related posts:

AI Driven Drone Economy With DEEP AERO

DEEP AERO is a decentralized drone traffic management platform, using the blockchain technology. Its concept looks different than similar platforms because it has so many attractive features.

Justin bieber u smile mp3 song free download

4. Love this track. Velai Illa Pattadhaari (KuttyW) Buy. Loading. More. Love this track. Set track as current obsession. Justin Bieber — As Long As You Love Me (Audiobot Remix) 34. Justin Bieber — As…

The Daily Dose of Dirt

Another wild and wacky Wednesday has arrived! We’re halfway gone. We’re on our way to the other side of the week; always searching and hoping there’s something more just around the corner. May I…