Queremos saber #OndeEstãoDadosLGBTQIA

TL;DR

Nesse texto, vamos apresentar nossa campanha em busca de dados com informações sobre a comunidade LGBTQIA+ e explicar como é possível participar e nos ajudar a disponibilizá-los em nosso datalake público. Também vamos apresentar bases de dados que já mapeamos e que entrarão para o datalake, além de demonstrar como acessá-las.

Queremos saber #OndeEstãoDadosLGBTQIA

Sabemos que a riqueza de dados é fundamental para a elaboração de políticas públicas que ajudem a combater a violência e o preconceito contra a comunidade LGBTQIA+. No intuito de identificar e trazer acessibilidade para esses dados, a Base dos Dados está lançando esta campanha para encorajar todos que trabalham ou utilizam dados a nos ajudar a encontrar e catalogar essas informações.

Nosso objetivo é mapear o máximo possível de bases, para que nossa equipe trate, limpe e disponibilize esses dados em nosso datalake público, facilitando o acesso e análise dessas informações.

Até então, tivemos muito mais facilidade de encontrar bases estrangeiras, geralmente a nível de país, do que bases de níveis nacionais. Nossa equipe já entrou em contato com o Grupo Gay da Bahia, principal ONG que contabiliza mortes LGBTQIA+ no país; com a Ditch The Label, ONG estrangeira que contabiliza mortes, ofensas e abusos sofridos por pessoas trans; e com a própria Transrespect x Transphobia, ONG estrangeira que contabiliza assassinatos trans ao redor do mundo.

Infelizmente, só obtivemos uma resposta negativa da Ditch The Label quando requisitamos dados brutos para disponibilização. É importante ressaltar que é urgente a melhor disponibilização de dados da temática LGBTQIA+ e isso pode começar por você!

Como você pode ajudar?

Se você já conhece ou encontrou alguma base de dados interessante que aborda esse tema, você pode acessar nossa planilha de prioridade de bases, incluir uma linha por tabela do conjunto de dados e preencher os campos cuidadosamente, caso ela não esteja já listada.

Uma outra maneira de ajudar é divulgando esses dados em suas redes sociais e marcar a @basedosdados com a hashtag #OndeEstãoDadosLGBTQIA, para aumentar ainda mais o alcance da campanha.

Conjuntos de dados já mapeados pela Base dos Dados

Nossa iniciativa mapeou três bases de dados que serão disponibilizadas já limpas e tratadas em nosso data lake público. Você já pode acessar as tabelas através da biblioteca basedosdados no R , em Python ou diretamente pelo GoogleCloud, utilizando os códigos descritos neste texto. Confira a seguir os conjuntos de dados já tratados:

  • Relatório Transrespect versus Transphobia Worldwide

O relatório relata os números totais de homicídios de pessoas trans no mundo inteiro e contém tabelas a diferentes níveis de agregação, demonstrando mortes totais a nível de país, de local da ocorrência do crime e de como o crime ocorreu, a causa mortis do homicídio. O recorte aborda dados de 2008 até 2018, em países de todos os continentes.

Utilize as queries de SQL a seguir para acessar as tabelas:

#Assassinatos por país
SELECT * FROM `basedosdados.mundo_transrespect_transphobia.pais`

#Causa do óbito
SELECT * FROM `basedosdados.mundo_transrespect_transphobia.obito`

#Local de assassinato
SELECT * FROM `basedosdados.mundo_transrespect_transphobia.local`

Caso prefira pegar direto pelo Python:

import basedosdados as bd
bd.read_sql(query = 'SELECT *
FROM `basedosdados.mundo_transrespect_transphobia.pais`',
billing-project-id = 'seu-project-id')

Com esses dados criamos a seguinte visualização que compara o número de homicídios de pessoas trans em diferentes países ao longo dos anos:

  • Pesquisa Online da Agência dos Direitos Fundamentais da União Europeia (FRA):

A pesquisa foi realizada com pessoas LGBTQIA+, em 2012, na maioria dos países do bloco político-econômico. A pesquisa é dividida em um conjunto de tópicos que dão origem a diferentes tabelas. Os tópicos levam a perguntas sobre violência, sobre o cotidiano LGBTQIA+, direitos da comunidade, entre outras. Os tópicos são agrupados a nível de cada país e grupo LGBTQIA+.

Utilize as queries de SQL a seguir para acessar as tabelas da pesquisa:

SELECT * FROM `basedosdados.eu_fra_lgbt.consciencia_direitos`
 SELECT * FROM `basedosdados.eu_fra_lgbt.cotidiano`
 SELECT * FROM `basedosdados.eu_fra_lgbt.discriminacao`
 SELECT * FROM `basedosdados.eu_fra_lgbt.transgenero_especifico`
 SELECT * FROM `basedosdados.eu_fra_lgbt.violencia_abuso`

Caso não queira nem sair do R, você pode sempre acessá-las direto do software:

library(basedosdados)
basedosdados::read_sql('SELECT *
FROM `basedosdados.eu_fra_lgbt.consciencia_direitos',
billing-project-id = 'seu-project-id')
  • Relatórios anuais de mortes LGBTI+ no Brasil, pelo Grupo Gay da Bahia

Relatórios que informam o total de mortes da comunidade no Brasil, agregados por ano, por grupo LGBTQIA+, por estado de ocorrência do homicídio, entre outros tópicos. Os dados foram coletados, em sua maioria, manualmente. Caso você tenha contato de alguém da iniciativa, nos informe, pois estamos procurando os dados em formato tabular para agilizar e automatizar a disponibilização dessas bases.

Utilize as queries em SQL a seguir para acessar as tabelas:

#Uma série por ano de todo o Brasil
SELECT * FROM `basedosdados.br_ggb_relatorio_lgbtqi.brasil`

#Por raça/cor
SELECT * FROM `basedosdados.br_ggb_relatorio_lgbtqi.raca_cor`

#Por grupo LGBTQIA+
SELECT * FROM `basedosdados.br_ggb_relatorio_lgbtqi.grupo_lgbtqia`

#Por causa do óbito
SELECT * FROM `basedosdados.br_ggb_relatorio_lgbtqi.brasil`

#Por local do assassinato
SELECT * FROM `basedosdados.br_ggb_relatorio_lgbtqi.local`

Como sempre, você pode acessar os dados direto do seu console de R. Para analisar os assassinatos a nível de raça/cor, você pode rodar:

basedosdados::read_sql('SELECT *
FROM `basedosdados.br_ggb_relatorio_lgbtqi.raca_cor`',
billing_project_id = "seu-project-id")

Com esses dados, criamos também este gráfico que demonstra o número de homicídios de pessoas LGBTQIA+ ao longo dos anos, separado por raça.

A Base dos Dados é uma iniciativa sem fins lucrativos, open source e que busca facilitar e fomentar a produção de conhecimento no Brasil. Acreditamos que dados públicos devem ser transparentes e acessíveis a toda a sociedade civil.

Se você tiver alguma dúvida sobre a campanha ou sobre como adicionar dados que você encontrou na planilha de prioridade de bases, entre em nossa comunidade no Discord e fale conosco: https://discord.com/invite/huKWpsVYx4

Esse texto foi produzido com ajuda do Matheus Valentim, da equipe de dados da BD, e da Fernanda Scovino, coordenadora de comunicação. 💚

16