“Há uma grande distância entre os dados de que uma organização dispõe e a garantia de que o trabalho que ela faz terá um impacto positivo sobre os cidadãos. É preciso muito cuidado ao conectar esses elementos”, explica Amen Ra Mashariki. Diretor global do Data Lab do WRI, Mashariki trabalha apoiando técnicos e pesquisadores para fechar esta lacuna, impulsionando o impacto positivo do conhecimento produzido pelo diversos escritórios internacionais da organização.

Dados são parte fundamental da abordagem do WRI de “contar, mudar e multiplicar”. O Data Lab se dedica a ampliar o acesso e o uso efetivo de tecnologia de ponta, dados imparciais e inteligência artificial. Minimizar o data bias – vieses dos dados introduzidos nas análises – é um desafio crescente à medida que a capacidade de processamento de tecnologias de inteligência artificial é incorporada à pesquisa e à formulação de políticas em diferentes setores da sociedade. No WRI, o Data Lab assegura aos programas da organização capacidade de obter e analisar os dados de forma consistente e responsável. É parte do compromisso da organização com dados abertos, que possam ser usados da melhor forma por governos, academia, setor privado e pelas próprias comunidades.

Amen Ra Mashariki é diretor global do Data Lab do WRI (foto: WRI)

Mashariki acumula experiências e perspectivas da temática dos "dados para o impacto" ao longo de sua trajetória acadêmica e profissional. Cientista da computação e engenheiro da informação, iniciou a trajetória como cientista pesquisador da Universidade John Hopkins. Saiu do importante centro de Baltimore para tornar-se bolsista no Gabinete de Ciência, Tecnologia e Políticas da Casa Branca e, mais tarde, diretor de tecnologia do Gabinete de Gestão de Pessoal dos Estados Unidos. No setor público federal, Mashariki despertou para o uso de dados como recurso não só de identificação de boas políticas, mas de implementação. “Havia políticas federais difíceis de implementar e, muitas vezes, os dados eram a melhor maneira de ajudar”, explicou em recente entrevista.

Deixou a esfera federal para assumir a diretoria do gabinete de análise de dados da prefeitura de Nova York. No Mayor’s Office of Data Analytics, ou MODA, Mashariki impulsionou o uso de dados e algoritmos para solucionar demandas e desafios da cidade de 8,4 milhões de habitantes. Ele ainda chefiou o departamento de urban analytics da empresa de software de mapeamento geográfico Esri antes de juntar-se ao time do WRI.

Na entrevista a seguir, Mashariki fala sobre suas experiências, aponta desafios e oportunidades de se usar os dados da melhor forma para gerar impacto positivo e a importância de se garantir o acesso amplo a dados abertos e sem viés para gerar sociedades mais justas e inclusivas.

Seu período à frente do MODA ajudou a mostrar como os dados podem auxiliar as cidades a abordar a inclusão e a equidade?

Trabalhamos em uma série de projetos, desde o desenvolvimento de negócios até a identificação de violações dos direitos humanos e ajudando as agências a identificar melhores formas de prestação de serviços para os cidadãos. Transitamos por muitos espaços. Na maioria das vezes tivemos muito sucesso, principalmente porque os dados nunca haviam sido usados de maneira tão importante.

Um exemplo é que a cidade de Nova York oferece vouchers de aluguel para pessoas de baixa renda. É ilegal que um proprietário deixe de alugar seu imóvel para locatários que usem vouchers, seria discriminação. Mas a Comissão de Direitos Humanos estava recebendo muitas reclamações de que isso estava ocorrendo. Eles vieram ao meu escritório e perguntaram se poderíamos usar os dados para ajudá-los. Dissemos, "Bem, adivinhar onde isso acontecerá é inviável, é um algoritmo de previsão muito complexo e não temos os recursos ou os dados necessários”.

Então decidimos, primeiro, criar um índice de qualidade de vida, ou seja, mapear bons bairros que oferecem grandes oportunidades de aluguel. O que é um bom bairro? É aquele que tem muito transporte público, muita área verde, muitos parques, baixa criminalidade, muita atividade econômica. Todos esses são conjuntos de dados que podemos obter, como a localização dos pontos de trem e ônibus, dados sobre a localização dos parques do Departamento de Parques e Recreação, informações da polícia sobre a ocorrência de crimes, informações do Departamento de Defesa do Consumidor sobre onde estão as empresas, que tipo de empresas existem em determinados bairros. E você também pode obter informações sobre moradias disponíveis a preços acessíveis e sobre onde os vouchers estão sendo usados.

Assim, identificamos locais na cidade de Nova York com altos índices de qualidade de vida, onde não havia ninguém com vouchers alugando imóveis. Isso não significava que algo ilegal estivesse acontecendo, poderia haver outros motivos. Então a Comissão de Direitos Humanos contratou atores e atrizes para irem a esses locais e agirem como se quisessem alugar usando vouchers. A ação foi um sucesso [ao constatar que havia preconceito contra gente de baixa renda].

De que outras maneiras podemos usar os dados para gerar equidade e inclusão?

Tornando os dados disponíveis. Uma das coisas que aprendi com o tempo que passei na cidade de Nova York é que, muitas vezes, as pessoas não têm acesso aos dados para poder fazer análises. A analogia que vou dar é: imagine que você morasse em uma cidade da Bahia e houvesse produção local de vegetais de alta qualidade. Há pratos e experiências culinárias incríveis na Bahia e em todo o mundo, mas apenas porque essas pessoas têm acesso a essa riqueza de alimentos frescos. Se o seu cozinheiro favorito não tivesse acesso aos ingredientes, ele ou ela não seria capaz de se tornar um chef famoso. A conversa sobre equidade passa por aí: se você não disponibilizar os dados para essas comunidades, como você espera que elas tenham, no final das contas, pessoas que crescerão e se tornarão doutores e pesquisadores? É a mesma coisa com o acesso. Deve ser direcionado e deliberado, não podemos simplesmente colocar dados em um portal e dizer: "Bem, está aqui, venha e pegue." Você não pode dizer às pessoas na Bahia: "Existem fazendas abertas em São Paulo, por que você não vai buscar a comida de lá?"

O outro lado da moeda é, se organizações estão fazendo análises e usando dados que introduzem vieses na análise, muito da política pública que é desenvolvida poderia incluir esses vieses, mesmo sem saber. Não estou sugerindo que seja proposital, estou sugerindo que é possível. Precisamos ser cuidadosos sobre as análises que estamos fazendo, a qualidade dos dados que estamos usando, sobre a procedência dos dados. Precisamos estar cientes dessas coisas.

Quais são os papéis dos diferentes atores, governo, academia, sociedade civil, setor privado e as próprias comunidades na abordagem do viés em dados e políticas?

Tudo isso é bastante novo e ainda está sendo descoberto. Mas o governo é bom em regulamentação e elaboração de políticas públicas. Acho que o grande trabalho para identificar soluções para mitigar o viés nos dados vai acontecer na academia. Sobre comunidades e organizações comunitárias, são elas que sofrerão o impacto final do enviesamento dos dados, portanto, devem fazer parte do processo, para que possam dizer: “É assim que sua política tem nos impactado”, participando da conversa com o governo e a academia. O setor privado também desempenha um papel nisso, porque gerencia muitos dados. Organizações podem trazer o setor privado para a conversa.

Conhecemos recentemente o LabJaca , uma organização nova da favela do Jacarezinho, no Rio de Janeiro, que busca empoderar a comunidade para gerar dados, uma vez que os dados oficiais são cegos para muitos dos problemas que comunidades vulneráveis enfrentam.

Empoderamento com dados

Segundo o IBGE, há 37 mil pessoas morando no Jacarezinho, enquanto a comunidade estima haver mais de 90 mil moradores. “Como políticas públicas pautadas para 37 mil pessoas vão incidir de maneira condizente com realidade do território?", questiona Thiago Nascimento, um dos seis empreendedores à frente do LabJaca. A iniciativa gera dados de forma participativa e transforma em conteúdo de vídeo. Após concluir um financiamento coletivo, está investigando o impacto socioeconômico da Covid-19 no Jacarezinho e os caminhos pelos quais a comunidade se e reestruturou.

Isso é muito animador. Eu acho que os EUA têm o mesmo problema, os governos não entendem realmente o que está acontecendo nessas comunidades, porque há uma desconfiança entre algumas dessas comunidades locais e o governo de tal forma que o compartilhamento de dados quase não existe. E é a razão pela qual nos Estados Unidos, após a escalada da Covid-19 em fevereiro e março, o governo federal demorou cerca de 5 a 6 meses para perceber que a Covid-19 estava tendo um efeito adverso sem precedentes na população negra e parda em comunidades de baixa renda em vez de outras comunidades. Por que demorou tanto para eles descobrirem isso? Foi porque eles não tinham os dados dessas comunidades. Organizações como essa [LabJaca] são as que devem ser impulsionadas.

No WRI, quais são os principais desafios do Data Lab?

Da forma como o WRI é estruturado, os escritórios internacionais e os escritórios dos programas são as partes que estão fazendo o trabalho no chão, engajando e construindo relacionamentos dentro de suas respectivas regiões e países. O desafio é garantir que o Data Lab esteja fortemente conectado a todos os programas em todos os escritórios, mesmo que suas necessidades sejam diferentes. O que tento fazer é encontrar a demanda comum a todos. Uma delas é garantir o acesso aos dados, que todos possam obter dados, usá-los, entendê-los e compartilhá-los. A segunda necessidade é identificar conjuntos de dados de alto valor que sejam úteis e que não introduzem vieses nas análises. Discutimos como garantir que os dados sejam imparciais para que a análise seja direta e bem-sucedida. Este é o desafio: garantir que tenhamos capacidade consistente.