A ciência das (in)certezas: estatística espacial

Estatísticos espaciais mapeiam, compreendem e visualizam o mundo de hoje e do futuro

Talvez o/a leitor/a tenha recebido uma visita do recenseador/a do IBGE – Instituto Brasileiro de Geografia e Estatística em casa com um pequeno computador fazendo diversas perguntas sobre a composição da família e da casa. O objetivo do Instituto era fazer o Censo 2022. Para isso, foram visitados todos os domicílios, nos 5.570 municípios brasileiros. Como o país tem dimensões continentais, essa é sempre uma tarefa desafiadora.

Ao responder às perguntas passamos a compor os dados mais detalhados sobre a população brasileira, o que ajuda a montar políticas públicas; isto é, direcionar verbas para saúde, educação e segurança, por exemplo. Estávamos, desde o ano de 2010, trabalhando apenas com dados estimados. Os profissionais da estatística faziam as projeções coletando uma amostra, ou seja, uma pequena quantidade de pessoas que poderia representar a população inteira. Mas quem calculava o tamanho dessa amostra e analisava os dados para fazer esse “retrato” da população? Os profissionais da estatística. São eles que entram em campo para planejar a pesquisa e “ler” os dados depois de coletados.

Enfim, a Estatística é a responsável por determinar quantas pessoas deve-se entrevistar de tempos em tempos, qual tipo de pergunta e como melhor tratar (somar, associar e correlacionar) os dados coletados. Essa ciência busca inferir sobre o todo, por meio de uma amostra pequena, aplicando técnicas corretas, que lhe são próprias. É esse campo rico do conhecimento que está presente no cotidiano das pessoas que é o responsável por tentar dar uma ordem no caos ou predizer algum comportamento no futuro: como será a população daqui a cinco anos? Qual a tendência observada em algumas regiões?

A Estatística é uma área do conhecimento fascinante, porque procura extrair conhecimento desse mundo de incertezas e cheio de dados. Ela ajuda a inferir ou projetar que os dados representem o mais próximo do verdadeiro (verossímil) possível. Para tanto, os estatísticos tentam reduzir ou minimizar os possíveis erros. Os profissionais da área ora se assemelham a curiosos cientistas que ficam olhando e pensando no que se pode aprender com dados ora a cartomantes e oráculos que conseguem indicar ou “prever o futuro”.

Ou seja, trata-se de uma ciência que trabalha com incertezas, variabilidade e boa parte dela emprega modelos matemáticos. Porém, na tentativa de compreender um todo acessando apenas uma parte, se reconhece que pode haver erros. Até porque quase sempre estamos com um número menor (uma amostra), que por mais próxima da população que ela seja, essa amostra nunca é a população total, isto é, sempre vai ter uma variabilidade.

Nessa ciência divertida o mundo passa a ser visto de outra forma e diversas perguntas podem ser feitas e analisadas. Qual é a relação entre as quedas de árvores com a região onde elas estão plantadas? Qual é a relação entre o consumo de chocolate por uma determinada população em uma época do ano? Existe correlação entre os gostos de um usuário com outra pessoa que participa de um mesmo aplicativo de paquera?

Espaço

No caldo de dados que podem ser coletados e associados estão aqueles referentes à localização (e geolocalização) de um determinado evento ou pessoa. Esse dado pode ser utilizado para entender quando algum evento ou acontecimento ocorre em relação a localização ou ao espaço. A essa área dá-se o nome de Estatística Espacial e, no estado do Paraná, diversos pesquisadores têm se dedicado a entender e aplicar esse campo de conhecimento nas mais diversas áreas de pesquisas. 

Na Universidade Estadual de Maringá (UEM), o pesquisador Diogo Rossoni, do Departamento de Estatística, é um deles. Ele nos lembrou que a Estatística vai além das pesquisas eleitorais e suas porcentagens. A estatística está presente no dia a dia das pessoas. “Quando mandamos um e-mail com uma imagem, tem estatística ali, para a decomposição e composição da imagem enviada”, explicou. Além disso, a estatística é uma ciência que serve de base para validar resultados em diversas outras áreas do conhecimento. Por exemplo, em um exame clínico, de uma imagem ou de sangue, têm estatística ali. 

Com o enorme banco de dados que temos acesso hoje (Big Data) e técnicas complexas como aprendizagem de máquina (machine learning), o professor Diogo nos lembrou que a área só tende a crescer nos próximos anos. Trata-se de uma profissão ampla e rica, que pode nos responder sobre comportamentos diversos (ex: por que um post viralizou) até elementos que justificam o aparecimento de uma doença (ex: pesquisas em epidemiologia). 

Quando a estatística entra em campo para compreender fenômenos naturais (animais, corpo humano, ecologia) passa a ser chamada de Bioestatística. Quando se associa à Economia, cria-se a Econometria. É uma área do conhecimento que se subdivide em diversas outras, ampliando e colaborando com todas as ciências. 

Professor Diogo Francisco Rossoni do Departamento de Estatística da UEM
Na entrevista abaixo o prof. Diogo apresenta duas vertentes da Estatística e define a Estatística Espacial

Rossoni nos lembra que a Estatística Espacial começou a ter mais corpo nas últimas décadas, quando o processamento das máquinas passou a dar conta de dados espaciais, que requerem uma ação mais robusta. A melhora dos sistemas de geolocalização, a precisão do GPS (Sistema de Posicionamento Global) e de outras formas de mapas digitais também favoreceu a área. O professor destaca  que a Estatística Espacial pode ser dividida em três grandes áreas: Geoestatística, Dados de Área e Padrões de Ponto. 

Um exemplo de pesquisa que pode ser considerada como Geoestatística está na matéria lançada também nessa semana, que relata pesquisas no campo da Agricultura. Já pesquisas que consideram as ocorrências dentro de um território, uma demarcação política (ex: os limites de uma cidade) são enquadradas como pesquisas de Dados de Área. 

Por outro lado,  uma pesquisa na Estatística Espacial que trabalha com “padrões de ponto”  está sendo a base de estudos que vêm liderando sobre quedas de árvores na cidade de Maringá, ressalta o professor Rossoni. A cidade no noroeste do Paraná tem em média 150 mil árvores e a prefeitura tem dispendido muito dinheiro com melhorias, seguros e indenizações. Diante desse cenário, a pesquisa busca compreender e relacionar as ocorrências das quedas de árvores com outros fatores: chuva, vento, localização, se tem presença ou não de edificações, calçada. 

São perguntas que precisam de dados e o melhor da área para tentar identificar padrões. A estratégia não é só registrar a queda de árvores, mas a cada ocorrência marcar e georreferenciar essa queda. Elas são aleatórias? São mais frequentes por uma espécie? Ou em uma determinada região da cidade as árvores caem mais? Ou seja, temos um cluster – um grupo que pode ser criado por características comuns? E por que será que as árvores caem mais em uma região do que em outra? 

Visualização da Densidade Arbórea (quantidade de árvores por local) na cidade de Maringá. A localização das árvores e a incidência de quedas são depois correlacionadas com diversos dados: chuva, vento, presença ou não de edificações.

Por isso, foi assinado um Termo de Cooperação Técnica entre o município e a UEM para efetivar a realização dessa investigação, evento já noticiado em por outros veículos de comunicação. Segundo Rossoni, essa cooperação é mais uma prova da relevância da universidade e dos pesquisadores que são parte da sociedade. Ou seja, a estatística pode colaborar com as demandas do setor público. 

Alguns resultados preliminares já foram divulgados pelos pesquisadores. Entre 2015 a 2019, 54 vendavais  foram  registrados e 1769 árvores caíram, dando uma média de 33 unidades que caem por vendaval. Em outubro de 2018, foi registrado o pior vendaval no período com a ocorrência de 296 quedas.  As espécies de árvores que mais caíram foram, na ordem: Sibipiruna, Ipê-roxo e a Aroeira Pimenteira. Quando foi empregada uma análise espacial, foi identificado que a região norte foi a mais afetada; os principais bairros são: Jardim Vitória, Bosque das Palmeiras, Conjunto Habitacional Hermann Moraes Barros, Parque das Grevíleas I e II, Loteamento Liberdade II a IV, Conj. Habitacional Itatiaia e Conj. Habitacional Governador Parigot de Souza. 

Mas uma pesquisa dessa natureza precisa acumular mais dados e eventos (ocorrências de quedas) para realmente ser mais assertiva em suas suposições. Por isso, Rossoni destaca que os próximos passos são atualizar a base de dados e incluir informações dos anos posteriores (até 2022). Além disso, a equipe está correlacionando outras variáveis: climáticas, prediais e urbanas (ex: largura da rua, altura do prédio).  

Enquanto as apurações estão em construção, são muitas as perguntas que podem ser feitas: as espécies que mais caem são as mais frequentes na arborização? E por que a região Norte da cidade já se mostrou como a que tem mais predominância de quedas no período analisado? Para responder essas e outras questões os pesquisadores vão terminar de preparar os dados para “rodar” um modelo computacional de classificação e “identificar possíveis causas. A ideia é que a gente possa conseguir trabalhar de forma preventiva essas quedas de árvores” finalizou Rossoni. 

A população de Maringá agradece!

EQUIPE DESTA PÁGINA
Texto: Tiago Lucena
Supervisão de texto: Ana Paula Machado Velho
Edição de áudio: Luiza da Costa
Arte: Helen Vieira
Supervisão de arte: Tiago Franklin Lucena
Edição Digital: Gutembergue Junior

A pesquisa que mencionamos contribui para os seguintes objetivos ODS: