Search

Livro mostra como usar dados do Twitter para estudar cidades

O livro “Urban Social Listening – Potential and Pitfalls for Using Microblogging Data in Studying Cities” foi escrito por Justin Hollander, Erin Graves, Henry Renski, Cara Foster-Karim, Andrew Wiley e Dibyendyu Das, pesquisadores do Urban Attitudes Lab da Tufts University.
A publicação parte de discussão e revisão teórico-bibliográfica sobre o uso de dados em mídias sociais para avaliar estados emocionais e traços de personalidade.
Para analisar Bem-Estar Subjetivo, aplicam sobretudo a metodologia Big Five Personality Traits, que tem sido aplicada repetidamente nas últimas décadas e propõe cinco dimensões essenciais: neuroticismo, extroversão, amabilidade, conscienciabilidade e abertura para a experiência. E para estudar a relação entre satisfação de vida e afeto, que é uma relação complexa e multidimensional, vão aplicar a análise de sentimento em níveis municipais.

É um livro relativamente curto (103 páginas) com seis capítulos. Depois do primeiro introdutório, o segundo oferece uma pequena história da Análise de Sentimento, resgatando as principais colaborações das áreas de mineração de opiniões, estudos linguísticos comparativos e estudos urbanos (Urban Studies). Quanto a estes últimos, citam trabalhos que buscaram calcular as cidades mais e menos felizes, estudos em locais específicos (como Cidades Olímpicas, Festivais, museus) e até iniciativas governamentais oficiais de consulta a populações através de mídias sociais e Twitter. Aplicações em momentos de crise, como uso das mídias sociais para esforços de gerenciamento em desastres, envio de alertas de emergência e correlação de tweets com sensores de movimentações sísmicas também são citados. A área de mobilidade também está presente, como estudo de movimentação de pessoas, sentimento quanto a áreas específicas da cidade e aplicação a estudos de tráfego também são revisadas.
Com este aprendizado, os autores vão detalhar nos três capítulos seguintes experimentos com graus crescentes de complexidade. A maior força do livro é a descrição detalhada dos procedimentos técnicos e ferramentais realizados nos três estudos. No primeiro deles, os pesquisadores desenvolveram software chamado “Urban Attitudes” para armazenar, indexar e analisar um fluxo contínuo de tweets extraídos a partir da Twitter API.

A cidade de New Bedford, em Massachussetts, foi escolhida devido a seu pequeno tamanho e demografia jovem e conectada. Foi estabelecido um retângulo em torno das fronteiras da cidade para facilitar a extração dos tweets. A partir daí, foi otimizado um módulo de análise de sentimento no IBM SPSS Modeler a partir de dicionário de sentimento com 2477 palavras com pontuação orginal. Apenas parte das mensagens possuía carga explítica de sentimento, totalizando 7,2% para positivo e 5,5% para negativo.
Depois de desenvolver dicionário de temas urbanos, concluem que “beyond describing citizens to helping develop an understanding of how people feel about the places they live and react to and even participate in public events going on around them” (p.32-33).
O capítulo seguinte busca entender comunidades de imigrantes. Especificamente foram estudadas quatro cidades pós-industriais de Massachussets, comparando falantes de português e inglês, sobretudo provenientes de Portugal, Cabo Verde e Brasil. O objetivo foi responder duas perguntas: 1) Como falantes de português nestas cidades comparam-se a falantes de inglês em termos atitudinais e de marcadores de felicidade?; e 2) Como estes resultados se comparam a outras cidades da mesma região em Massachusetts? Como controle na pesquisa, foram comparados os resultados com Cambridge (da própria Massachussets), Lisboa e São Paulo. Ao todo foram coletados 814 mil tweets únicos entre dezembro de 2014 e janeiro de 2015.
Entre os resultados identificados, os marcadores culturais brasileiros parecem ter agido: em São Paulo os tweets foram bem mais positivos do que qualquer outro local. Na em áreas falantes de inglês predominantemente os tweets nesta língua foram bem mais positivos; em áreas falantes de português os tweets destas línguas também foram bem mais positivos. Estes últimos são resultados que podem indicar alguns fatores intervenientes ligados a sensação de pertencimento, por exemplo. Depois de comparar alguns resultados por indicadores demográficos, os autores pontuam as dificuldades encontradas pelas diferenças nas línguas.
O capítulo a seguir buscou compreender se existe uma relação entre ganho ou perda de população e sentimento geral na população analisado a partir do Twitter. O destaque do capítulo é o cruzamento dos dados de sentimento com o Censo americano, mas os dados não foram significativos, resultando em uma interessante seção de limitações e desdobramentos futuros. Assim, os autores trazem estes resultados como gancho para sublinhar alguns pontos nas conclusões sobre os limites de uso do Twitter para algumas questões de pesquisa; os erros e inconsistências que podem aparecer na mesclagem de métodos; e as falhas inerentes em léxicos de sentimento predefinidos.
Sintetizando, dizem que:

Criticism of social media data sets as being unrepresentative of the public at large is certainly valid, but less acknowledged is the ability of urban social listening to capture sentiments expressed by individuals who are typically left out by existing methods. Census surveys may be statistically valid, but capture only a tiny sliver of resident opinions of place, and are widely certainly used in public policy formulation. Public forums or meetings, on the other hand, draw attendance only from those most engaged in the political process, with turnout far smaller than even the already subpar voter turnout in municipal elections. There is much to be improved about urban social listening, but the promise of gaining near instantaneous insights and input from a large swath of otherwise excluded or diffi cult to access individuals should not be discounted. (p.79)

Saiba mais sobre o grupo em https://sites.tufts.edu/ualab/