Infografia em Dados Governamentais

Thiago Berlitz Rondon
Publicado em 01/03/2011

Infografia em Dados Governamentais

Em Ciências da Computação o termo "design de informação" é associado algumas vezes como sinônimo para arquitetura de informação, ou design de sistemas de informação, banco de dados ou estrutura de informação, mas na área de design gráfico, que lida detalhadamente com o projeto da informação visual, o objetivo principal é que o leitor adquira informação em sistemas de comunicação visuais.

Este artigo na realidade é uma discussão que irei fazer em "voz alta", sobre os primeiros passos dos meus estudos relacionados a infografia, e este é um assunto muito importante quando se fala de dados governamentais pois, às vezes, apenas mostrar um montante de dados não faz com que os leitores entendam bem o que eles representam.

Basicamente a representação visual de informações são definidos como infografia, ou como conhecemos através de alguns portais brasileiros de notícia como infográficos que são usados para descrever o que aconteceu em uma determinada situação.

Oferecer ao usuário uma experiência nova pode parecer muito óbvio, mas para que tenhamos um projeto para desenvolver experiências relacionadas a infográfica, precisamos de profissionais em várias áreas, e não apenas do setor de tecnologia. O nosso papel como desenvolvedores é conseguir prover informações que eles sejam processadas de uma forma trivial, e por isto vamos discutir algumas estratégias neste documento.

Uma breve história sobre o assunto, podemos começar pela simiologia da gráfica que é uma teoria do design de informação apresentada por Jacques Bertin, que considera "um quadro para a análise e representação de dados em papel. Fundada na experiência prática de Bertin como geógrafo e cartógrafo, ao invés de pesquisa empírica".

Outro grande nome deste ramo, é Edward Tufle que disse que este trabalho de Jacques "prevê um estudo aprofundado de diferentes técnicas gráficas (forma, orientação, cor, textura, volume, tamanho) para localizar e sinalizar variações quantitativas, geralmente sobre o espaço geográfico ou ao longo do tempo.".

Um fato relevante da história, é o caso do Leonardo da Vinci que tentou entender os fenômenos descrevendo-os em detalhes extremos e não enfatizando experiências ou explicações teóricas, tanto que ele planejou uma enciclopédia baseada em desenhos detalhados em tudo, pois não dominava o latim e o matemático e foi ignorado pelos estudiosos contemporâneos por conta disto.

Realizou autópsias e elaborou desenhos anatômicos extremamente detalhados, tendo planejado um trabalho, inclusive sobre o corpo humano, de anotomia comparativa e, entre 1510 e 1513, estudou fetos, de que resultaram obras que podem ser consideradas como infografias de grande complexidade.

Mas o assunto principal aqui é abordar a questão da infografia para os desenvolvedores: como nós podemos oferecer dados para que bons designers ou belas ferramentas já existentes possam processar os dados ? Então iremos abordar inicialmente alguns conceitos técnicos relacionado a matemática e computação e depois discutir sobre como utilizar estes dados em um infográfico.

Fluxo dos dados

Para entendermos melhor como construir um infográfico, é interessante discutirmos alguns pontos sobre como os dados e as informações presentes nos infográficos são obtidos e compilados.

As estratégias para que isto funcione no seu sistema, basicamente devem seguir como os dados são concebidos na abstração do infográfico, ou seja a ideia é a reflexão desde da coleta dos dados até a produção visual.

Coletar

A coleta de dados pode ser efetuada de muitas maneiras, mas a questão é que para que estes dados estejam de uma maneira que computadores consigam interpretar de forma mais ágil.

Você pode ter todos estes dados impressos em livros, o teu trabalho será de colher eles de forma manual. Com tecnologia, se estes dados estiverem em formatos abertos para que computadores possam ler de forma semântica, o trabalho será muito mais trivial.

Armazenar

O segundo passo é armazenar estes dados de uma maneira, com qual você consiga trabalhar com eles posteriormente, porém existem processos de coleta de dados com tecnologia que já incluem este passo.

Processar

Neste ponto é que efetuamos o resumo dos dados, ou seja, nos processamos eles e podemos cruzar com outras informações, gerar estatisticas, criar métricas e etc.

Visualizar

Com os dados preparados, agora está no momento de definir como estes dados serão visualizados, escolher a melhor maneira visual que o público alvo irá conseguir interpretar os dados processados com o mínimo de esforço em relação a conhecimento.

Coleção de dados e a experiência do usuário

A coleção de dados na infográfia esta orientada não apenas aos dados que estão disponíveis, mas também ao público alvo em relação a experiência que será criada para que estes dados sejam demonstrados.

Nosso objetivo é esclarecer que o fluxo para entregar a informação altera em relação aos dados, normalmente a produção do conteúdo é baseada nos dados e na tecnologia ao redor para criação da visualização, e isto gera uma motivação por parte dos usuários.

O trabalho com infográficos é a criação do visual e os dados, o produto também dependa das motivações do usuário, isto significa que em um formato comum o processo é:

Para elaboração de infográficos, o fluxo normalmente é :

ICONOLOGIA e ICONOGRAFIA

Erwin Panafsky escreveu em seu livro "Estudos da Iconologia" que a iconografia é o estudo do tema e a iconologia é o estudo do significado do objetivo analisado. Ele exemplifica o ato de um index.tm levantar o chapéu. Num primeiro momento (ICONOGRAFIA) é um index.tm que retira da cabeça um chapéu, num segundo momento, (ICONOLOGIA) menciona que ao levantar o chapéu educadamente, esse gesto é "resquício do cavalherismo medieval: os index.tns armados costumavam retirar os elmos para deixarem claras suas intenções pacíficas". Enfatizando a importância dos costumes cotidianos para se compreender as representações simbólicas.

A importancia destas definições esta diretamente ligada ao público que você deseja alcançar, e a experiência que você quer oferecer.

Crowdsourcing

Este é uma forma de produção e disseminação de informação de uma maneira coletiva, no qual com os infográficos podemos incentivar este tipo de modelo pelo simples motivo que iremos compilar informações para usuários especificos.

Isto significa em alguns casos, interpretar dados complexos e tornar-los simples, para que mais pessoas consigam aproveitar das informações e agregar com conhecimento especifico.

Hoje este tipo de movimento esta cada vez mais sendo adotado por comunidades da sociedade interessadas em conhecimento e dados, por isto que a utilização de infográficos pode ser um ótimo incentivador.

Visualizacões dos dados

Iremos tratar aqui da maneira de visualizar os dados, e discutir e refletir sobre alguns tipos de dados que normalmente encontramos na necessidade de simplificar.

Treemapping

É um método para mostrar informações baseado em hierarquia que utiliza uma ordenação de árvore, e é utilizado quadrados para demonstrar grupos de dados e que possuem funções específicas.

A hierarquia lhe dá a oportunidade de criar ramificações de dados, e assim criar nós baseado da maneira que você desejar. Você pode parametrizar a maneira que você queira visualizar os dados em relação as cores e dimensão, ou seja, um grupo de dados que possuem mais informações pode ter um tamanho maior, assim como uma cor diferente.

Alguns algoritmos conhecidos que são utilizados para auxiliar na organização destes dados são "Arvores binárias", "Slice And Dice" e "Squarified".

Diagramas de Voronoi

O matemático Georgy Voronoy criou este tipo de diagrama para demonstrar o espaço métrico em regiões da imagem de acordo com a distância a determinados pontos, e o interessante que ele lhe dá um caminho seguro, gera uma rota equidistante dos objetos e uma ótima visualização em casos que são utilizados mapas, há um exemplo ótimo na Wikipedia que diz:

Imagine o seguinte problema: você recebe o mapa de uma metrópole. Neste mapa estão marcados os locais onde existem os vários postos de saúde espalhados pela metrópole. Sabe-se que há edifícios por toda a parte da metrópole. Deve-se determinar qual a área de cobertura de cada um dos postos de saúde, ou qual o conjunto de edifícios que será atendido por cada posto de saúde da metrópole. Naturalmente, bastaria descobrir os conjuntos de edifícios que estão mais próximos de cada posto de saúde que obteríamos uma solução para o problema.

Essa solução corresponde ao Diagrama de Voronoi.

Existem alguns algoritmos que tornam esta tarefa mais simples, tais como a "Bowyer–Watson" e "Fortune's".

Triangulações de Delaunay

Um algoritmo muito interessante para criar visualizações em mapas, baseado em triangulação, que organizando a distância dos pontos em triângulos, você também obtêm um círculo-circundante vazio, para que você consiga retirar propriedades de terrenos por exemplo.

Este algoritmo normalmente é utilizado para determinar a densidade e a intensidade dos pontos analisados, e pode ser utilizado para demonstrar ocorrências de determinas ações onde não há uma informação precisa.

Mapa de sinergia

O interessante deste mapa é a possibilidade de dividir as perspectivas em quatro partes baseado em prioridades e o cronograma, e então interligar eles visualmente para melhora compreensão do momento.

Geográficos

Dados geograficos normalmente estão associados a onde os dados pertencem, e você possui informações tais como latitude e longitude.

Existem bancos de dados especificos para trabalhar com a geração de dados baseados em posicionamento e podem auxiliar na geração de gráficos na hora, um deles é a extensão postgis para o postgresql.

DNA

Gráficos baseado na estrutura chamada cromossoma que é uma longa sequencia de DNA que contém vários genes e outras sequências com funções específicas. O interessante é que podemos utilizar esta estrutura para demonstrar dados organizados por metadados, onde conseguimos representar a evolução das informações.

Você pode criar cenários para descrever a evolução com "câncer", baseada em replicação e várias outras maneiras, e isto pode ser facilmente compreensível em um gráfico para descrever o processo destas informações.

Exemplos dos assuntos

Os assuntos dos dados, podem ser vários, e é impossível de descrever todos eles, mas irei comentar alguns casos relativos a dados de interesse da sociedade em relação a organização de si própria.

Dados urbanos

São métricas ou informações processadas relacionadas às cidades, tais como índices de crimalidade, trânsito e desastres naturais.

Políticos

São informações para serem analisadas em relação ao desempenho político que está sendo avaliado, geralmente acompanhadas de dados para comparação histórica

Disposição dos dados para encontrar os dados e processar

Ter estes dados disponíveis via uma API, uma linguagem de representação de dados como RDF, ou ter eles armazenardos como já foi dito em fluxo dos dados, é interessante para gerar infográficos no exato momento.

O conhecimento sobre estas disposições pode facilitar o trabalho de quem for criar as visualizações de dados.

Estatísticas

Estatísticas utilizam-se das teorias de probabilidade e neste caso incialmente é muito interessante para ser usado na detecção a frequencia da ocorrência de um determinado evento, para que facilite os estudos observacionais e etc.

Este processo geralmente esta associado à coleta, análise e interpretação dos dados.

Com a computação, a prática de modelos estastísticos não-lineares está se tornando mais frequente, pois com o aumento da capacidade de processamento estamos obtendo habilidades para criar cálculos baseados em reamostragem, como testes de permutação e bootstrap.

Métricas

Métrica é um sistema de mensuração que quantifica uma tendência, uma dinâmica ou uma característica. Nós já estamos acostumados a visualizar métricas em vários estudos, onde o uso dela é feito para explicar fenômenos, diagnosticar causas, compartilhar descobertas e projetar resultados de eventos futuros.

Podemos dizer que no mundo dos negócios e do governo, as métricas estimulam o rigor e a objetividade, elas tornam possível comparar observações entre regiões e períodos de tempo, facilitando a compreensão e a colaboração.

Normalmente com dados governamentais iremos discutir sobre métricas relacionadas a ao desempenho.

Escolhendo os números certos

O imperativo numérico representa um desafio, pois há uma dificuldade tremenda em selecionar quais fórmulas utilizar para representar um montante de dados, principalmente na administração pública ou na economia, pois muitos dados podem estar incompletos e temos que trabalhar com informações aproximadas.

Por isto em muitos casos é interessante utilizar uma métodologia de que você irá oferecer inicialmente várias métricas, para que você possa 'tringular' elas e criar estratégias e até métricas novas.

O interessante da triangulação de métricas é que podemos usar umas para verificar o resultado das outras também, e com o tempo criar projeções mais inteligentes baseado em dados - métricas - aproximadas.

Por isto escolher os números certos pode ser possível apenas com um determinado tempo, para você consiga provar os fenômenos práticos com os números escolhidos.

Padronizando as referências.

Efetuar uma medição é algo muito complexo, por uma questão de chegar a um ponto comum em vários casos, como reduzir informações de forma satisfatórias e tirar conclusões de assuntos às vezes tão complexos?

Para isto é interessante que exista uma padronização relacionada ao tipo da métrica que queremos utilizar para que haja uma fácil compreensão e também para que futuramente uma métrica nova seja criada de forma sensata, tais elas como:

Algoritmos

Não há como citar algoritmos em especificos, pois existe a necessidade inicialmente de coletar os dados que você tem disponível, verificar se estes dados representam algum conceito ou algo da forma mais absoluta possível - ou aproximada -. O segundo passo é organizar estes dados para que eles sejam compilados e processados em formas reduzidas.

Dependendo da quantidade de dados envolvidos, há a necessidade de "transformar" estes dados em outro formato para que a manipulação seja mais rápida.

Conclusão

Este artigo tem como objetivo oferecer um levantamento em relação às ideias relacionadas a infografia, e quais os passos para conseguir enviar dados de forma dinâmica ou não relacionado a uma quantidade de dados.

O trabalho não é só em ter os dados, mas organizar eles de forma que fique simples o trabalho do design de informação, além de que como foi abordado existe um interesse grande para que os dados sejam compartilhados, reutilizados e principalmente para que exista um ecosistema para formação de novas ideias baseado em um processo colaborativo.

	Se você tem uma maçã e eu tenho uma maçã
	e nós trocamos essas maçãs,
	então eu e você ainda teremos uma maçã cada.

	Mas se você tiver uma ideia e eu tiver uma ideia
	e nós trocamos ideias,
	então cada um de nós terá duas ideias."

	-- George Bernard Shaw (1856-1950)

Referências

Synergy map, how to map out your current strategy - http://http://www.agileweboperations.com/synergy-map-how-to-map-out-your-current-strategy-part-1-of-2.

Sémiologie Graphique. Les diagrammes, les réseaux, les cartes. With Marc Barbut [et al.]. Paris : Gauthier-Villars. (Translation 1983. Semiology of Graphics by William J. Berg.)

The Visual Display of Quantitative Information (pictures of numbers). Edward Rolf Tufte. ISBN 0-9613921-0-X.

Estudos de Iconologia, por Erwin Panofsky.

Beautiful Data, The Stories Behind Elegant Data Solutions, By Toby Segaran, Jeff Hammerbacher.

Métricas de marketing, por Paul W. Farris & Neil T. Bendle & Phillip E. PFeifer & et al.

Agradecimentos

Pela revisão do artigo, conversas e ideias:

Alexei "russo" Znamensky

Breno "garu" Oliveira.

Todos os gráficos, foram retiradas do Wikipedia.

Autor

Thiago Rondon, <thiago.rondon no e-mail gratuito do google>

blog comments powered by Disqus