Informações técnicas sobre a disponibilização de Dados Abertos

Imagem relacionada 
Nesse momento, muita coisa já foi explicada no blog sobre os Dados Abertos. Mas e as informações técnicas? Por exemplo, o que usar para expor os dados? Qual formato utilizar? Essa postagem vai iluminar a sua vida se você tiver dúvidas como essas.

APIs e Web services

Uma forma bastante recomendada de expor os dados, principalmente se os dados em questão mudam frequentemente e se em cada requisição ao servidor tiver um tamanho limitado, é por meio de serviços web. Há várias maneiras de criá-los, mas alguns dos mais usados são SOAP e REST – que, além de serem padrões amplamente utilizados, são relativamente  simples de se desenvolver.

Acesso aos Bancos de Dados
Assim como no caso dos web services, há acesso direto a bases de dados. Mas este serviço tem a vantagem de, na hora de  desenvolver novas utilizações com os dados, permitir aos usuários que selecionem apenas as tabelas e informações que lhes  interessam.
Resultado de imagem para database

FORMATOS

Quando um departamento precisa disponibilizar novos dados,  deve-se escolher o formato que propicia o máximo equilíbrio entre custo e adequação ao propósito dos dados. Para cada formato, há alguns aspectos que devem ser levados em conta, que estão explicados abaixo.

XML

É um formato amplamente usado para troca de dados, pois possibilita que se mantenha a estrutura dos dados em operações diferentes. O modo como os arquivos XML são construídos permite aos desenvolvedores escrever parte da documentação dentro dos dados, sem interferir na sua leitura.

JSON 

É um formato de arquivo bem fácil de ser interpretado por qualquer linguagem de programação, ou seja, costuma ser mais fácil para os computadores processarem JSON do que outras linguagens, como o XML.

RDF 

É um formato relativamente novo, que torna possível apresentar dados de forma que as máquinas consigam compreender e interpretar informações adicionais padronizadas sobre eles. É usado parcialmente em projetos Linked Open Data, da União Europeia. Ainda não é muito difundido, mas oferece excelentes oportunidades para a interoperabilidade e o processamento automático de dados governamentais.

CSV 

Pode ser um formato bem útil, pois é compacto e, portanto, adequado para transferir grandes conjuntos de dados com uma mesma estrutura. Entretanto é tão simples, que os dados chegam a ser inúteis se não houver uma documentação das suas características, uma vez que pode ser quase impossível adivinhar o significado das diferentes colunas. Assim, é importante para as
tabelas separadas por vírgulas (comma separated vallues – CSV) que haja documentação precisa sobre cada campo.

Planilhas

Muitas organizações possuem informação em planilhas, como, por exemplo, as do software Microsoft Excel. Estes dados podem ser usados de forma imediata, adicionando-se apenas a descrição correta das colunas. Em alguns casos, existem macros e fórmulas nas planilhas, o que gera um trabalho mais intenso. Portanto é sempre aconselhável documentar os cálculos e fórmulas na planilha, de maneira a tornar as informações mais acessíveis ao leitor.

PDF 

Os PDFs costumam ser usados para circulação interna de documentos nos órgãos governamentais, já que não permitem modificação (são somente leitura) e por manterem a diagramação original do conteúdo – podendo-se incluir tabelas, gráficos e imagens. No entanto são completamente inúteis para a disponibilização de dados abertos, já que não armazenam as informações de maneira estruturada

Se você souber alguma outra informação técnica relacionada com os dados abertos, compartilha com a gente!

2 Comentários

  1. Ótimo texto, Jaine. Parabéns! Realmente precisamos saber os tipos de formatos de dados que podem ser expostos por aí. Eu já vi organizações disponibilizarem seus dados em próprio arquivo de texto mesmo (txt) que facilita na leitura, mas são poucas que existem, creio. E, para quem quer analisar dados em formatos txt não são tão úteis. Além desse, eu vejo sempre arquivos em formato de licença aberta (ods) que inclusive o nosso portal de dados abertos da UFS (opendata.smart.ufs.br) disponibiliza os dados nesse formato também.

    ResponderExcluir
    Respostas
    1. Olá, Antônio. Acredito que o que acontece com o txt seja algo parecido com o pdf. Eles não armazenam as informações de maneira estruturada. Obrigada por compartilhar conosco!

      Excluir