Como abrir os Dados



O início de um projeto sempre vai ser um processo  complicado e difícil, e a abertura dos dados não está fora disso, já que é um projeto que envolve diversas variáveis que, caso sejam ignoradas, podem causar muitos problemas no futuro. Por isso, vamos trazer algumas dicas do Open Data Handbook que podem lhe ajudar no processo da abertura de dados. Antes de tudo, existem 3 regras importantes para seguir durante a abertura dos dados:



  • Simplicidade: Comece pequeno, simples e rápido. Não há necessidade de abrir todos os datasets imediatamente. Comece abrindo apenas um dataset, ou apenas uma parte de um dataset muito grande, mas, é claro que quanto mais datasets você puder abrir, melhor, contanto que você tenha controle e noção da necessidade de abrir o dataset.
  • Crie um engajamento cedo e frequente: o engajamento de pessoas, empresas, instituições aumenta a relevância dos serviços que utilizam o seu dataset. Ficando claro que a maioria dos dados não estão diretamente relacionados com o usuário final, mas sim com os chamados "infomediários": pessoas que pegam os dados e os transformam ou reusam para que sejam apresentados. Por isso é importante incentivar os "infomediários" à usar os seus dados.
  • Cuide dos receios e mal-entendidos: Isso é muito importante, principalmente, quando você trabalha com grandes instituições. Nessas situações, o ideal é identificar e tratar o mais rápido possível os problema e os medos relacionados ao uso dos dados.


Tendo isso em mente, foram definidos 4 passos para abrir os dados:


1- Escolha dos dataset(s): Na maioria dos casos, a escolha dos datasets para ser o foco do projeto é uma decisão difícil de ser tomada. Uma dica para tomar essa decisão é criar uma lista com os datasets que podem ser abertos no início do projeto. Após a criação dessa lista, algumas recomendações são importantes na escolha dos datasets

  • Pergunte à comunidade, até porque são eles que vão acessar e usar seus dados. Você pode fazer através de consultas em uma página web, por audiências públicas, fóruns, emails e etc.
  • Analise os custos de obtenção e manutenção dos dados, pois se um dataset teve um custo muito grande envolvido na sua produção, então é muito provável que tenha uma grande quantidade pessoas interessadas em usá-lo.
  • Tente dar prioridade aos dados que são mais fáceis de disponibilizar, ou seja, os dados que chegariam mais rápido no público. Mas sempre observando a importância desses dados, pois, caso esses dados sejam irrelevantes, a instituição pode perder credibilidade.

2- Utilize Licenças Abertas: Em muitas situações vai haver propriedade intelectual envolvida nos dados, o que torna necessário o uso de licenças, mas siga esse conselho: se você vai abrir os dados, aplique uma licença, mesmo que não tenha conhecimento sobre existência de alguns direitos sobre os dados. Para aplicar essas licenças, o ideal é utilizar as licenças que têm conformidade com a Open Definition e que podem ser aplicadas para dados.


3- Torne os dados disponíveis: Os dados ser tecnicamente abertos, além de legalmente abertos. Especificamente, os dados precisam estar disponíveis em grandes volumes e em um formato legível por máquina.

A disponibilização não tem obrigação de ser gratuita, segundo o Open Data Handbook, dados devem ter preço não maior que um custo razoável de reprodução, preferencialmente como um download gratuito na Internet, ou seja, o provedor dos dados não pode visar lucros na disponibilização dos dados. E tem que ficar claro que  o objetivo da disponibilização não é que os usuários possam ler com facilidade, e sim que as máquinas consigam, ou seja, evite formatos como o PDF.

Existem diversas formas para disponibilizar os dados, algumas delas são: disponibilização em um website próprio, em site de terceiros, servers FTP, torrent ou como API.

4- Faça os dados serem facilmente encontrados: Esse passo é muito importante, já que os dados abertos não são nada sem os usuários. Existem algumas ferramentas que ajudam a localizar os dados, como o DataHub e o CKAN.


Todos esses passos são iterativos, então, caso você tenha alguma problema durante o processo você pode voltar a um passo que resolva esse problema. Mas se todos os passos foram executados corretamente, então, dificilmente você terá problemas futuros com relação aos seus dados.

Fonte:

0 Comentários