Por ser instrumento de implementação de transparência na gestão do MCTI e para atender ao estabelecido na Lei nº 12.527, de 18 de novembro de 2011 (Lei de Acesso à Informação – LAI), a Plataforma Aquarius pretende, além da oferta de painéis de gestão e acompanhamento com dados editados, oferecer repositório de dados abertos associado a serviços que facilitem seu acesso.

Os painéis de conhecimento da Plataforma serão formados a partir de diversos tipos de dados, dentre os quais se destacam:

  • Dados gerados no âmbito do MCTI e registrados nos sistemas locais do Ministério e de suas Unidades de Pesquisa e Agências;
  • Dados gerados no âmbito do MCTI e registrados nos sistemas estruturadores do Governo Federal;
  • Dados existentes nos Sistemas de outras instituições relacionadas à CT&I (CAPES, Fundações Estaduais de Pesquisa, INPI, IBGE, SCiELO, etc.) disponíveis em seus sistemas locais e/ou na internet;
  • Dados gerados por outras instituições e registrados nos sistemas estruturadores do Governo Federal;
  • Dados existentes nas redes sociais.

Para cada um deles, problemas diferentes se apresentam no que diz respeito à sua incorporação:

  • A exposição em formato aberto para os dados residentes nos bancos de dados internos do MCTI pode ser considerada trivial, desde que sejam garantidas sua atualização permanente e integridade;
  • Para os dados residentes nos bancos de dados de outras instituições, sua incorporação ao repositório de dados abertos do Projeto Aquarius dependerá de negociações bilaterais com as organizações para estabelecimento dos procedimentos operacionais associados às incorporações. Estes procedimentos poderão variar desde o simples envio periódico de arquivos até a incorporação via web services e protocolos de harvesting;
  • Com relação aos dados do MCTI residentes nos bancos de dados dos sistemas estruturadores do Governo Federal (SIAFI, SCDP, SISCONV, SIAPE, etc.), sua incorporação à Plataforma Aquarius e sua oferta em forma de “open data” dependem da possibilidade de que sejam apropriáveis, de maneira sistêmica (idealmente como open data) diretamente daqueles sistemas ou de sistemas intermediários (como, por exemplo, o Portal de Transparência da CGU).
  • Atualmente, a maior parte dos dados residentes nos sistemas estruturadores do Governo Federal é exposta como dados editados ou em planilhas para download com granularidade insuficiente, dificultando ou mesmo impedindo sua apropriação sistêmica pelos órgãos que os geraram;
  • Os processos existentes para extração de dados dos sistemas estruturadores são insuficientes ou inexistentes, gerando necessidade de que as instituições usuárias dupliquem esforços operacionais (registrando as transações em sistemas próprios e nos estruturadores) e invistam recursos em desenvolvimentos redundantes, para que possam ter instrumentos adequados de gestão, ou se conformem com os relatórios pré-existentes nos sistemas estruturadores, na maioria dos casos insuficientes para as necessidades de gestão.

Deste contexto resulta a importância dos projetos de dados abertos tais como a Infraestrutura Nacional de Dados Abertos (INDA), os projetos de dados abertos ligados ao Portal de Transparência da CGU, os esforços do Ministério do Planejamento com arquiteturas tais como a do “Dados Gov, etc.”

O Projeto Aquarius, por conseguinte, pretende estar em fase com os avanços das iniciativas de exposição, em forma de dados abertos, dos dados existentes nos sistemas estruturadores do Governo Federal, sem os quais seus objetivos não serão alcançados.

É interessante observar que os primeiros usuários da oferta dos dados dos sistemas estruturadores em formato aberto serão as próprias instituições governamentais, hoje condenadas a mourejar em processos pouco amigáveis para obter seus próprios dados, lá registrados, de forma sistêmica.

Assim sendo, todos os dados que forem disponibilizados para a Plataforma Aquarius serão ofertados em repositório de dados abertos em formatos adequados que seguirão os padrões definidos pela INDA e poderão ser discutidos com participantes da sociedade civil.

É importante observar que os painéis de conhecimento da Plataforma Aquarius não constituem per se dados governamentais abertos. Isto porque, segundo o World Wide Web Consortium (W3C), dados governamentais abertos são a “disponibilização de informações governamentais representadas em formato aberto e acessível de tal modo que possam ser reutilizadas, misturadas com informações de outras fontes, gerando novos significados”.

Assim, não devemos confundir dados governamentais abertos com publicação na Web de informações ou tabelas ou painéis de dados legíveis apenas por pessoas. Tais publicações, embora informativas, não são dados abertos, pois não estão disponibilizado em formato bruto e aberto, compreensível logicamente, de modo a permitir sua reutilização em aplicações digitais desenvolvidas pelo governo, pela sociedade ou qualquer outro interessado no desenvolvimento desse tipo de aplicação.

O especialista em políticas públicas, David Eaves, criou três leis para dados governamentais:

  1. Se o dado não pode ser encontrado e indexado na Web, ele não existe;
  2. Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado; e
  3. Se algum dispositivo legal não permitir sua replicação, ele não é útil.

É dentro deste princípio que todos os dados brutos que constituem os bancos de dados da Plataforma Aquarius serão tornados disponíveis à sociedade, seguindo os oitos princípios básicos para que dados governamentais que sejam disponibilizados publicamente possam ser considerados abertos, estabelecidos em OpenDataGov (http://www.opengovdata.org/):

  1. Completos: Todos os dados públicos estão disponíveis. Dado público é o dado que não está sujeito a limitações válidas de privacidade, segurança ou controle de acesso.
  2. Primários: Os dados são apresentados tais como os coletados na fonte, com o maior nível de granularidade e sem agregação ou modificação.
  3. Atuais: Os dados são disponibilizados tão rapidamente quanto necessário.
  4. Acessíveis: Os dados são disponibilizados para o maior alcance possível de usuários e para o maior conjunto possível de finalidades.
  5. Compreensíveis por máquinas: Os dados são razoavelmente estruturados de modo a possibilitar processamento automatizado.
  6. Não discriminatórios: Os dados são disponíveis para todos, sem nenhuma exigência.
  7. Não proprietários: Os dados são disponíveis em formato sobre o qual nenhuma entidade detenha controle exclusivo.
  8. Livres de licenças: Os dados não estão sujeitos a nenhuma restrição de direito autoral, patente, propriedade intelectual ou segredo industrial. Restrições sensatas relacionadas à privacidade, segurança e privilégios de acesso devem ser permitidas.

Preliminarmente, entendemos XML e JSON como exemplos de formatos passíveis de adoção. Os dados formatados deverão contar com a presença de metadados (campos de dados que definam a semântica associada aos dados disponibilizados) que os tornem compreensíveis.

Os formatos poderão sofrer modificações e aperfeiçoamentos à medida que as discussões no âmbito da INDA e do Próprio Aquarius evoluam.