Skip to content

Latest commit

 

History

History
39 lines (27 loc) · 3.53 KB

File metadata and controls

39 lines (27 loc) · 3.53 KB

CORDATA

O CORDATA - Catálogo Online de Reúso de Dados Públicos é um projeto que cataloga casos de uso de dados públicos, isto é, dados disponibilizados na Web, com livre acesso. Você pode acessar a página oficial do projeto aqui: https://cordata.ceweb.br. Neste repositório, disponibilizamos os dados coletados pelo projeto (ou seja, os metadados a respeito dos reúsos), além de códigos utilizados durante a catalogação ativa e algumas análises realizadas sobre os casos catalogados.

CORDATA - Catálogo Online de Reutilización de Datos Públicos es un proyecto que cataloga casos de uso de datos públicos, es decir, datos disponibles en la web con acceso libre. Puedes acceder a la página oficial del proyecto aquí: https://cordata.ceweb.br. En este repositorio, proporcionamos los datos recopilados por el proyecto (es decir, metadatos sobre reutilizaciones), así como los códigos utilizados durante la catalogación activa y algunos análisis realizados sobre los casos catalogados.

Estrutura do projeto:

.
├── README.md               <- Este documento
├── LICENSE                 <- Licença dos dados e códigos do projeto
├── requirements.txt        <- Principais pacotes de python necessários
├── codigo                  <- Web app interno de catalogação e gestão dos dados (CMS) 
├── dados                   <- Metadados sobre casos de uso 
|   ├── brutos              <- Metadados brutos, originais, vindos do formulário
|   ├── curados             <- Metadados originados do form manualmente corrigidos
|   └── limpos              <- Metadados limpos, corrigidos, padronizados
├── imagens                 <- Imagens representativas dos casos de uso
├── analises                <- Códigos de análise e limpeza dos dados (notebooks de python)
├── scripts                 <- Rotinas auxiliares
└── docs                    <- Documentos e registros

Sobre os metadados dos reúsos

Alguns metadados sobre reúsos foram informados pelo público em geral através do formulário do CORDATA. Nesses casos, os metadados são armazenados na sua forma bruta e posteriormente passam por uma curadoria do Ceweb.br. Os dados brutos, tais quais preenchidos no formulário do CORDATA, estão disponíveis na pasta dados/brutos. Os dados curados são versões dos dados brutos manualmente corrigidas, ainda no formato CSV. Ver dados/curados.

Outros metadados são registrados diretamente pela equipe do Ceweb.br. Nesses casos, o registro é feito através do Content Management System (CMS) disponibilizado em codigo, que resulta diretamente no formato final (JSON). Nesses casos, não há versões brutas ou curadas.

A versão limpa e enriquecida dos metadados coletados através do formulário, combinada com os registrados diretamente pela equipe do Ceweb.br, está em dados/limpos. São esses os dados que aparecem no site do CORDATA.

O código que faz a limpeza dos dados coletados através do formulário encontra-se disponível na pasta analises.

Contato

Para mais informações sobre o projeto, falar com Henrique S. Xavier (https://github.com/hsxavier).