GovHub BR¶
Transformando dados públicos em ativos estratégicos para a gestão pública.
O GovHub BR é uma iniciativa open source para integrar, qualificar e disponibilizar dados governamentais de forma estruturada. A plataforma combina pipelines de dados, modelagem analítica, visualização, governança e documentação para apoiar decisões baseadas em evidências.
O projeto responde a problemas recorrentes da gestão pública: fragmentação entre sistemas estruturantes, retrabalho manual, inconsistências entre bases e dificuldade de transformar dados públicos em informação confiável para decisão, transparência e controle social.
Esta documentação reúne a visão técnica do projeto: arquitetura, onboarding, padrões de engenharia, pipeline de dados, infraestrutura, governança e guias de adoção.
Visão Geral¶
graph TB
FONTES[Fontes governamentais<br/>TransfereGov, SIAPE, SIAFI, PNCP, SIORG]
AIRFLOW[Apache Airflow<br/>ingestão e orquestração]
RAW[(Dados brutos<br/>quando aplicável)]
DW[(PostgreSQL<br/>data warehouse)]
DBT[dbt + Cosmos<br/>modelagem e testes]
CONSUMO[Consumo analítico<br/>Superset e Jupyter]
GOV[Governança<br/>OpenMetadata, Trino e Ranger]
FONTES --> AIRFLOW
AIRFLOW --> RAW
AIRFLOW --> DW
DW --> DBT
DBT --> DW
DW --> CONSUMO
DW --> GOV
Repositórios Principais¶
| Repositório | Papel |
|---|---|
gov-hub |
site oficial e documentação pública |
data-application-gov-hub |
pipeline principal com Airflow, dbt, Superset e Jupyter |
continuous-deployment |
infraestrutura e deploy GitOps |
data-application-cidades |
fork temático Cidades |
data-application-minc |
fork temático MinC |
openmetadata-declarative-governance |
configuração declarativa de governança no OpenMetadata |
data-governance-workshop |
referência de Trino/Ranger e governança de acesso |
govhub-research |
pesquisa, IA aplicada, OCR e provas de conceito |
Por Onde Começar¶
| Objetivo | Página |
|---|---|
| Entender a plataforma | Visão Geral da Arquitetura |
| Subir o ambiente local | Instalação |
| Criar ou revisar DAGs | Apache Airflow e Padrões de Engenharia |
| Trabalhar com dbt | dbt e Qualidade de Dados |
| Contribuir com segurança | Segurança e Protocolo de PR |
| Criar fork temático | Guia de Criação |
Princípios¶
- Transparência: priorizar dados documentados, rastreáveis e auditáveis.
- Evidências: apoiar decisões públicas com indicadores confiáveis.
- Reuso: centralizar padrões, helpers, clientes e modelos reutilizáveis.
- Governança: tratar dados sensíveis com controle de acesso e cuidado operacional.
- Colaboração: manter fluxos de contribuição claros, revisáveis e seguros.
Fontes de Dados¶
| Sistema | Domínio |
|---|---|
| TransfereGov | transferências voluntárias e instrumentos relacionados |
| Siape | pessoal civil e militar |
| Siafi / Tesouro Gerencial | administração financeira, orçamento e execução |
| ComprasGov / PNCP | compras públicas, contratos e licitações |
| Siorg | estrutura organizacional |
Links¶
- Organização: github.com/GovHub-br
- Site oficial: gov-hub.io
- Apoio: Lab Livre (UnB) + IPEA/Dides