Pular para conteúdo

GovHub BR

Transformando dados públicos em ativos estratégicos para a gestão pública.

O GovHub BR é uma iniciativa open source para integrar, qualificar e disponibilizar dados governamentais de forma estruturada. A plataforma combina pipelines de dados, modelagem analítica, visualização, governança e documentação para apoiar decisões baseadas em evidências.

O projeto responde a problemas recorrentes da gestão pública: fragmentação entre sistemas estruturantes, retrabalho manual, inconsistências entre bases e dificuldade de transformar dados públicos em informação confiável para decisão, transparência e controle social.

Esta documentação reúne a visão técnica do projeto: arquitetura, onboarding, padrões de engenharia, pipeline de dados, infraestrutura, governança e guias de adoção.

Visão Geral

graph TB
    FONTES[Fontes governamentais<br/>TransfereGov, SIAPE, SIAFI, PNCP, SIORG]
    AIRFLOW[Apache Airflow<br/>ingestão e orquestração]
    RAW[(Dados brutos<br/>quando aplicável)]
    DW[(PostgreSQL<br/>data warehouse)]
    DBT[dbt + Cosmos<br/>modelagem e testes]
    CONSUMO[Consumo analítico<br/>Superset e Jupyter]
    GOV[Governança<br/>OpenMetadata, Trino e Ranger]

    FONTES --> AIRFLOW
    AIRFLOW --> RAW
    AIRFLOW --> DW
    DW --> DBT
    DBT --> DW
    DW --> CONSUMO
    DW --> GOV

Repositórios Principais

Repositório Papel
gov-hub site oficial e documentação pública
data-application-gov-hub pipeline principal com Airflow, dbt, Superset e Jupyter
continuous-deployment infraestrutura e deploy GitOps
data-application-cidades fork temático Cidades
data-application-minc fork temático MinC
openmetadata-declarative-governance configuração declarativa de governança no OpenMetadata
data-governance-workshop referência de Trino/Ranger e governança de acesso
govhub-research pesquisa, IA aplicada, OCR e provas de conceito

Por Onde Começar

Objetivo Página
Entender a plataforma Visão Geral da Arquitetura
Subir o ambiente local Instalação
Criar ou revisar DAGs Apache Airflow e Padrões de Engenharia
Trabalhar com dbt dbt e Qualidade de Dados
Contribuir com segurança Segurança e Protocolo de PR
Criar fork temático Guia de Criação

Princípios

  • Transparência: priorizar dados documentados, rastreáveis e auditáveis.
  • Evidências: apoiar decisões públicas com indicadores confiáveis.
  • Reuso: centralizar padrões, helpers, clientes e modelos reutilizáveis.
  • Governança: tratar dados sensíveis com controle de acesso e cuidado operacional.
  • Colaboração: manter fluxos de contribuição claros, revisáveis e seguros.

Fontes de Dados

Sistema Domínio
TransfereGov transferências voluntárias e instrumentos relacionados
Siape pessoal civil e militar
Siafi / Tesouro Gerencial administração financeira, orçamento e execução
ComprasGov / PNCP compras públicas, contratos e licitações
Siorg estrutura organizacional