Dicionário de Dados¶
Visão conceitual dos dados integrados pelo GovHub BR. Para detalhe de colunas, tipos e linhagem, consulte o dbt docs.
Abordagem Híbrida¶
| Nível | Onde | Conteúdo |
|---|---|---|
| Conceitual | Este site (MkDocs) | Entidades, relacionamentos, exemplos de uso |
| Físico | dbt docs | Colunas, tipos, testes, linhagem por model |
O dicionário conceitual explica o que os dados significam no contexto governamental. O dbt docs mostra como estão implementados no pipeline.
Organização por Camada¶
graph TB
subgraph "Bronze (MinIO)"
B1[raw files - JSON/CSV]
end
subgraph "Staging (PostgreSQL)"
S1[stg_transferegov]
S2[stg_siape]
S3[stg_siafi]
S4[stg_comprasgov]
S5[stg_siorg]
end
subgraph "Silver (PostgreSQL)"
SV1[silver.transferencias]
SV2[silver.servidores]
SV3[silver.execucao_financeira]
SV4[silver.contratos]
SV5[silver.orgaos]
end
subgraph "Gold (PostgreSQL)"
G1[gold.fato_transferencias]
G2[gold.fato_servidores]
G3[gold.fato_compras]
G4[gold.dim_orgaos]
G5[gold.dim_tempo]
end
B1 --> S1 & S2 & S3 & S4 & S5
S1 --> SV1
S2 --> SV2
S3 --> SV3
S4 --> SV4
S5 --> SV5
SV1 --> G1
SV2 --> G2
SV4 --> G3
SV5 --> G4
Fontes → Tabelas¶
| Fonte | Staging | Silver | Gold |
|---|---|---|---|
| TransfereGov | stg_transferegov |
silver.transferencias |
gold.fato_transferencias |
| Siape | stg_siape |
silver.servidores |
gold.fato_servidores |
| Siafi | stg_siafi |
silver.execucao_financeira |
— |
| ComprasGov | stg_comprasgov |
silver.contratos |
gold.fato_compras |
| Siorg | stg_siorg |
silver.orgaos |
gold.dim_orgaos |
Dimensões Compartilhadas¶
| Dimensão | Tabela | Fonte | Uso |
|---|---|---|---|
| Órgãos | gold.dim_orgaos |
Siorg | Chave para cruzar todas as fontes |
| Tempo | gold.dim_tempo |
Gerada | Calendário (dia, mês, trimestre, ano) |
Exemplos de Queries (Gold)¶
Transferências por órgão (top 10)¶
SELECT
d.nome AS orgao,
SUM(f.valor_total) AS total,
COUNT(*) AS qtd_convenios
FROM gold.fato_transferencias f
JOIN gold.dim_orgaos d ON f.orgao_concedente = d.codigo
GROUP BY 1
ORDER BY 2 DESC
LIMIT 10;
Servidores por carreira¶
SELECT
carreira,
COUNT(*) AS total_servidores,
AVG(tempo_servico_anos) AS media_tempo
FROM gold.fato_servidores
GROUP BY 1
ORDER BY 2 DESC;
Compras por tipo de despesa¶
SELECT
tipo_despesa,
SUM(valor_contrato) AS total,
COUNT(DISTINCT fornecedor_cnpj) AS qtd_fornecedores
FROM gold.fato_compras
GROUP BY 1
ORDER BY 2 DESC;
Páginas por Fonte¶
Para detalhes conceituais de cada fonte, consulte:
dbt Docs¶
Para schema completo (colunas, tipos, testes, descrições, linhagem):