Pular para conteúdo

Dicionário de Dados

Visão conceitual dos dados integrados pelo GovHub BR. Para detalhe de colunas, tipos e linhagem, consulte o dbt docs.

Abordagem Híbrida

Nível Onde Conteúdo
Conceitual Este site (MkDocs) Entidades, relacionamentos, exemplos de uso
Físico dbt docs Colunas, tipos, testes, linhagem por model

O dicionário conceitual explica o que os dados significam no contexto governamental. O dbt docs mostra como estão implementados no pipeline.

Organização por Camada

graph TB
    subgraph "Bronze (MinIO)"
        B1[raw files - JSON/CSV]
    end

    subgraph "Staging (PostgreSQL)"
        S1[stg_transferegov]
        S2[stg_siape]
        S3[stg_siafi]
        S4[stg_comprasgov]
        S5[stg_siorg]
    end

    subgraph "Silver (PostgreSQL)"
        SV1[silver.transferencias]
        SV2[silver.servidores]
        SV3[silver.execucao_financeira]
        SV4[silver.contratos]
        SV5[silver.orgaos]
    end

    subgraph "Gold (PostgreSQL)"
        G1[gold.fato_transferencias]
        G2[gold.fato_servidores]
        G3[gold.fato_compras]
        G4[gold.dim_orgaos]
        G5[gold.dim_tempo]
    end

    B1 --> S1 & S2 & S3 & S4 & S5
    S1 --> SV1
    S2 --> SV2
    S3 --> SV3
    S4 --> SV4
    S5 --> SV5
    SV1 --> G1
    SV2 --> G2
    SV4 --> G3
    SV5 --> G4

Fontes → Tabelas

Fonte Staging Silver Gold
TransfereGov stg_transferegov silver.transferencias gold.fato_transferencias
Siape stg_siape silver.servidores gold.fato_servidores
Siafi stg_siafi silver.execucao_financeira
ComprasGov stg_comprasgov silver.contratos gold.fato_compras
Siorg stg_siorg silver.orgaos gold.dim_orgaos

Dimensões Compartilhadas

Dimensão Tabela Fonte Uso
Órgãos gold.dim_orgaos Siorg Chave para cruzar todas as fontes
Tempo gold.dim_tempo Gerada Calendário (dia, mês, trimestre, ano)

Exemplos de Queries (Gold)

Transferências por órgão (top 10)

SELECT
    d.nome AS orgao,
    SUM(f.valor_total) AS total,
    COUNT(*) AS qtd_convenios
FROM gold.fato_transferencias f
JOIN gold.dim_orgaos d ON f.orgao_concedente = d.codigo
GROUP BY 1
ORDER BY 2 DESC
LIMIT 10;

Servidores por carreira

SELECT
    carreira,
    COUNT(*) AS total_servidores,
    AVG(tempo_servico_anos) AS media_tempo
FROM gold.fato_servidores
GROUP BY 1
ORDER BY 2 DESC;

Compras por tipo de despesa

SELECT
    tipo_despesa,
    SUM(valor_contrato) AS total,
    COUNT(DISTINCT fornecedor_cnpj) AS qtd_fornecedores
FROM gold.fato_compras
GROUP BY 1
ORDER BY 2 DESC;

Páginas por Fonte

Para detalhes conceituais de cada fonte, consulte:

dbt Docs

Para schema completo (colunas, tipos, testes, descrições, linhagem):

https://dbt.ipea.gov-hub.io/#!/overview