Pular para conteúdo

Como Usar DBT no GovHub: Guia Completo

O DBT (Data Build Tool) é uma ferramenta essencial para transformação de dados no GovHub. Neste tutorial, você aprenderá como configurar e usar o DBT em sua implementação.

O que é DBT?

O DBT permite que analistas e engenheiros de dados transformem dados em seu warehouse através de comandos SELECT simples, organizando o código de transformação em modelos reutilizáveis.

Configuração Inicial

1. Instalação

pip install dbt-core dbt-postgres

2. Configuração do Projeto

Crie seu arquivo dbt_project.yml:

name: 'govhub_analytics'
version: '1.0.0'
config-version: 2

model-paths: ["models"]
analysis-paths: ["analysis"]
test-paths: ["tests"]
seed-paths: ["data"]
macro-paths: ["macros"]
snapshot-paths: ["snapshots"]

Modelos e Transformações

Arquitetura Medallion

O GovHub utiliza a arquitetura medallion com três camadas:

  • Bronze: Dados brutos
  • Silver: Dados limpos e estruturados
  • Gold: Dados agregados para análise

Exemplo de Modelo

-- models/silver/dim_orgaos.sql
{{ config(materialized='table') }}

SELECT 
    codigo_orgao,
    nome_orgao,
    sigla_orgao,
    esfera_governo,
    created_at,
    updated_at
FROM {{ ref('bronze_orgaos') }}
WHERE status = 'ativo'

Testes e Validação

-- tests/assert_orgaos_unicos.sql
SELECT codigo_orgao, count(*)
FROM {{ ref('dim_orgaos') }}
GROUP BY codigo_orgao
HAVING count(*) > 1

Próximos Passos


Para mais tutoriais como este, visite nossa página de publicações.