Como Usar DBT no GovHub: Guia Completo¶
O DBT (Data Build Tool) é uma ferramenta essencial para transformação de dados no GovHub. Neste tutorial, você aprenderá como configurar e usar o DBT em sua implementação.
O que é DBT?¶
O DBT permite que analistas e engenheiros de dados transformem dados em seu warehouse através de comandos SELECT simples, organizando o código de transformação em modelos reutilizáveis.
Configuração Inicial¶
1. Instalação¶
2. Configuração do Projeto¶
Crie seu arquivo dbt_project.yml
:
name: 'govhub_analytics'
version: '1.0.0'
config-version: 2
model-paths: ["models"]
analysis-paths: ["analysis"]
test-paths: ["tests"]
seed-paths: ["data"]
macro-paths: ["macros"]
snapshot-paths: ["snapshots"]
Modelos e Transformações¶
Arquitetura Medallion¶
O GovHub utiliza a arquitetura medallion com três camadas:
- Bronze: Dados brutos
- Silver: Dados limpos e estruturados
- Gold: Dados agregados para análise
Exemplo de Modelo¶
-- models/silver/dim_orgaos.sql
{{ config(materialized='table') }}
SELECT
codigo_orgao,
nome_orgao,
sigla_orgao,
esfera_governo,
created_at,
updated_at
FROM {{ ref('bronze_orgaos') }}
WHERE status = 'ativo'
Testes e Validação¶
-- tests/assert_orgaos_unicos.sql
SELECT codigo_orgao, count(*)
FROM {{ ref('dim_orgaos') }}
GROUP BY codigo_orgao
HAVING count(*) > 1
Próximos Passos¶
- Explore nossa documentação completa sobre DBT
- Veja exemplos práticos em nossos templates de dashboard
Para mais tutoriais como este, visite nossa página de publicações.