Pesquisa¶
Repositório experimental do GovHub BR para exploração de soluções em engenharia de dados e IA aplicada.
Repositório¶
Áreas de Pesquisa¶
| Área | Descrição | Status |
|---|---|---|
| IA Aplicada | Modelos de ML para classificação e extração | Exploratório |
| OCR | Extração de texto de documentos digitalizados | Exploratório |
| Parsers | Parsers de documentos públicos (PDFs, DOCs) | Exploratório |
| Integração de Bases | Cruzamento de dados entre sistemas | Exploratório |
Objetivo¶
Provar conceitos e explorar soluções que possam ser incorporadas ao pipeline principal (data-application-gov-hub) quando maduros.
Como Contribuir¶
- Abrir uma issue em
govhub-researchdescrevendo a proposta - Criar um notebook exploratório ou script de POC
- Documentar hipóteses, abordagem e resultados
- Se validado, propor integração ao pipeline principal via PR
Boas Práticas¶
- Notebooks devem ser auto-explicativos (Markdown cells)
- Dados de exemplo incluídos ou instruções de obtenção
- Dependências em
requirements.txtpor experimento - Resultados reprodutíveis