Fiz este programa para juntar num só lugar algumas ferramentas que me ajudam a resolver tarefas chatas e repetitivas com planilhas. A ideia é ter uma interface simples para poder, por exemplo, dividir uma tabela muito grande, limpar colunas bagunçadas ou comparar duas versões de um mesmo relatório sem precisar de escrever código.
- Analisador: Perfilamento de dados (estatísticas, nulos, tipos).
- Limpador: Limpeza de dados (remoção de duplicatas, tratamento de nulos).
- Unificador: Combinação de múltiplos arquivos (Excel/CSV).
- Preparador ETL: Transformações comuns para pipelines de dados.
- Geolocalizador: Enriquecimento de dados com coordenadas (via CEP/Endereço).
- Anonimizador: Mascaramento de dados sensíveis (LGPD).
- Divisor: Segmentação de arquivos grandes.
- Comparador: Comparação entre dois datasets.
- Visualizador: Geração de gráficos rápidos.
- Extrator: Extração de tabelas e texto de PDFs e DOCX.
- Auxiliador IA: Assistente inteligente integrado (Gemini) para tirar dúvidas e gerar código.
O projeto foi refatorado para uma arquitetura modular:
Python-Data-Toolkit/
├── src/
│ ├── core/ # Lógica central (config, dados estáticos)
│ ├── tabs/ # Módulos de cada aba (funcionalidades)
│ ├── ui/ # Componentes de UI e classe principal da App
│ └── main.py # Ponto de entrada (interno)
├── assets/ # Imagens e ícones
├── main.py # Ponto de entrada principal
├── requirements.txt # Dependências
└── README.md # Documentação
- Clone o repositório.
- Crie um ambiente virtual:
python3 -m venv venv source venv/bin/activate - Instale as dependências:
pip install -r requirements.txt
Execute o arquivo principal:
python3 main.py- API Gemini: Para usar o Auxiliador IA, configure sua chave de API na aba "Configurações".
- Pastas Padrão: Defina pastas de entrada e saída padrão nas configurações para agilizar o fluxo de trabalho.
Este projeto usa a licença GPLv3. Fique à vontade para usar, modificar e partilhar. Desde que tudo permaneça livre.

