Vaga remota.
Local
Barueri - SP
Remoto
Responsabilidades
- Projetar, construir e manter pipelines de dados escaláveis e resilientes
- Trabalhar com grandes volumes de dados estruturados e não estruturados
- Garantir qualidade, consistência e governança dos dados
- Colaborar com engenheiros de software, analistas e cientistas de dados
- Participar de decisões técnicas sobre arquitetura de dados e ferramentas
Requisitos
- Experiência com engenharia de dados em ambientes distribuídos
- Conhecimento em Apache Spark e Scala
- Experiência com AWS (Glue, S3, EMR, Athena, Redshift etc.)
- Conhecimento em modelagem de dados, ETL/ELT e pipelines de dados
- Familiaridade com bancos de dados relacionais e NoSQL
- Experiência com processamento em batch e streaming
Diferenciais
- Experiência com Apache Kafka ou Amazon MSK
- Conhecimento em modernização de sistemas legados
- Experiência com Delta Lake, Apache Hudi ou Iceberg
- Familiaridade com CI/CD para dados (dbt, Airflow, Terraform)