O Data Engineer focado em AI é responsável por construir a infraestrutura que viabiliza Machine Learning e aplicações de Generative AI.

Local

São Paulo - SP

Híbrido

Linguagens Python, SQL avançado, Scala (opcional)
Orquestração & Transformação Apache Airflow, dbt, Prefect
Processamento de Dados Spark, Pandas, PySpark
Data Lakes (S3, GCS, Azure Blob), Data Warehouses (BigQuery, Snowflake, Redshift)
Bancos NoSQL, Bancos vetoriais (Pinecone, Weaviate, FAISS)
Streaming Kafka, Pub/Sub
Infraestrutura Docker, Kubernetes, Cloud (AWS, GCP ou Azure)
Modelagem de dados, ETL / ELT, Processamento distribuído, SQL avançado, Arquitetura de dados escalável, Experiência com dados não estruturados (texto, logs, PDF), Conceitos de DataOps, Versionamento e qualidade de dados

Pensamento sistêmico, Forte organização, Atenção a detalhes, Mentalidade de escalabilidade, Colaboração com times de ML, Proatividade na prevenção de gargalos

Engenheiro de Dados