Descrição:
Formação em Tecnologia, Matemática, Estatística, Economia ou áreas correlatas.
Forte conhecimento em SQL;
Boa lógica de programação e raciocínio analítico;
Experiência com Spark ou Databricks em ambientes distribuídos;
Domínio de ambientes Azure (Data Factory, Data Lake, Synapse, Event Hub, Functions, etc.);
Noções práticas de DevOps;
Capacidade de compreender rapidamente processos de negócio e propor soluções de dados aderentes;
Proficiência em bancos de dados relacionais e não relacionais.;
Habilidades de programação em Python e/ou Scala;
Boa comunicação e relacionamento com times técnicos e de negócio.
Atuar na extração, transformação e carga de dados em ambientes distribuídos;
Coletar, limpar e transformar dados brutos em formatos utilizáveis para análise;
Desenvolver e manter pipelines de dados eficientes e escaláveis;
Gerenciar, modelar e utilizar bancos de dados relacionais (SQL), não relacionais (NoSQL) e datawarehouses;
Colaborar com cientistas de dados e outros profissionais de análise para fornecer insights acionáveis;
Participar de reuniões de definição e planejamento;
Acompanhar e aplicar as boas práticas e padronizações;
Monitorar e otimizar o desempenho dos sistemas de dados.
Diferenciais:* Certificações Azure (por exemplo, Microsoft Certified: Azure Data Engineer Associate);
Certificação Databricks de nível médio ou avançado (Data Engineer Associate ou Professional);
Bom conhecimento das ferramentas que compõem o Spark;
Bom conhecimento com bancos de dados NoSQL, como Cassandra, Cosmos, etc;
Proficiência em plataformas de streaming de eventos, como Eventhubs, Kafka ou MSK;
Histórico de liderança técnica em projetos.
2510120202241276584