Fabric, Synapse, Data Factory, Data Lake, Dataflows e Streaming. Domine o ciclo completo de engenharia de dados no Azure — do pipeline ao analytics — com projetos corporativos reais.
A formação que cobre o ciclo completo de engenharia de dados no Azure: da ingestão ao consumo analítico — com Fabric, Synapse Analytics, Azure Data Factory, Data Lake e processamento em tempo real.
Pipelines, Dataflows, Notebooks, SQL Serverless, Spark, Delta Lake, Parquet, streaming com Event Hubs e orquestração incremental — tudo com labs em projetos corporativos reais.
Metodologia exclusiva Azure Academy. A trilha ideal para Data Engineers, Analytics Engineers e profissionais de BI que querem dominar a plataforma de dados mais completa do mercado.
Fabric Data Engineer e Azure Data Engineer. As certificações mais exigidas para quem constrói pipelines e plataformas de dados corporativos no Azure.
Ver todas as certificações disponíveis nas trilhas Azure Academy?
Ver Mapa Geral de Certificações →Pipelines, Fabric, Synapse, Data Lake, Dataflows e streaming. Conteúdo de nível corporativo com labs em projetos de dados reais — do ETL ao analytics.
"Dado que não se move não gera valor. Pipeline que não escala não serve. Engenharia de dados é a arte de fazer os dois funcionarem juntos."
Visão arquitetural do ecossistema de engenharia de dados Azure: padrões de referência para Big Data corporativo, comparação entre ADF, Synapse e Fabric para diferentes cenários, escolha de tecnologias para ETL, ELT e streaming. Lambda e Kappa architecture na prática.
Construção de pipelines de dados corporativos do zero: datasets, linked services, Integration Runtime, triggers por agendamento e por evento. Atividades de cópia, transformação, validação de schema, loops, condicionais e tratamento de erros. Versionamento e CI/CD de pipelines.
Estruturação de Data Lakes corporativos com ADLS Gen2: organização de zonas (Landing, Raw, Curated, Consumption), estratégias de nomenclatura, metadados, políticas de ciclo de vida, compressão e particionamento para performance analítica. Purview para catalogação e linhagem.
Mapping Data Flows para transformação visual de dados em escala: limpeza, normalização, joins, aggregations, window functions e pivoting. Wrangling Data Flows para exploração interativa. Expressões avançadas, parametrização e debug em tempo real com amostragem de dados.
Domínio prático de formatos de dados modernos: Parquet colunar para analytics, Delta Lake transacional com ACID e time travel, Avro para streaming de schema-on-write, ORC para Hive workloads. Conversão entre formatos, compressão (Snappy, GZIP, LZ4) e normalização para performance.
Microsoft Fabric como plataforma unificada: OneLake como repositório central, Lakehouse para dados estruturados e não estruturados, Data Engineering com Notebooks Spark, Data Science com modelos ML, Data Warehouse para analytics e Real-Time Intelligence para streaming.
Desenvolvimento em Synapse Studio com Jupyter Notebooks integrados: Python com PySpark para processamento distribuído, pandas para exploração local, visualização de dados, integração com bibliotecas ML e deploy de notebooks como pipelines automatizados com parâmetros dinâmicos.
SQL Serverless Pools para consultas ad-hoc em Data Lake sem infraestrutura, criação de views externas e integração com Power BI. Apache Spark Pools para processamento massivo: dimensionamento de clusters, gerenciamento de sessões, otimização de jobs e integração com Delta Lake.
Azure Synapse Dedicated SQL Pools para Data Warehouse corporativo: modelagem dimensional (Star Schema, Snowflake), distribuição de tabelas Hash/Round-Robin/Replicated, ColumnStore indexes, workload management com Result Set Caching e Materialized Views para aceleração de queries.
Padrões avançados de orquestração: cargas incrementais com watermark e change data capture (CDC), migração de bancos de dados com zero downtime usando DMS, replicação contínua de dados transacionais e estratégias de rollback e reprocessamento de falhas em pipelines críticos.
Processamento de dados em tempo real: Event Hubs como backbone de mensageria para ingestão de milhões de eventos por segundo, Stream Analytics para queries em janelas temporais (tumbling, hopping, sliding), detecção de anomalias em fluxo e integração com Data Lake para persistência.
Operação de ambientes de dados em produção: versionamento de pipelines com Git e CI/CD no Azure DevOps, integração de múltiplos pipelines com Logic Apps e Runbooks para automação de fluxos cross-service, monitoramento com Azure Monitor, alertas de falha e dashboards de performance.
Toda empresa que escala em dados precisa de engenheiros que saibam mover, transformar e disponibilizar dados de forma confiável. Fabric e Synapse são os frameworks mais contratados.
Engenharia de Dados é a trilha que alimenta todas as outras — e que o Summit aprofunda com cenários reais de arquitetura de dados em escala.
Lidera projetos de tecnologias de ponta para empresas de porte, instituições financeiras, redes de franquias, indústrias e marcas reconhecidas na América Latina, EUA e Europa.
Reconhecido globalmente pelas principais bigtechs. Faz parte do board Microsoft em Redmond. Eleito como um dos principais influenciadores de cloud do mundo. Esteve em projetos com a ONU, Google, IBM, Oracle e Microsoft.
Engenheiro de Software. Especializações em Stanford University, USP e ITA. Professor convidado na USP e PUC. Fundador da maior comunidade de Cloud das Américas com 35 mil participantes.
400+ turmas formadas desde 2018. Profissionais de todo o Brasil e outros países.
Turmas online com vagas limitadas. Sábados e domingos · 08:30h às 16:30h.
Preencha seus dados e entraremos em contato com as informações sobre a Formação.
Conteúdo gratuito, hands-on, workshops, eventos exclusivos.
Eventos presenciais · Canal YouTube · AI Coffee Talks · 18k+ profissionais