Delta Lake, Spark, MLflow, Delta Live Tables, Unity Catalog e Generative AI com Mosaic. Uma imersão técnica completa em Azure Databricks — do cluster ao modelo em produção, em um único sábado.
Um dia de imersão avançada no ecossistema Databricks no Azure. Formato pocket — conteúdo denso, labs práticos, sem introduções desnecessárias.
Delta Lake, Unity Catalog, Delta Live Tables, MLflow, Gen AI e Spark com Python, Scala, R e SQL — tudo em um ambiente Azure Databricks real, com datasets corporativos.
O Databricks Day cobre o conteúdo técnico exigido pelo exame oficial de certificação Databricks — a mais valorizada no ecossistema Spark/Lakehouse.
Nota: a certificação Databricks é emitida diretamente pela Databricks Academy e cobrada separadamente. O Databricks Day prepara você para o exame.
Formato pocket — sem rodeios. Cada bloco vai direto ao ponto técnico, com lab hands-on imediato. Databricks do ambiente ao produto em um único sábado.
"Databricks foi construído para quem leva dados a sério. Um dia de imersão vale mais do que semanas de documentação."
Configuração do workspace Databricks no Azure, integração com ADLS Gen2 e Azure Data Lake Storage. Ingestão de dados batch e streaming com Auto Loader para detecção automática de novos arquivos. Leitura de múltiplos formatos (CSV, Parquet, JSON, Delta) e configuração de mount points.
Transformação de dados com PySpark e Spark SQL: limpeza de nulos e duplicatas, cast de tipos, normalização de schemas, joins distribuídos, aggregations, window functions e expressões complexas. Análise exploratória com visualizações nativas do Databricks e integração com pandas para análises locais.
Unity Catalog como governança centralizada de dados no Databricks: metastore, catalogs, schemas e tabelas. Controle de acesso granular (row-level, column-level), lineage automático de dados, tags e comentários para documentação e auditoria de acesso para conformidade regulatória.
Implementação completa da Medallion Architecture com Delta Lake: Bronze (raw data), Silver (cleaned/validated) e Gold (aggregated/ready). Delta Lake com transações ACID, time travel para auditoria e rollback, schema evolution e Optimized Compaction para performance de queries analíticas.
Delta Live Tables como framework declarativo para pipelines de dados confiáveis: tabelas live, expectations para qualidade de dados automática, monitoramento de falhas, modo Continuous vs Triggered. Redução radical de código de orquestração — do ETL manual ao pipeline gerenciado.
Machine Learning integrado ao Databricks: treinamento distribuído com scikit-learn e XGBoost em clusters Spark, AutoML para aceleração de experimentos. MLflow para rastreamento de runs, parâmetros, métricas e artefatos. Model Registry para versionamento e promoção de modelos para produção.
IA Generativa integrada ao ecossistema Databricks: Mosaic AI para fine-tuning de LLMs e RAG com Vector Search, AI Functions nativas em SQL para enriquecer dados com IA, Lakehouse AI para unificação de dados e modelos. Integração com Azure OpenAI e modelos do Hugging Face.
Databricks SQL para analytics corporativo: SQL Warehouses serverless (cold start em segundos), queries ad-hoc sobre Delta Tables, criação de dashboards nativos com visualizações interativas, alertas automáticos e compartilhamento. Integração com Power BI via conector Databricks para relatórios avançados.
Configuração e otimização de clusters Databricks: All-Purpose vs Job Clusters vs Serverless, auto-scaling inteligente, instâncias spot para redução de custo em até 80%, tuning de configurações Spark (shuffle, caching, broadcast joins), monitoramento com Spark UI e controle de custo com políticas de cluster.
Domínio do ambiente de Notebooks Databricks: alternância entre Python, Scala, R e Spark SQL no mesmo notebook com %python/%scala/%r/%sql. Widgets para parametrização dinâmica, colaboração em tempo real, versionamento nativo com Git, execução de notebooks como jobs agendados e passagem de parâmetros entre notebooks.
As maiores empresas do mundo — Meta, Apple, Comcast, Shell — rodam Databricks. No Brasil, a demanda por profissionais com este skillset cresce mais rápido do que a oferta.
Lidera projetos de tecnologias de ponta para empresas de porte, instituições financeiras, redes de franquias, indústrias e marcas reconhecidas na América Latina, EUA e Europa.
Reconhecido globalmente pelas principais bigtechs. Faz parte do board Microsoft em Redmond. Eleito como um dos principais influenciadores de cloud do mundo. Esteve em projetos com a ONU, Google, IBM, Oracle e Microsoft.
Engenheiro de Software. Especializações em Stanford University, USP e ITA. Professor convidado na USP e PUC. Fundador da maior comunidade de Cloud das Américas com 35 mil participantes.
400+ turmas formadas desde 2018. Profissionais de todo o Brasil e outros países.
Pocket de 1 dia · Formato avançado · Vagas limitadas · Sábado 08:30h – 17:00h
Preencha seus dados e entraremos em contato com as informações sobre a Formação.
Conteúdo gratuito, hands-on, workshops, eventos exclusivos.
Eventos presenciais · Canal YouTube · AI Coffee Talks · 18k+ profissionais