Voltar ao blog
Análise de Dados Data Engineering Azure

Microsoft Fabric: A Plataforma Unificada que Todo Data Engineer Precisa Conhecer

O Microsoft Fabric chegou em GA em novembro de 2023 com uma proposta ousada: unificar OneLake, Synapse Analytics, Power BI, Data Factory e Real-Time Intelligence em uma única experiência. Este artigo explica a arquitetura, o modelo de custo, quando faz sentido adotar — e como começar na prática.

MA
Allen87 Data Engineer
22 Jul 2025 · 12 min de leitura

O problema que o Fabric veio resolver

Antes do Fabric, uma empresa usando o ecossistema Microsoft de dados precisava integrar — e pagar separadamente por — pelo menos quatro produtos: Azure Data Factory (ingestão), Azure Synapse Analytics (transformação e consultas SQL), Azure Data Lake Storage Gen2 (armazenamento) e Power BI (visualização). Cada produto tinha sua própria camada de autenticação, seu próprio modelo de precificação, sua própria UX e — o pior de tudo — precisava ser explicitamente integrado ao próximo.

O Fabric não é apenas um rebrand: é uma plataforma SaaS unificada construída sobre um novo fundamento de armazenamento chamado OneLake. Toda a computação do Fabric (Spark, SQL, Power BI, Real-Time Intelligence) lê e escreve no mesmo OneLake sem movimentação de dados entre serviços [4].

Nov 2023Data de GA (General Availability) do Microsoft Fabric
1 lagoOneLake: único repositório por tenant, sem silos
#1Gartner Magic Quadrant para BI — Microsoft, 15 anos consecutivos [5]
DeltaFormato aberto (Delta Parquet) como padrão nativo

OneLake: o OneDrive para dados corporativos

O OneLake é o coração arquitetural do Fabric. Em vez de múltiplas contas de storage espalhadas por regiões e assinaturas, o OneLake fornece um único namespace hierárquico por tenant do Microsoft 365 — parecido com o OneDrive, mas para dados corporativos em escala de petabytes [2].

Três características do OneLake são especialmente relevantes:

  • Formato Delta Parquet nativo: todos os dados são armazenados em Delta Parquet (o formato aberto criado pela Databricks e adotado como padrão da indústria). Isso significa que ferramentas externas como Spark, Databricks ou DuckDB podem ler os dados diretamente, sem exportação.
  • Shortcuts: referências virtuais para dados em outros sistemas (Azure Data Lake, S3, GCS) que aparecem no OneLake sem mover os dados fisicamente. Elimina a necessidade de copiar dados para integrar fontes externas.
  • Sem egress interno: transferências de dados entre serviços do Fabric dentro do mesmo tenant não geram custos de egress de rede — um diferencial econômico significativo para pipelines de alta frequência.

As experiências do Fabric: um produto, sete workloads

O Fabric organiza seus serviços em "experiências" (workloads) acessíveis no mesmo portal. Cada experiência é uma ferramenta especializada construída sobre o OneLake:

  • Data Engineering: Notebooks Spark (Python/Scala/R), Spark Job Definitions e Lakehouses. É o substituto direto do Azure Synapse Spark.
  • Data Factory: pipelines de ingestão low-code e conectores para 150+ fontes. Similar ao Azure Data Factory v2, com UX renovada.
  • Data Warehouse: SQL analytics engine dedicado (T-SQL completo), separado do Spark. Para times que preferem SQL puro sem gerenciar infraestrutura Spark.
  • Real-Time Intelligence: ingestão de dados de streaming (via Eventstream), armazenamento em KQL Database e dashboards em tempo real. Evolução do Azure Data Explorer.
  • Power BI: completamente integrado — relatórios, semantic models e Direct Lake mode (consultas sem importação de dados).
  • Data Science: MLflow integrado, experimentos, modelos e notebooks para ciência de dados com acesso direto ao OneLake.
  • Data Activator: trigger de alertas e ações automáticas baseados em limiares em dados de streaming ou Power BI.

Arquitetura Medallion no Fabric: Bronze, Silver e Gold

A arquitetura Medallion (camadas Bronze/Silver/Gold) não é um conceito novo — foi popularizada pela Databricks [3] — mas o Fabric é a primeira plataforma Microsoft que suporta essa arquitetura nativamente, sem gambiarra.

🔬 Implementação prática no Fabric:

  • Bronze (Raw): Lakehouse de ingestão. O Data Factory copia dados brutos do sistema de origem (arquivo CSV, API, banco operacional) para a camada Bronze sem transformações. Preserve o dado como chegou — é sua auditoria histórica.
  • Silver (Curated): Notebook Spark executa limpeza, tipagem e validação sobre os dados Bronze. Aplica regras de negócio, remove duplicatas, padroniza nomes. Resultado em Delta Parquet.
  • Gold (Serving): Data Warehouse ou Lakehouse com tabelas otimizadas para consumo analítico. Semantic model do Power BI aponta para a camada Gold — usuários finais nunca tocam Bronze ou Silver.

Lakehouse vs. Warehouse: quando usar cada um

Esta é a dúvida mais comum ao começar com Fabric. A resposta depende do perfil do time e da natureza dos dados:

Use Lakehouse quando: o time tem engenheiros de dados confortáveis com Spark e Python; os dados são semi-estruturados ou têm esquema variável; você precisa de processamento de ML/AI sobre os dados; ou o volume é muito alto para SQL tradicional.

Use Warehouse quando: o time é predominantemente analistas SQL; os dados são estruturados com esquema estável; você quer performance de query otimizada para BI sem gerenciar Spark; ou está migrando de um SQL Server / Azure Synapse SQL Pool.

A boa notícia: ambos compartilham o mesmo OneLake. Você pode criar um Lakehouse para ingestão e processamento e um Warehouse para serving — e eles lêem os mesmos dados sem cópia.

Copilot no Fabric: IA como copiloto de dados

O Copilot foi integrado ao Fabric em preview em 2024 e disponibilizado amplamente em 2025. As implementações mais maduras estão em três áreas:

  • Data Engineering: geração de código PySpark a partir de descrições em linguagem natural. "Crie uma transformação que remove duplicatas por customer_id e mantém o registro mais recente" → código Spark funcional.
  • Power BI: geração de medidas DAX, sugestão de visuais e criação de relatórios a partir de prompts. "Mostre a receita por região nos últimos 12 meses com comparativo YoY" → visual completo.
  • Data Warehouse: autocompletar e geração de T-SQL com contexto do esquema do Warehouse.
"O objetivo do Fabric não é eliminar o engenheiro de dados — é eliminar as tarefas de plomaria que consomem 60% do tempo dele."
— Arun Ulag, Corporate VP de Produto, Microsoft (Build 2024)

Modelo de custo: Capacity Units e F SKUs

O Fabric usa um modelo de capacidade compartilhada, diferente do modelo de DTU/vCore do Azure. Você compra uma Fabric Capacity medida em Capacity Units (CU), e todos os workloads (Spark, SQL, Power BI Premium) consomem CU do mesmo pool [7].

Os SKUs disponíveis vão de F2 (2 CUs — para desenvolvimento e testes) até F2048 (2048 CUs — para workloads corporativos massivos). O F64 é geralmente o ponto de entrada para produção em PMEs; grandes enterprises começam em F128 ou acima.

💡 Dica de custo: Diferentemente do Azure, você pode pausar a capacidade Fabric fora do horário de uso. Uma F8 pausada à noite e nos fins de semana pode custar até 70% menos que mantê-la 24×7. Use Azure Logic Apps ou Power Automate para automatizar pause/resume.

Fabric vs. Azure Synapse: o que muda na prática

O Azure Synapse Analytics não está sendo descontinuado — mas o investimento da Microsoft claramente migrou para o Fabric. Para times que consideram a transição, as principais diferenças são:

  • UX unificada: no Fabric, você alterna entre Spark, SQL e Power BI no mesmo portal sem abrir serviços separados.
  • Faturamento simplificado: no Synapse, você paga separado por Spark pools, SQL pools, pipeline executions e ADLS. No Fabric, tudo consome do mesmo CU pool.
  • OneLake vs. ADLS Gen2: no Synapse, você gerencia sua conta ADLS explicitamente. No Fabric, o OneLake é gerenciado pelo serviço — menos operação, menos risco de misconfiguration.
  • Power BI integrado: no Synapse, Power BI é um serviço externo com integração limitada. No Fabric, Power BI é uma primeira classe — Direct Lake mode permite consultas em tempo real sem importação de dados.

Como começar: 5 passos práticos

  1. Trial gratuito: o Microsoft Fabric tem um trial de 60 dias com capacidade F64. Acesse via app.fabric.microsoft.com com uma conta Microsoft 365.
  2. Crie um Workspace: workspaces são o container de organização do Fabric. Crie um workspace por domínio de negócio (Vendas, Financeiro, RH) ou por estágio (Dev/Homolog/Prod).
  3. Implemente um Lakehouse simples: ingira um CSV via Data Factory → processe com um Notebook Spark → visualize com Power BI usando Direct Lake.
  4. Estude para o DP-600: a certificação "Implementing Analytics Solutions Using Microsoft Fabric" [6] é o caminho mais estruturado para aprender a plataforma completamente.
  5. Considere a migração gradual: se você tem pipelines no ADF ou workloads no Synapse, migre por domínio — não tente uma big bang migration.

💡 Takeaway para profissionais de dados: O Fabric não é só uma ferramenta — é uma mudança de paradigma na forma como times de dados se organizam. Engenheiros, analistas e cientistas de dados trabalham na mesma plataforma, com os mesmos dados, sem barreiras de integração. Quem dominar o Fabric agora terá vantagem competitiva significativa no ecossistema Microsoft nos próximos anos.

Referências

  1. Microsoft. What is Microsoft Fabric? Microsoft Learn, 2024. Disponível em: learn.microsoft.com
  2. Microsoft. OneLake, the OneDrive for data. Microsoft Tech Community, 2023. Disponível em: techcommunity.microsoft.com
  3. Armbrust, M. et al. Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics. CIDR 2021. Disponível em: cidrdb.org
  4. Microsoft. Announcing Microsoft Fabric general availability. Microsoft Blog, novembro 2023. Disponível em: azure.microsoft.com/blog
  5. Gartner. Magic Quadrant for Analytics and Business Intelligence Platforms 2024. Gartner Research, 2024. Disponível em: gartner.com
  6. Microsoft. DP-600: Implementing Analytics Solutions Using Microsoft Fabric. Microsoft Learn, 2024. Disponível em: learn.microsoft.com
  7. Microsoft. Microsoft Fabric Pricing — Fabric Capacity Units. Microsoft Azure Pricing, 2024. Disponível em: azure.microsoft.com/pricing

Leia também