O problema que o Fabric veio resolver
Antes do Fabric, uma empresa usando o ecossistema Microsoft de dados precisava integrar — e pagar separadamente por — pelo menos quatro produtos: Azure Data Factory (ingestão), Azure Synapse Analytics (transformação e consultas SQL), Azure Data Lake Storage Gen2 (armazenamento) e Power BI (visualização). Cada produto tinha sua própria camada de autenticação, seu próprio modelo de precificação, sua própria UX e — o pior de tudo — precisava ser explicitamente integrado ao próximo.
O Fabric não é apenas um rebrand: é uma plataforma SaaS unificada construída sobre um novo fundamento de armazenamento chamado OneLake. Toda a computação do Fabric (Spark, SQL, Power BI, Real-Time Intelligence) lê e escreve no mesmo OneLake sem movimentação de dados entre serviços [4].
OneLake: o OneDrive para dados corporativos
O OneLake é o coração arquitetural do Fabric. Em vez de múltiplas contas de storage espalhadas por regiões e assinaturas, o OneLake fornece um único namespace hierárquico por tenant do Microsoft 365 — parecido com o OneDrive, mas para dados corporativos em escala de petabytes [2].
Três características do OneLake são especialmente relevantes:
- Formato Delta Parquet nativo: todos os dados são armazenados em Delta Parquet (o formato aberto criado pela Databricks e adotado como padrão da indústria). Isso significa que ferramentas externas como Spark, Databricks ou DuckDB podem ler os dados diretamente, sem exportação.
- Shortcuts: referências virtuais para dados em outros sistemas (Azure Data Lake, S3, GCS) que aparecem no OneLake sem mover os dados fisicamente. Elimina a necessidade de copiar dados para integrar fontes externas.
- Sem egress interno: transferências de dados entre serviços do Fabric dentro do mesmo tenant não geram custos de egress de rede — um diferencial econômico significativo para pipelines de alta frequência.
As experiências do Fabric: um produto, sete workloads
O Fabric organiza seus serviços em "experiências" (workloads) acessíveis no mesmo portal. Cada experiência é uma ferramenta especializada construída sobre o OneLake:
- Data Engineering: Notebooks Spark (Python/Scala/R), Spark Job Definitions e Lakehouses. É o substituto direto do Azure Synapse Spark.
- Data Factory: pipelines de ingestão low-code e conectores para 150+ fontes. Similar ao Azure Data Factory v2, com UX renovada.
- Data Warehouse: SQL analytics engine dedicado (T-SQL completo), separado do Spark. Para times que preferem SQL puro sem gerenciar infraestrutura Spark.
- Real-Time Intelligence: ingestão de dados de streaming (via Eventstream), armazenamento em KQL Database e dashboards em tempo real. Evolução do Azure Data Explorer.
- Power BI: completamente integrado — relatórios, semantic models e Direct Lake mode (consultas sem importação de dados).
- Data Science: MLflow integrado, experimentos, modelos e notebooks para ciência de dados com acesso direto ao OneLake.
- Data Activator: trigger de alertas e ações automáticas baseados em limiares em dados de streaming ou Power BI.
Arquitetura Medallion no Fabric: Bronze, Silver e Gold
A arquitetura Medallion (camadas Bronze/Silver/Gold) não é um conceito novo — foi popularizada pela Databricks [3] — mas o Fabric é a primeira plataforma Microsoft que suporta essa arquitetura nativamente, sem gambiarra.
🔬 Implementação prática no Fabric:
- Bronze (Raw): Lakehouse de ingestão. O Data Factory copia dados brutos do sistema de origem (arquivo CSV, API, banco operacional) para a camada Bronze sem transformações. Preserve o dado como chegou — é sua auditoria histórica.
- Silver (Curated): Notebook Spark executa limpeza, tipagem e validação sobre os dados Bronze. Aplica regras de negócio, remove duplicatas, padroniza nomes. Resultado em Delta Parquet.
- Gold (Serving): Data Warehouse ou Lakehouse com tabelas otimizadas para consumo analítico. Semantic model do Power BI aponta para a camada Gold — usuários finais nunca tocam Bronze ou Silver.
Lakehouse vs. Warehouse: quando usar cada um
Esta é a dúvida mais comum ao começar com Fabric. A resposta depende do perfil do time e da natureza dos dados:
Use Lakehouse quando: o time tem engenheiros de dados confortáveis com Spark e Python; os dados são semi-estruturados ou têm esquema variável; você precisa de processamento de ML/AI sobre os dados; ou o volume é muito alto para SQL tradicional.
Use Warehouse quando: o time é predominantemente analistas SQL; os dados são estruturados com esquema estável; você quer performance de query otimizada para BI sem gerenciar Spark; ou está migrando de um SQL Server / Azure Synapse SQL Pool.
A boa notícia: ambos compartilham o mesmo OneLake. Você pode criar um Lakehouse para ingestão e processamento e um Warehouse para serving — e eles lêem os mesmos dados sem cópia.
Copilot no Fabric: IA como copiloto de dados
O Copilot foi integrado ao Fabric em preview em 2024 e disponibilizado amplamente em 2025. As implementações mais maduras estão em três áreas:
- Data Engineering: geração de código PySpark a partir de descrições em linguagem natural. "Crie uma transformação que remove duplicatas por customer_id e mantém o registro mais recente" → código Spark funcional.
- Power BI: geração de medidas DAX, sugestão de visuais e criação de relatórios a partir de prompts. "Mostre a receita por região nos últimos 12 meses com comparativo YoY" → visual completo.
- Data Warehouse: autocompletar e geração de T-SQL com contexto do esquema do Warehouse.
"O objetivo do Fabric não é eliminar o engenheiro de dados — é eliminar as tarefas de plomaria que consomem 60% do tempo dele."
— Arun Ulag, Corporate VP de Produto, Microsoft (Build 2024)
Modelo de custo: Capacity Units e F SKUs
O Fabric usa um modelo de capacidade compartilhada, diferente do modelo de DTU/vCore do Azure. Você compra uma Fabric Capacity medida em Capacity Units (CU), e todos os workloads (Spark, SQL, Power BI Premium) consomem CU do mesmo pool [7].
Os SKUs disponíveis vão de F2 (2 CUs — para desenvolvimento e testes) até F2048 (2048 CUs — para workloads corporativos massivos). O F64 é geralmente o ponto de entrada para produção em PMEs; grandes enterprises começam em F128 ou acima.
💡 Dica de custo: Diferentemente do Azure, você pode pausar a capacidade Fabric fora do horário de uso. Uma F8 pausada à noite e nos fins de semana pode custar até 70% menos que mantê-la 24×7. Use Azure Logic Apps ou Power Automate para automatizar pause/resume.
Fabric vs. Azure Synapse: o que muda na prática
O Azure Synapse Analytics não está sendo descontinuado — mas o investimento da Microsoft claramente migrou para o Fabric. Para times que consideram a transição, as principais diferenças são:
- UX unificada: no Fabric, você alterna entre Spark, SQL e Power BI no mesmo portal sem abrir serviços separados.
- Faturamento simplificado: no Synapse, você paga separado por Spark pools, SQL pools, pipeline executions e ADLS. No Fabric, tudo consome do mesmo CU pool.
- OneLake vs. ADLS Gen2: no Synapse, você gerencia sua conta ADLS explicitamente. No Fabric, o OneLake é gerenciado pelo serviço — menos operação, menos risco de misconfiguration.
- Power BI integrado: no Synapse, Power BI é um serviço externo com integração limitada. No Fabric, Power BI é uma primeira classe — Direct Lake mode permite consultas em tempo real sem importação de dados.
Como começar: 5 passos práticos
- Trial gratuito: o Microsoft Fabric tem um trial de 60 dias com capacidade F64. Acesse via app.fabric.microsoft.com com uma conta Microsoft 365.
- Crie um Workspace: workspaces são o container de organização do Fabric. Crie um workspace por domínio de negócio (Vendas, Financeiro, RH) ou por estágio (Dev/Homolog/Prod).
- Implemente um Lakehouse simples: ingira um CSV via Data Factory → processe com um Notebook Spark → visualize com Power BI usando Direct Lake.
- Estude para o DP-600: a certificação "Implementing Analytics Solutions Using Microsoft Fabric" [6] é o caminho mais estruturado para aprender a plataforma completamente.
- Considere a migração gradual: se você tem pipelines no ADF ou workloads no Synapse, migre por domínio — não tente uma big bang migration.
💡 Takeaway para profissionais de dados: O Fabric não é só uma ferramenta — é uma mudança de paradigma na forma como times de dados se organizam. Engenheiros, analistas e cientistas de dados trabalham na mesma plataforma, com os mesmos dados, sem barreiras de integração. Quem dominar o Fabric agora terá vantagem competitiva significativa no ecossistema Microsoft nos próximos anos.
Referências
- Microsoft. What is Microsoft Fabric? Microsoft Learn, 2024. Disponível em: learn.microsoft.com
- Microsoft. OneLake, the OneDrive for data. Microsoft Tech Community, 2023. Disponível em: techcommunity.microsoft.com
- Armbrust, M. et al. Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics. CIDR 2021. Disponível em: cidrdb.org
- Microsoft. Announcing Microsoft Fabric general availability. Microsoft Blog, novembro 2023. Disponível em: azure.microsoft.com/blog
- Gartner. Magic Quadrant for Analytics and Business Intelligence Platforms 2024. Gartner Research, 2024. Disponível em: gartner.com
- Microsoft. DP-600: Implementing Analytics Solutions Using Microsoft Fabric. Microsoft Learn, 2024. Disponível em: learn.microsoft.com
- Microsoft. Microsoft Fabric Pricing — Fabric Capacity Units. Microsoft Azure Pricing, 2024. Disponível em: azure.microsoft.com/pricing
The problem Fabric came to solve
Before Fabric, a company using the Microsoft data ecosystem needed to integrate — and pay separately for — at least four products: Azure Data Factory (ingestion), Azure Synapse Analytics (transformation and SQL queries), Azure Data Lake Storage Gen2 (storage), and Power BI (visualization). Each product had its own authentication layer, its own pricing model, its own UX, and — worst of all — needed to be explicitly integrated with the next.
Fabric is not just a rebrand: it's a unified SaaS platform built on a new storage foundation called OneLake. All Fabric compute (Spark, SQL, Power BI, Real-Time Intelligence) reads and writes to the same OneLake without data movement between services [4].
OneLake: the OneDrive for enterprise data
OneLake is Fabric's architectural heart. Instead of multiple storage accounts spread across regions and subscriptions, OneLake provides a single hierarchical namespace per Microsoft 365 tenant — like OneDrive, but for enterprise data at petabyte scale [2].
- Native Delta Parquet format: all data is stored in Delta Parquet (the open format created by Databricks and adopted as the industry standard). External tools like Spark, Databricks, or DuckDB can read the data directly without export.
- Shortcuts: virtual references to data in other systems (Azure Data Lake, S3, GCS) that appear in OneLake without physically moving data. Eliminates copying data to integrate external sources.
- No internal egress: data transfers between Fabric services within the same tenant generate no network egress costs — a significant economic differentiator for high-frequency pipelines.
Fabric experiences: one product, seven workloads
Fabric organizes its services into "experiences" (workloads) accessible from the same portal:
- Data Engineering: Spark Notebooks (Python/Scala/R), Spark Job Definitions, and Lakehouses. Direct replacement for Azure Synapse Spark.
- Data Factory: low-code ingestion pipelines and connectors to 150+ sources.
- Data Warehouse: dedicated SQL analytics engine (full T-SQL), separate from Spark.
- Real-Time Intelligence: streaming data ingestion, KQL Database storage, and real-time dashboards.
- Power BI: fully integrated — reports, semantic models, and Direct Lake mode.
- Data Science: integrated MLflow, experiments, models, and notebooks with direct OneLake access.
- Data Activator: trigger alerts and automatic actions based on thresholds in streaming data or Power BI.
Medallion Architecture in Fabric: Bronze, Silver, and Gold
The Medallion architecture (Bronze/Silver/Gold layers) was popularized by Databricks [3] — but Fabric is the first Microsoft platform that supports it natively.
🔬 Practical Fabric implementation:
- Bronze (Raw): Ingestion Lakehouse. Data Factory copies raw data from the source system without transformations. Preserve the data as it arrived — it's your historical audit trail.
- Silver (Curated): Spark Notebook performs cleaning, typing, and validation on Bronze data. Applies business rules, removes duplicates, standardizes names. Result in Delta Parquet.
- Gold (Serving): Data Warehouse or Lakehouse with tables optimized for analytical consumption. Power BI semantic model points to the Gold layer — end users never touch Bronze or Silver.
Lakehouse vs. Warehouse: when to use each
Use Lakehouse when: the team has data engineers comfortable with Spark and Python; data is semi-structured or has variable schema; you need ML/AI processing on the data; or volume is too high for traditional SQL.
Use Warehouse when: the team is predominantly SQL analysts; data is structured with a stable schema; you want optimized query performance for BI without managing Spark; or you're migrating from SQL Server / Azure Synapse SQL Pool.
The good news: both share the same OneLake. You can create a Lakehouse for ingestion and processing and a Warehouse for serving — and they read the same data without copying.
Copilot in Fabric: AI as a data copilot
Copilot was integrated into Fabric in preview in 2024 and broadly available in 2025. The most mature implementations are in three areas:
- Data Engineering: PySpark code generation from natural language descriptions.
- Power BI: DAX measure generation, visual suggestions, and report creation from prompts.
- Data Warehouse: T-SQL autocomplete and generation with Warehouse schema context.
"The goal of Fabric is not to eliminate the data engineer — it's to eliminate the plumbing tasks that consume 60% of their time."
— Arun Ulag, Corporate VP of Product, Microsoft (Build 2024)
Cost model: Capacity Units and F SKUs
Fabric uses a shared capacity model. You buy Fabric Capacity measured in Capacity Units (CU), and all workloads (Spark, SQL, Power BI Premium) consume CU from the same pool [7]. SKUs range from F2 (2 CUs — for dev/test) to F2048 (for massive enterprise workloads).
💡 Cost tip: Unlike Azure resources, you can pause Fabric capacity outside business hours. An F8 paused at night and on weekends can cost up to 70% less than keeping it 24×7. Use Azure Logic Apps or Power Automate to automate pause/resume.
Fabric vs. Azure Synapse: what changes in practice
- Unified UX: in Fabric, you switch between Spark, SQL, and Power BI in the same portal without opening separate services.
- Simplified billing: in Synapse, you pay separately for Spark pools, SQL pools, pipeline executions, and ADLS. In Fabric, everything consumes from the same CU pool.
- OneLake vs. ADLS Gen2: in Synapse, you manage your ADLS account explicitly. In Fabric, OneLake is managed by the service — less operations, less misconfiguration risk.
- Power BI integrated natively: Direct Lake mode allows real-time queries without data import — a game changer for performance and freshness.
How to start: 5 practical steps
- Free trial: Microsoft Fabric has a 60-day trial with F64 capacity. Access via app.fabric.microsoft.com with a Microsoft 365 account.
- Create a Workspace: organize workspaces by business domain (Sales, Finance, HR) or by environment (Dev/Staging/Prod).
- Implement a simple Lakehouse: ingest a CSV via Data Factory → process with a Spark Notebook → visualize with Power BI using Direct Lake.
- Study for DP-600: the "Implementing Analytics Solutions Using Microsoft Fabric" certification [6] is the most structured path to learn the platform.
- Consider gradual migration: if you have ADF pipelines or Synapse workloads, migrate by domain — don't attempt a big bang migration.
💡 Takeaway for data professionals: Fabric is not just a tool — it's a paradigm shift in how data teams organize. Engineers, analysts, and data scientists work on the same platform, with the same data, without integration barriers. Those who master Fabric now will have significant competitive advantage in the Microsoft ecosystem in the coming years.
References
- Microsoft. What is Microsoft Fabric? Microsoft Learn, 2024. Available at: learn.microsoft.com
- Microsoft. OneLake, the OneDrive for data. Microsoft Tech Community, 2023. Available at: techcommunity.microsoft.com
- Armbrust, M. et al. Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics. CIDR 2021. Available at: cidrdb.org
- Microsoft. Announcing Microsoft Fabric general availability. Microsoft Blog, November 2023. Available at: azure.microsoft.com/blog
- Gartner. Magic Quadrant for Analytics and Business Intelligence Platforms 2024. Gartner Research, 2024. Available at: gartner.com
- Microsoft. DP-600: Implementing Analytics Solutions Using Microsoft Fabric. Microsoft Learn, 2024. Available at: learn.microsoft.com
- Microsoft. Microsoft Fabric Pricing — Fabric Capacity Units. Azure Pricing, 2024. Available at: azure.microsoft.com/pricing
El problema que Fabric vino a resolver
Antes de Fabric, una empresa usando el ecosistema Microsoft de datos necesitaba integrar — y pagar por separado — al menos cuatro productos: Azure Data Factory (ingestión), Azure Synapse Analytics (transformación), Azure Data Lake Storage Gen2 (almacenamiento) y Power BI (visualización). Cada producto tenía su propia autenticación, su propio modelo de precios y su propia UX.
Fabric no es solo un rebranding: es una plataforma SaaS unificada construida sobre un nuevo fundamento de almacenamiento llamado OneLake. Todo el cómputo de Fabric (Spark, SQL, Power BI, Inteligencia en Tiempo Real) lee y escribe en el mismo OneLake sin movimiento de datos entre servicios [4].
OneLake: el OneDrive para datos empresariales
OneLake es el corazón arquitectónico de Fabric. En lugar de múltiples cuentas de almacenamiento distribuidas en regiones y suscripciones, OneLake proporciona un único namespace jerárquico por tenant de Microsoft 365 [2]. Características clave: formato Delta Parquet nativo (herramientas externas como Spark, Databricks o DuckDB pueden leer los datos directamente), Shortcuts (referencias virtuales a datos en otros sistemas sin mover datos físicamente) y sin costos de egress entre servicios Fabric.
Las experiencias de Fabric: un producto, siete workloads
- Data Engineering: Notebooks Spark, Spark Job Definitions y Lakehouses.
- Data Factory: pipelines de ingestión low-code con 150+ conectores.
- Data Warehouse: motor SQL dedicado (T-SQL completo), separado de Spark.
- Real-Time Intelligence: ingestión de streaming, KQL Database y dashboards en tiempo real.
- Power BI: completamente integrado con modo Direct Lake.
- Data Science: MLflow integrado con acceso directo a OneLake.
- Data Activator: disparador de alertas basado en umbrales de datos.
Arquitectura Medallion en Fabric: Bronce, Plata y Oro
La arquitectura Medallion fue popularizada por Databricks [3] — pero Fabric es la primera plataforma Microsoft que la soporta nativamente.
🔬 Implementación práctica:
- Bronce (Raw): Data Factory copia datos brutos sin transformaciones. Es tu auditoría histórica.
- Plata (Curated): Notebook Spark realiza limpieza, tipado y validación. Aplica reglas de negocio y estandariza nombres.
- Oro (Serving): tablas optimizadas para consumo analítico. El semantic model de Power BI apunta a la capa Oro.
Lakehouse vs. Warehouse: cuándo usar cada uno
Usa Lakehouse cuando el equipo tiene ingenieros cómodos con Spark y Python, los datos son semi-estructurados, o necesitas procesamiento ML/AI. Usa Warehouse cuando el equipo es predominantemente analistas SQL, los datos son estructurados con esquema estable, o estás migrando desde SQL Server / Azure Synapse SQL Pool. Ambos comparten el mismo OneLake — pueden coexistir leyendo los mismos datos sin copia.
Copilot en Fabric: IA como copiloto de datos
Copilot genera código PySpark a partir de lenguaje natural en Data Engineering, medidas DAX y reportes completos en Power BI, y T-SQL con contexto del esquema en Data Warehouse.
"El objetivo de Fabric no es eliminar al ingeniero de datos — es eliminar las tareas de plomería que consumen el 60% de su tiempo."
— Arun Ulag, Corporate VP de Producto, Microsoft (Build 2024)
Modelo de costos: Capacity Units y F SKUs
Fabric usa un modelo de capacidad compartida. Compras Fabric Capacity medida en Capacity Units (CU) y todos los workloads consumen del mismo pool [7]. Los SKUs van de F2 (desarrollo/pruebas) a F2048 (workloads masivos).
💡 Tip de costos: Puedes pausar la capacidad Fabric fuera del horario de uso. Una F8 pausada por las noches y fines de semana puede costar hasta un 70% menos que mantenerla 24×7. Automatiza pause/resume con Azure Logic Apps o Power Automate.
Cómo empezar: 5 pasos prácticos
- Prueba gratuita: Microsoft Fabric ofrece 60 días de prueba con capacidad F64 en app.fabric.microsoft.com.
- Crea un Workspace: organiza por dominio de negocio (Ventas, Finanzas) o entorno (Dev/Staging/Prod).
- Implementa un Lakehouse simple: ingiere un CSV con Data Factory → procesa con Spark Notebook → visualiza con Power BI en modo Direct Lake.
- Estudia para el DP-600: la certificación [6] es el camino más estructurado para aprender la plataforma.
- Migra gradualmente: si tienes pipelines en ADF o workloads en Synapse, migra por dominio, no hagas una migración big bang.
💡 Conclusión para profesionales de datos: Fabric no es solo una herramienta — es un cambio de paradigma en cómo se organizan los equipos de datos. Ingenieros, analistas y científicos de datos trabajan en la misma plataforma, con los mismos datos, sin barreras de integración. Quienes dominen Fabric ahora tendrán ventaja competitiva significativa en el ecosistema Microsoft en los próximos años.
Referencias
- Microsoft. ¿Qué es Microsoft Fabric? Microsoft Learn, 2024. Disponible en: learn.microsoft.com
- Microsoft. OneLake, el OneDrive para datos. Microsoft Tech Community, 2023. Disponible en: techcommunity.microsoft.com
- Armbrust, M. et al. Lakehouse: A New Generation of Open Platforms. CIDR 2021. Disponible en: cidrdb.org
- Microsoft. Anunciando la disponibilidad general de Microsoft Fabric. Microsoft Blog, noviembre 2023. Disponible en: azure.microsoft.com/blog
- Gartner. Magic Quadrant para Plataformas de Análisis e Inteligencia de Negocio 2024. Gartner Research, 2024. Disponible en: gartner.com
- Microsoft. DP-600: Implementing Analytics Solutions Using Microsoft Fabric. Microsoft Learn, 2024. Disponible en: learn.microsoft.com
- Microsoft. Precios de Microsoft Fabric — Fabric Capacity Units. Azure Pricing, 2024. Disponible en: azure.microsoft.com/pricing