Cuando dos de las herramientas más utilizadas en la analítica moderna, Fivetran (para la ingesta) y dbt Labs (para la transformación), deciden fusionarse, es algo más que una noticia del sector. Para las pequeñas y medianas empresas, plantea cuestiones importantes sobre cómo construir pilas de datos escalables, mantenibles y rentables.
¿Qué partes de tu pila son ahora redundantes? ¿Qué áreas se vuelven más eficientes, o más arriesgadas? ¿Y cómo deben pensar los equipos en su próximo movimiento en un panorama posterior a la fusión?
Lo que ocurrió
El 13 de octubre de 2025, Fivetran anunció una fusión por acciones con dbt Labs, uniendo dos de los componentes más populares de la pila de datos moderna. Se prevé que la empresa combinada alcance aproximadamente 600 millones de dólares de ingresos recurrentes anuales y funcionará bajo una estructura de liderazgo conjunta: George Fraser (Fivetran) como Consejero Delegado y Tristan Handy (dbt) como Presidente.
Las empresas describen su visión compartida como “infraestructura de datos abierta”, un ecosistema unificado que simplifica el movimiento, la transformación y la activación de datos sin encerrar a los usuarios en un único motor de cálculo. dbt Core seguirá siendo de código abierto, preservando la flexibilidad y las contribuciones de la comunidad, mientras que ambas plataformas seguirán funcionando de forma independiente hasta que se cierre oficialmente el acuerdo.
Dos factores principales impulsaron esta fusión:
- Presión de consolidación. Las empresas demandan flujos de trabajo de datos simplificados, de extremo a extremo, con menos puntos de integración y menos mantenimiento.
- Preparación para la IA. Las canalizaciones fiables y de baja latencia se están convirtiendo en una misión crítica a medida que las organizaciones tratan de hacer operativas la IA y la analítica.
La fusión también refleja un cambio más amplio en el mercado de herramientas de datos. A medida que se ha intensificado la competencia, con la expansión de las plataformas lakehouse y el auge de las herramientas de código abierto, Fivetran y dbt han decidido reforzar su posición uniéndose. Se trata de una decisión estratégica que consolida a dos líderes de su categoría en una oferta única y más completa, diseñada para ocupar un lugar intermedio en un ecosistema cada vez más saturado.
Qué significa esto para los equipos de datos en crecimiento
La fusión promete eficacia y simplificación. Una integración más estrecha podría reducir la necesidad de “código pegamento” y de orquestación manual entre las capas de ingestión y transformación. Pero hay que tener en cuenta algunas ventajas y desventajas.
Ventajas potenciales | Posibles inconvenientes |
Flujo de datos sin fisuras entre la ingesta y la transformación | Mayor dependencia del proveedor y consolidación del control |
Menos gastos operativos y aplicación más rápida | Menor flexibilidad para flujos de trabajo únicos o complejos |
Percepciones más rápidas para casos de uso estándar | Posible despriorización de funciones avanzadas o personalizadas |
Por ejemplo, un equipo pequeño que actualmente utiliza Fivetran para EL, dbt para T y Airflow para coordinar las dependencias podría ver cómo se reduce esa capa intermedia. La ruta de ingesta a transformación podría convertirse en casi plug-and-play, liberando tiempo para centrarse en el modelado y el análisis, en lugar de en el mantenimiento de la canalización. Sin embargo, la orquestación personalizada (como disparadores multidominio o cargas de trabajo mixtas) seguirá requiriendo herramientas como Airflow o Dagster.
¿Deberían los equipos seguir escribiendo DAGs de extremo a extremo?
La respuesta corta: sólo cuando añaden valor real.
La fusión Fivetran-dbt no elimina la necesidad de orquestación, pero sí cambia cuándo y por qué es necesaria. He aquí cómo se comparan los principales enfoques:
1. Pila gestionada (Fivetran + dbt Cloud)
Lo mejor para: Equipos Lean que priorizan la velocidad y la simplicidad.
- Ventajas: Configuración rápida, mantenimiento mínimo, gran fiabilidad.
- Contras: Menos flexibilidad para la lógica personalizada o la orquestación entre sistemas.
2. Pila modular / abierta (Airbyte + dbt Core + Airflow/Dagster)
Lo mejor para: Equipos que necesitan control, flexibilidad de costes o integraciones híbridas.
- Ventajas: Alta configurabilidad, ecosistema abierto, sin dependencia de un único proveedor.
- Contras: Requiere más montaje y mayores gastos operativos.
3. Pila Lakehouse-Nativa (Databricks DLT, pipelines Snowflake)
Lo mejor para: Empresas que ya han invertido en una plataforma unificada.
- Ventajas: Gobernanza simplificada, flujos de trabajo integrados, menos piezas móviles.
- Contras: Dependencia de la plataforma y portabilidad limitada.
Principio rector: Si un equipo pasa más tiempo manteniendo canalizaciones que creando valor a partir de los datos, es hora de simplificar.
Cómo cambia esto la industria
Es probable que esta fusión provoque efectos dominó en todo el ecosistema de datos:
- Las herramientas EL de código abierto (como Airbyte) duplicarán la flexibilidad y la transparencia de costes.
- Los proveedores de ETL de extremo a extremo (como Matillion o Stitch) se posicionarán en torno a la simplicidad y la comodidad de una sola plataforma.
- Las plataformas de Lakehouse (Databricks, Snowflake) seguirán incluyendo más funciones nativas de canalización, lo que creará competencia para los proveedores independientes de ELT.
Esta tendencia de consolidación refleja otras en la pila tecnológica: una vez que la integración se hace sin esfuerzo, el siguiente diferenciador es la gobernanza, la integración de la IA y la eficiencia de costes.
Para otros actores del ecosistema, la fusión eleva el listón de la integración y la exhaustividad. Los proveedores de la competencia pueden responder especializándose más, consolidándose o replanteándose los precios y la interoperabilidad para seguir siendo competitivos. El resultado es probablemente un periodo de renovada atención a la eficiencia y la claridad del valor en toda la pila de datos.
Elegir el patrón de pila adecuado
En función del tamaño del equipo, la madurez de los datos y la tolerancia al riesgo, la mayoría de las empresas se encuadran en uno de los tres arquetipos de pila:
A. ELT gestionado / “sin operaciones”
Lo mejor para: Equipos pequeños y startups que se mueven con rapidez.
- Pila: Fivetran → dbt Cloud → Snowflake/BigQuery/Databricks
- Ventajas: Más fácil de implantar y mantener.
- Contras: Depende del proveedor y tiene un coste más elevado a escala.
B. Modular / Código abierto
Lo mejor para: Equipos que buscan flexibilidad o entornos de datos mixtos.
- Pila: Airbyte (EL) → dbt Core (T) → Airflow/Dagster (Orquestación)
- Ventajas: Ecosistema abierto, personalizable.
- Contras: Requiere recursos de ingeniería para su configuración y mantenimiento.
C. Plataforma-Nativa / Lakehouse
Lo mejor para: Equipos que ya utilizan Databricks o Snowflake como entorno principal.
- Pila: Ingestión nativa + transformación (p. ej., canalizaciones DLT o Snowflake)
- Ventajas: Gobierno unificado y automatización.
- Contras: Menos flexibilidad fuera del ecosistema de la plataforma.
Algunas empresas adoptan modelos híbridos, combinando herramientas gestionadas para cargas de trabajo estándar y orquestación de código abierto para trabajos complejos o especializados.
Una sencilla lista de control para la evaluación
Para determinar qué enfoque se adapta mejor, evalúa lo siguiente:
- Capacidad del equipo: ¿Tienes ancho de banda de ingeniería para mantener los DAG y los pipelines?
- Gravedad de los datos: ¿Dónde viven actualmente la mayoría de tus datos, en un almacén, en un lago o en un sistema híbrido?
- Velocidad de cambio: ¿Con qué frecuencia evolucionan tus fuentes y transformaciones?
- Necesidades de cumplimiento: ¿Son el linaje y la gobernanza las principales prioridades?
- Tolerancia al bloqueo: ¿Hasta qué punto es crítica la flexibilidad de la herramienta para tu hoja de ruta?
Si tus respuestas se inclinan hacia la velocidad, la estandarización y el mantenimiento mínimo, una pila ELT gestionada te proporcionará probablemente el mejor ROI. Si la flexibilidad y el control ocupan un lugar más importante, una configuración abierta o nativa puede ser una mejor inversión a largo plazo.
Para concluir
Para la mayoría de las pequeñas y medianas empresas, la fusión de Fivetran + dbt representa una buena noticia: un camino más rápido hacia una analítica fiable y escalable sin sobrecargar a los equipos internos. Pero no hay una única pila que se adapte a todas las situaciones.
Algunas organizaciones se benefician más de una pila ELT gestionada y lista para usar, mientras que otras necesitan arquitecturas abiertas o nativas de la plataforma para soportar integraciones complejas o modelos de gobernanza. La clave está en equilibrar simplicidad y sostenibilidad.
Distillery ayuda a los equipos a diseñar y optimizar ecosistemas de datos modernos, ya se trate de poner en marcha una implementación ligera de Fivetran + dbt, modernizar canalizaciones de código abierto o crear patrones nativos de Lakehouse en Databricks o Snowflake.
A medida que los proveedores de datos continúan consolidándose, es importante que las empresas evalúen cómo estos cambios podrían afectar a la flexibilidad, escalabilidad y planificación presupuestaria a largo plazo. Distillery ayuda a los equipos a anticiparse a estos cambios, diseñando arquitecturas de datos que funcionen con eficacia hoy, sin dejar de ser adaptables a lo que venga después.
¿Listo para evaluar tu próximo movimiento de pila?
Los expertos en datos de Distillery pueden ayudarte a evaluar tu arquitectura actual, modelar opciones para el futuro y crear una hoja de ruta que se ajuste a los objetivos, la escala y el presupuesto de tu equipo. ¿Listo para modernizar tu pila de datos? Ponte en contacto con nuestro equipo.