Un subconjunto específico de un almacén de datos con datos agregados y filtrados para departamentos o grupos de usuarios específicos, lo que permite realizar análisis específicos.
Un data mart es una base de datos curada que incluye un conjunto de tablas diseñadas para satisfacer las necesidades específicas de un único equipo de datos, comunidad o línea de negocio, como el departamento de marketing o el de ingeniería. Normalmente, es más pequeño y más enfocado que un almacén de datos y, por lo general, existe como un subconjunto del almacén de datos empresarial más grande de una organización. Los data marts se utilizan comúnmente para analítica, inteligencia de negocios y elaboración de informes. Los data marts fueron el primer paso evolutivo en la realidad física de los almacenes de datos centrales y los lagos de datos. ACNielsen ofreció a sus clientes el primer data mart a principios de la década de 1970 para proporcionarles una forma de almacenar información digitalmente e impulsar sus esfuerzos de ventas.
Hoy en día, existen tres tipos básicos de data marts:
Los almacenes de datos empresariales se crean con buenas intenciones para satisfacer todas las necesidades de gestión de datos de una empresa. Pero invariablemente, es imposible satisfacer a todos, ya que las distintas unidades de negocio tienen necesidades y objetivos de datos diferentes. Por ello, los departamentos copian y crean sus propios data marts (a veces con ayuda del equipo de TI empresarial) con el objetivo de ampliar un área temática concreta del almacén de datos, para así satisfacer sus necesidades de analítica de autoservicio y de informes departamentales. Como consecuencia, con el tiempo, los data marts pueden convertirse en silos de datos y copias de sombra de datos, desde una perspectiva empresarial, pero satisfacen bien las necesidades del departamento. Cuando muchos departamentos hacen esto, no existe una única versión de la verdad.
La arquitectura lakehouse resuelve los desafíos mencionados anteriormente, ya que reúne todos los almacenes de datos y data marts empresariales en una sola plataforma, con seguridad y gobernanza unificadas, al tiempo que ofrece a los diferentes equipos la flexibilidad de tener sus propios entornos aislados. Dado que cualquier data mart o “copia aumentada” se realiza en la misma plataforma lakehouse que todos los demás, el catálogo de datos del lakehouse lo detecta. Luego, gracias a las reglas de gobernanza de datos (como el etiquetado, el uso de un diccionario de datos, etc.), se garantiza que esa copia aumentada sea visible para todos, lo que previene la creación de copias duplicadas similares.
Suscríbete a nuestro blog y recibe las últimas publicaciones directamente en tu bandeja de entrada.