Conozca el esquema principal: estrella contra copo de nieve

El esquema multidimensional está diseñado para construir un modelo de sistemas de almacenamiento de datos.

El objetivo principal de estos esquemas es abordar las necesidades de bases de datos más grandes creadas con fines analíticos (OLAP).

Este método se utiliza para ordenar datos en la base de datos con una buena disposición de los contenidos en una base de datos. El esquema permite a los clientes hacer preguntas relacionadas con las tendencias comerciales o del mercado.

Además, un esquema multidimensional representa los datos en forma de cubos de datos que permiten ver y modelar datos desde diferentes perspectivas y dimensiones.

Es de tres tipos, pero muchos la confunden entre estrella y copo de nieve. Por lo tanto, les resulta difícil elegir el modelo preferible.

Si usted es uno de ellos, analicemos las diferencias entre el esquema de estrella y copo de nieve, comenzando con la definición y comprendiendo sus beneficios, desafíos, diagrama y características.

¿Qué es un esquema multidimensional?

El esquema se refiere a la descripción lógica de una base de datos completa y data marts. Incluye el nombre de los registros y sus descripciones, incluidos los agregados y los elementos de datos asociados.

Una base de datos generalmente usa un modelo relacional para describir, mientras que un sistema de almacenamiento de datos usa un modelo de esquema.

El esquema multidimensional se puede definir con el lenguaje de consulta de minería de datos (DMQL).

Para definir los data marts y los data warehouses, utiliza dos primitivas: definición de dimensión y definición de cubo.

El esquema multidimensional utiliza diferentes tipos de modelos de esquema. Están:

  • esquema de estrella
  • esquema de copo de nieve
  • esquema de la galaxia

Analicemos qué son los esquemas de estrella y copo de nieve.

Estrella contra copo de nieve: ¿Qué son?

¿Qué es el esquema de estrella?

Un esquema en estrella es un modelo de inteligencia empresarial y almacenamiento de datos arquitectónicos que requiere una sola tabla de hechos para almacenar datos medidos y transaccionales. También utiliza diferentes tablas dimensionales más pequeñas para contener atributos sobre datos comerciales.

Se nombra según su estructura. Como una estrella, la tabla de hechos toma su lugar en el centro del diagrama, y ​​las tablas dimensionales pequeñas se sientan como ramas en la mesa central para formar una estructura similar a una estrella.

Cada esquema en estrella consta de una sola tabla de hechos pero de varias tablas de dimensiones pequeñas. Las tablas de hechos incluyen datos específicos y medibles que deben analizarse, como el rendimiento registrado, los datos financieros o los registros de ventas. Puede ser un complemento de datos históricos a la vez o transaccional.

Además, el esquema Star es el más simple y fundamental entre los esquemas de data warehouse y data mart. Es eficiente en el manejo de consultas básicas. El esquema en estrella generalmente admite inteligencia comercial, consultas ad hoc, aplicaciones analíticas y cubos de procesamiento analítico en línea.

El esquema en estrella también admite recuento, promedio, suma y otras agregaciones de muchos registros. Los usuarios pueden filtrar y agrupar fácilmente las agregaciones por dimensiones. Por ejemplo, los usuarios generan consultas como «buscar todos los registros de ventas en junio» o «analizar los ingresos totales de la oficina XYZ en 2022».

¿Qué es el esquema de copo de nieve?

Un esquema de copo de nieve es un modelo de datos multidimensional que también se puede conocer como la extensión del esquema de estrella. Esto se debe a que las tablas de dimensiones del esquema de copo de nieve se dividen en subdimensiones.

Un esquema es un copo de nieve si una o más tablas de dimensiones no se vinculan directamente con la tabla de hechos sino que se conectan a través de otras tablas de dimensiones.

La formación de copos de nieve es un fenómeno que normaliza las tablas de dimensiones en un esquema de estrella. Cuando normaliza todas las tablas de dimensiones, la estructura resultante se asemeja a un copo de nieve que contiene una tabla de hechos en el medio de la estructura.

En palabras sencillas, el esquema de copo de nieve consta de una tabla de hechos en el medio del modelo, que está conectada a tablas de dimensiones, que a su vez están vinculadas a otras tablas de dimensiones. Este esquema se utiliza para mejorar el rendimiento de las consultas.

El modelo se crea para consultas rápidas y flexibles a través de relaciones y dimensiones complejas. Es útil para relaciones de uno a muchos y de muchos a muchos entre varios niveles de dimensiones.

Debido a la adherencia más estricta a más estándares de normalización, obtendrá una mayor eficiencia de almacenamiento. Sin embargo, la redundancia de datos es insignificante y el rendimiento es bajo en comparación con los modelos de datos desnormalizados como el esquema en estrella.

Estrella contra copo de nieve: ¿cómo funcionan?

¿Cómo funciona un esquema en estrella?

La tabla de hechos en el medio del modelo estrella almacena dos tipos de información: valores de atributos numéricos y de dimensión. Entendámoslos con un ejemplo de una base de datos de ventas.

  • Los valores numéricos son únicos para cada fila y punto de datos. Esto no se correlaciona ni se relaciona con los datos almacenados en otra fila. Estos son datos sobre una transacción determinada, como el monto total, la cantidad del pedido, la hora exacta, la ganancia neta, el ID del pedido, etc.
  • Los valores de atributos dimensionales no almacenan ningún dato directamente, sino que almacenan valores de clave externa para la fila en una tabla dimensional. Las diferentes filas de la tabla central harán referencia a esta información, como el valor de los datos, la identificación del empleado de ventas, la identificación de la sucursal, la identificación del producto, etc.

Las tablas de dimensiones siempre almacenan información de apoyo de la tabla de hechos. Cada tabla dimensional se relaciona con la columna de una tabla de hechos junto con un valor dimensional y almacena datos adicionales sobre ese valor.

Ejemplo: la tabla de dimensiones de empleados utiliza el ID de empleado como valor clave y también contiene información, como el nombre, el sexo, la dirección y el número de teléfono. De manera similar, una tabla de dimensiones del producto almacena información, incluido el nombre del producto, el color, la primera fecha de comercialización, el costo de fabricación, etc.

¿Cómo funciona un esquema de copo de nieve?

Piense en un diseño de copo de nieve con un cuadro central y diferentes conexiones a través de ese cuadro a diferentes puntos. Para mantener data marts y data warehouses, el diseño del esquema de copo de nieve entra en escena.

Es similar al esquema de estrella pero con cambios mínimos. A diferencia del esquema de estrella, el esquema de copo de nieve amplía sus tablas de subdimensiones, que están vinculadas a tablas de dimensiones.

El propósito principal de este modelo es normalizar la información desnormalizada del modelo de estrella. De esta forma, puede resolver problemas comunes asociados con un esquema en estrella.

En el núcleo del esquema, encontrará una tabla de hechos que se vincula con la información contenida en las tablas de dimensiones. Estas tablas nuevamente irradian hacia el exterior a las tablas de subdimensiones que tienen información detallada que describe la información de la tabla de dimensiones.

Ejemplo: El esquema de copo de nieve contiene una tabla de hechos de ventas y tablas de dimensión de ubicación, línea, familia, producto y tiempo de la tienda. Las dimensiones del mercado constan de dos tablas de dimensiones, con la tienda como tabla de dimensiones principal y la ubicación de la tienda como tabla de subdimensiones. La dimensión de producto tiene tres tablas de subdimensión que mencionan una tabla de subdimensión de producto, línea y familia.

Estrella contra copo de nieve: características

Características del esquema de estrella

  • El esquema en estrella puede filtrar datos de datos normalizados para satisfacer las necesidades de almacenamiento de datos. La clave única se genera a partir de la información asociada a cada tabla de hechos para identificar cada fila.
  • Proporciona cálculos y agregaciones rápidos, como los ingresos obtenidos y el total de artículos vendidos al final de cada mes. Estos detalles se pueden filtrar según las necesidades enmarcando las consultas adecuadas.
  • Es la medida de eventos que incluye valores numéricos finitos que consisten en la clave foránea. Estas claves están relacionadas con las tablas de dimensiones. Hay varios tipos de tablas de hechos que se enmarcan con valores a nivel atómico.
  • La tabla de hechos de transacciones contiene datos sobre eventos específicos, como ventas y días festivos.
  • Los hechos de registro incluyen períodos dados como información de cuenta al final del año o cada trimestre.
  • La tabla dimensional proporciona datos detallados sobre los atributos o registros que se encuentran en la tabla central.
  • El usuario es capaz de diseñar una mesa de acuerdo a sus necesidades.
  • Puede utilizar el esquema en estrella para acumular tablas de instantáneas.

Características del esquema de copo de nieve

  • El esquema de copo de nieve necesita poco espacio en disco.
  • Este modelo es fácil de implementar debido a sus tablas de dimensiones separadas y principales.
  • Las tablas de dimensiones contienen al menos dos atributos para definir información en múltiples granos.
  • Debido a las múltiples tablas, el rendimiento es bajo en comparación con el esquema en estrella.
  • El esquema de copo de nieve tiene el nivel de integridad de datos más alto y bajas redundancias debido a la normalización.

Estrella vs. Copo de nieve: Ventajas

Ventajas del esquema en estrella

  • El esquema en estrella es la forma más sencilla entre los esquemas de data mart.
  • Tiene una lógica de informes simple. Esta lógica está implícita dinámicamente.
  • Está diseñado utilizando cubos de alimentación aplicados a través del proceso de transacción en línea para que los cubos funcionen de manera eficiente y eficaz.
  • El esquema en estrella se forma con una lógica simple y consultas que son fáciles de extraer del proceso transaccional.
  • Ofrece un rendimiento mejorado para las aplicaciones de generación de informes.
  • Se implementa para controlar la recuperación rápida de datos.
  • La información filtrada y seleccionada se puede aplicar fácilmente en diferentes casos.

Ventajas del esquema de copo de nieve

  • El esquema en estrella se utiliza para desarrollar el rendimiento de las consultas debido a los menores requisitos de almacenamiento en disco.
  • Ofrece mayor escalabilidad en las relaciones entre componentes y niveles de dimensión.
  • Es más fácil de mantener.
  • El esquema en estrella ofrece una rápida recuperación de datos.
  • Es un esquema de datos simple y común para el almacenamiento de datos.
  • Ayuda a mejorar la calidad de los datos.
  • Los datos estructurados reducen el problema de la integridad de los datos.

Estrella contra copo de nieve: limitaciones

Limitaciones del esquema en estrella

Tiene un alto estado de desnormalización e integridad. Todo el proceso colapsará si el usuario no actualiza los datos. La seguridad y las protecciones también son limitadas. Además, el esquema en estrella no es tan flexible como el modelo analítico. No ofrece un apoyo eficiente a varias relaciones.

Limitaciones del esquema de copo de nieve

La principal limitación que encontrarás con Snowflake son los esfuerzos de mantenimiento adicionales debido al creciente número de tablas de pequeñas dimensiones. Muchas consultas complejas dificultan la búsqueda de los datos necesarios. Además, el tiempo de implementación de la pregunta es alto debido a tablas más altas. Este modelo también es rígido y requiere mayores costos de mantenimiento.

Estrella contra copo de nieve: diferencias

Star y Snowflake son tipos de esquema multidimensional pero tienen diferentes estructuras y propiedades. El primero es como una estrella, y el segundo se asemeja a un copo de nieve, definiendo sus nombres.

En el esquema en estrella, solo una única unión crea una relación entre la tabla de hechos central y las tablas de dimensiones laterales. Por otro lado, en el esquema de copo de nieve, se necesitan múltiples uniones para vincular tablas de dimensiones.

El esquema de estrella generalmente se usa cuando tiene menos filas en la tabla de dimensiones, mientras que el esquema de copo de nieve se usa cuando una tabla de dimensiones es relativamente grande.

El siguiente diagrama diferencia los dos modelos y cómo las tablas de dimensiones y la tabla de hechos están vinculadas en diferentes esquemas.

ParámetrosEsquema de estrellaEsquema de copo de nieveEspacio en discoEl esquema de estrella usa más espacio en disco.El esquema de copo de nieve usa menos espacio en disco.Redundancia de datosTiene alta redundancia de datos.Tiene baja redundancia de datos.NormalizaciónLas tablas de dimensiones están desnormalizadas, lo que significa repetir el mismo valor dentro de la tabla.Las tablas de dimensiones son completamente normalizado.Rendimiento de consultasSe necesita un tiempo mínimo para ejecutar las consultas, lo que resulta en un mejor rendimiento.La ejecución de consultas lleva más tiempo que el esquema en estrella, lo que hace que tenga menos rendimiento que el esquema en estrella.Complejidad de la consultaLa complejidad de la consulta es baja.La complejidad de la consulta es mayor que el esquema en estrella. Mantenimiento Debido a la alta redundancia de datos, mantener el esquema en estrella es un poco difícil. Debido a la baja redundancia de datos, es fácil de mantener y cambiar el esquema de copo de nieve. existen copias en las tablas de dimensiones. La integridad de los datos es baja, ya que normaliza completamente las tablas de dimensiones. Jerarquías Las jerarquías para las tablas de dimensiones en el esquema de estrella se almacenan en la tabla de dimensiones. Las jerarquías se dividen en tablas de dimensiones separadas. Diseño de base de datos Tiene un diseño de base de datos simple. Tiene un diseño de base de datos muy complejo. La tabla de hechos está rodeada de tablas de dimensiones que también están rodeadas de tablas de subdimensiones. Configuración El esquema de estrella es fácil de diseñar y configurar, ya que las relaciones directas los representan. Por otro lado, el esquema de copo de nieve es un poco complejo de configurar. Procesamiento de cubos El procesamiento de cubos es más rápido. Debido a la combinación compleja, el procesamiento de cubos es un poco lento. Claves externas Tiene una cantidad mínima de claves externas. Tiene la cantidad máxima de claves externas.

Conclusión

Tanto los esquemas de estrella como los de copo de nieve son útiles en diferentes sectores. Entonces, decidir cuál es mejor entre ellos se basa en sus requisitos.

El esquema de copo de nieve es la extensión del esquema de estrella, donde normaliza las tablas de dimensiones en el esquema de estrella.

El esquema en estrella tiene un diseño simple, ejecuta consultas más rápido y la configuración es sencilla. Por otro lado, el esquema de copo de nieve es más fácil de mantener, ocupa menos espacio en disco y es menos propenso a problemas de integridad de datos.

Por lo tanto, un esquema en estrella podría ser la mejor opción si necesita un diseño simple, menos claves externas y un procesamiento de cubo más rápido. Pero, si necesita menos espacio en disco, poca integridad de datos y poco mantenimiento, el esquema de copo de nieve puede ser más adecuado.

También puede explorar algunas de las mejores soluciones de bases de datos de gráficos.