Ir al contenido principal

La cardinalidad de una base de datos: beneficios e importancia

La cardinalidad de una base de datos te ayuda a comprender tus datos. Descubre más sobre su uso y beneficios. ¡Ejemplos de cardinalidad y más aquí!

Las bases de datos son esenciales para el mundo actual. Todas las empresas de todos los sectores pueden beneficiarse de los recursos informáticos, y esos recursos a menudo se construyen sobre las bases de datos. Si manejas cualquier tipo de transacción, necesitas crear un libro para estar al día, lo que se incluye en el mundo de las bases de datos.

Si deseas comprender las herramientas que gestionan el seguimiento de datos (por no hablar de los análisis que pueden surgir), ese recorrido comienza con una comprensión de la cardinalidad de la base de datos.

¿Qué es la cardinalidad en las bases de datos?

Para definir la cardinalidad, es importante darse cuenta de que, al final, las bases de datos son esencialmente hojas de cálculo. Por supuesto, pueden ser masivas en términos de puntos de datos y complejidad, pero son solo grandes libros de datos.

Dicho esto, la cardinalidad es una forma de comparar el número de filas en la hoja con el número de columnas. Específicamente en lo que respecta a las bases de datos, la cardinalidad suele ser una medida de cuántos valores distintos tienes en una columna en comparación con el número de filas.

Vamos a detenernos y observar que esto es diferente de la cardinalidad en la ciencia de datos. La definición científica a menudo implica conjuntos infinitos, columnas infinitas numerables, conjuntos incontables y otros conceptos superiores que a menudo incluyen "conjuntos infinitos" en la descripción.

Esto puede sonar extrañamente específico y difícilmente útil, pero si tienes en cuenta el concepto de comparar filas y columnas, las explicaciones adicionales de cardinalidad y sus usos lo aclararán todo.

El primer ápice de claridad proviene de la idea de cardinalidad alta y baja. Si una tabla tiene un gran número de elementos en relación con el número de filas en la columna de la base de datos, tiene una alta cardinalidad. También puede darse una cardinalidad baja, lo que sugiere que muchos valores se repiten.

La comparación de cardinalidad alta y baja puede ayudarte a calcular la varianza y a pensar en la calidad de una columna de un vistazo. Veamos un ejemplo sencillo.

Digamos que estás tramitando el pago de sueldos. Tu tabla de datos tendrá un identificador único para cada empleado (normalmente un nombre o número de identificación fiscal). Es muy probable que veas las horas trabajadas, la tarifa de pago y el total adeudado. La lista de nombres tendrá una cardinalidad alta, mientras que la tasa de pago por hora tendrá a menudo una cardinalidad baja. Eso te da una idea de qué tipo de datos están presentes en cada columna.

Esperamos que este ejemplo te dé una mejor idea de qué es la cardinalidad.

¿Por qué es beneficiosa la cardinalidad en una base de datos?

En última instancia, el valor de cardinalidad en una base de datos no es realmente para la persona que ve los datos. Más bien el valor recae en las búsquedas y consultas.

Si deseas encontrar un punto de datos específico en tu base de datos, necesitas que el sistema informático lo ejecute por ti, pero en una base de datos personalizada, alguien tiene que crear esa función de búsqueda. El ordenador utiliza la cardinalidad para averiguar si existen o no varias respuestas posibles (o la probabilidad de que existan). Esto puede ayudar a crear resultados de búsqueda y jerarquías.

Eso significa que cardinalidad alta y baja son conceptos que los desarrolladores utilizan para diseñar sistemas de consulta eficaces.

También puedes pensar en cómo contribuye esto al análisis de datos. Los sistemas informáticos deben ser capaces de distinguir valores que puedan tener entradas idénticas, y la cardinalidad puede ayudar a un desarrollador a codificar esas restricciones.

Tipos de cardinalidades

Hasta ahora, hemos hablado de cardinalidad alta y baja en las bases de datos, pero el concepto también implica un nivel más profundo. Puedes tener cardinalidad en el modelado de datos.

Esto va de la mano de la cardinalidad que ya hemos explicado. Sigue comparando los valores únicos en columnas con el número de filas.

Pero, cuando consideras el modelado de datos, hay algunas clasificaciones de cardinalidad más que cobran importancia. Suelen dividirse en cardinalidades uno a uno, uno a muchos y muchos a muchos.

Uno a uno

La correspondencia uno a uno suele ser menos común en las bases de datos modernas, pero surgen, y es importante entender cómo funcionan.

A nivel teórico, el nombre lo dice todo. Para cualquier elemento de una columna, hay exactamente un elemento relacionado en otra columna. Esa relación es bidireccional.

Esto no significa que las columnas tengan el mismo tamaño. Una columna puede mantener una correspondencia uno a uno incluso si algunos elementos no tienen pareja. Fijarse en el número de elementos en cada columna no revelará esta relación.

Piensa en el siguiente ejemplo.

Digamos que una gran empresa tiene miles de empleados, y cada empleado necesita un correo electrónico comercial. Si vas a realizar un seguimiento de esto en una base de datos, necesitarás un nombre único para cada empleado (a menudo utilizando un número de identificación) y su dirección de correo electrónico única en el libro mayor. Cada nombre está relacionado con un correo electrónico y viceversa.

Uno a muchos

Ahora que conoces el significado de cardinalidad y tienes una idea de qué es una relación uno a uno, el concepto de uno a muchos será fácil de entender.

En este caso, tienes una columna con entradas únicas (columna A). Cada entrada puede estar relacionada con varias entradas en otra columna (columna B). Como tal, cualquier elemento en la columna A puede enlazar a varios elementos en la B, pero cada elemento en la B solo enlazará a una cosa en la A.

Un ejemplo fácil de entender sería hacer coincidir a los representantes de ventas con sus clientes. Cada representante puede tener docenas de clientes, pero para mantener las relaciones estables, cada cliente solo tiene un representante de ventas. Es una relación de uno a muchos.

Muchos a muchos

Por último, vamos a explicar la relación de muchos a muchos. Cualquier elemento en la columna A puede tener varios pares en la columna B; y al revés también es cierto.

El ejemplo de los representantes de ventas puede servirnos para ilustrar las relaciones de muchos a muchos también.

¿Qué pasa si la empresa es un fabricante de microchips con miles de clientes multibillonarios? Es muy probable que esa empresa tenga equipos de ventas bien definidos, y que cada equipo se encargue de unos cuantos clientes. En este caso, cualquier cliente tiene varios representantes individuales, y cada agente puede trabajar en un par de contratos diferentes.

Esta es la idea de una relación de muchos a muchos.

Ejemplos de cardinalidad

En las secciones anteriores, aprendiste los diferentes tipos de aritmética cardinal y de relaciones con algunos ejemplos simplificados del modelo entidad relación de una base de datos. Ahora trataremos algunas aplicaciones reales de cardinalidad para ver exactamente cómo puede funcionar en una base de datos.

Uber

Pongamos que diseñamos nuestra propia base de datos para Uber.

Es una empresa conocida con un modelo conocido, pero, por si no estás familiarizado, así es como funciona. Uber es una aplicación móvil para smartphone. Puedes abrir la aplicación y solicitar un viaje desde tu ubicación actual a cualquier otro lugar. La aplicación te pone en contacto con un conductor, te asigna la tarifa, calcula la ruta por navegación y se encarga de toda la logística. Tu chófer aparecerá, te llevará adonde quieras ir y pagarás el viaje a través de la aplicación móvil.

Para una aplicación tan grande y complicada, las bases de datos construidas a partir de datos de intención son definitivamente las más adecuadas, y una que es fácil de imaginar es una base de datos que hace un seguimiento de los clientes y los conductores. En este caso, cada pareja conductor-cliente necesita un identificador único.

Eso significa que nuestra columna conductor (D) y nuestra columna de cliente (C) tienen una cardinalidad alta (de hecho, tienen una cardinalidad infinita). Cada elemento de cada columna es único.

También podemos pensar en las relaciones entre las columnas. De un vistazo, puede parecer que cualquier chófer puede tener varios pasajeros y viceversa, pero en realidad tenemos relaciones uno a uno para una transacción. Un conductor solo puede tener un cliente a la vez, incluso si el cliente es técnicamente un grupo de personas, solo habrá un identificador de cliente en la transacción. Necesitamos una base de datos individualizada para hacer coincidir a los clientes y los conductores de cualquier transacción individual.

Amazon

Si alguna empresa del mundo utiliza bases de datos, es Amazon. Para este ejemplo, consideremos la tienda en línea de Amazon. Hay muchos comercios que tienen tiendas en el sitio web, y hay miles de millones de personas que compran a través de Amazon.

Una vez más, cada tienda y cada comprador necesita un identificador único para gestionar cada transacción. Sin embargo, este caso es más complicado que el ejemplo de Uber.

Cuando compras en Amazon, puedes comprar cosas en varios comercios, todo en la misma transacción. Amazon gestiona la logística, por lo que no necesitas saber si tus artículos tienen origen en diferentes lugares. Para ti es una sola transacción.

Por su parte, los comercios también pueden vender a varios usuarios simultáneamente, pero cada transacción será solo con un usuario.

En este caso, tenemos una relación de uno a muchos. Puedes comprar en varios comercios, pero cada comercio solo te vende en esa transacción en particular.

Mejora el modelado de datos con cardinalidad

Ahora que sabes más sobre la cardinalidad de los datos y cómo funciona con las bases de datos y el modelado de datos, el siguiente paso es sumergirte en ellas y explorar herramientas que puedan mejorar tu comprensión y permitirte trabajar directamente con las bases de datos.

Los informes de Mailchimp facilitan la evaluación de los datos y el análisis de la cardinalidad con un panel de control de fácil lectura. Prueba Mailchimp hoy mismo.

Comparte este artículo