Diferencia entre distribución condicional y marginal (explicada): todas las diferencias

La probabilidad es una rama de las matemáticas que cuantifica la predicción de que ocurra un determinado evento para un conjunto de datos dado. Da interpretación matemática a la probabilidad de obtener el resultado deseado.

La probabilidad de que ocurra cualquier evento se encuentra entre cero y uno. Cero denota que no hay posibilidades o probabilidad de que ocurra ese evento, y uno representa que la probabilidad de que ocurra cierto evento es del 100%.

El estudio de la probabilidad nos permite predecir o juzgar las posibilidades de éxito o fracaso de cualquier evento deseado y tomar medidas para mejorarlo.

Por ejemplo, al probar un nuevo producto, una alta probabilidad de falla significa un producto de baja calidad. Cuantificar las posibilidades de fracaso o éxito puede ayudar a los fabricantes a mejorar la calidad y la experiencia de sus productos.

En el análisis de datos, las distribuciones marginales y condicionales se utilizan para encontrar la probabilidad en datos bivariados. Pero antes de entrar en eso, repasemos algunos conceptos básicos.

Conceptos básicos de probabilidad

Un término de uso frecuente en probabilidad es ‘variable aleatoria’. Una variable aleatoria se utiliza para cuantificar los resultados de un evento aleatorio que tiene lugar.

Por ejemplo, una escuela realiza una investigación para predecir el rendimiento de sus alumnos en Matemáticas en los próximos exámenes, en función de su rendimiento anterior. La investigación se circunscribe a un número total de 110 alumnos de 6º a 8º medio. Si una variable aleatoria “X” se define como las calificaciones obtenidas. La siguiente tabla muestra los datos recopilados:

CalificacionesNúmero de estudiantesA+14A-29B35C19D8E5Total de estudiantes:110Muestra de datos

P(X=A+) = 14/110 = 0,1273

0,1273 * 100 = 12,7%

Esto muestra que alrededor del 12,7% de los estudiantes pueden obtener una puntuación de hasta A+ en sus próximos exámenes.

¿Qué pasa si las escuelas también quieren analizar las calificaciones de los estudiantes con respecto a sus clases? Entonces, ¿cuántos del 12,7 % de los estudiantes que obtuvieron una A + pertenecen al octavo estándar?

Tratar con una sola variable aleatoria es bastante simple, pero cuando sus datos se distribuyen con respecto a dos variables aleatorias, los cálculos pueden ser un poco complejos.

Las dos formas más simplificadas de extraer información relevante de los datos bivariados son la distribución marginal y condicional.

Para explicar visualmente los conceptos básicos de la probabilidad, aquí hay un video de Math Antics:

Travesuras Matemáticas – Probabilidad Básica

¿Qué se entiende por distribución marginal?

La distribución marginal o probabilidad marginal es la distribución de una variable independiente de la otra variable. Solo depende de que ocurra uno de los dos eventos mientras se incluyen todas las posibilidades del otro evento.

Es más fácil entender el concepto de distribución marginal cuando los datos se representan en forma tabular. El término marginal denota que incluye la distribución a lo largo de los márgenes.

Las siguientes tablas muestran las calificaciones de 110 estudiantes de 6º a 8º estándar. Podemos usar esta información para predecir una calificación para su próximo examen de matemáticas,

Calificaciones6.º estándar7.º estándar8.º estándarNúmero total de estudiantesA+75214A-1181029B6181135C47819D1348E0325SUM294437110Muestra de datos

Usando esta tabla o datos de muestra, podemos calcular la distribución marginal de las calificaciones con respecto al número total de estudiantes o la distribución marginal de estudiantes en un estándar específico.

Ignoramos la ocurrencia de un segundo evento al calcular la distribución marginal.

Por ejemplo, al calcular la distribución marginal de los estudiantes que obtuvieron una C con respecto al número total de estudiantes, simplemente sumamos el número de estudiantes para cada clase en la fila y cortamos el valor con el número total de estudiantes.

El número total de estudiantes que obtuvieron una C en todos los estándares combinados es 19.

Dividiéndolo por el número total de estudiantes en el estándar 6-8: 19/110=0.1727

Multiplicar el valor por 100 da 17,27%.

El 17,27% del total de alumnos obtuvo una C.

También podemos usar esta tabla para determinar la distribución marginal de estudiantes en cada estándar. Por ejemplo, la distribución marginal de los alumnos de 6º estándar es 29/110, lo que da 0,2636. Multiplicando este valor por 100 da 26,36%.

Asimismo, la distribución marginal de los estudiantes de 7° y 8° medio es de 40% y 33,6%, respectivamente.

¿Qué se entiende por distribuciones condicionales?

La distribución condicional, tal como la interpreta el nombre, se basa en una condición preexistente. Es la probabilidad de una variable mientras la otra variable se establece en una condición dada.

Las distribuciones condicionales le permiten analizar su muestra con respecto a dos variables. En el análisis de datos, a menudo la probabilidad de que ocurra un evento está influenciada por otro factor.

La probabilidad condicional utiliza la representación tabular de datos. Esto mejora la visualización y el análisis de los datos de la muestra.

Por ejemplo, si está encuestando el promedio de vida de la población, dos variables a tener en cuenta pueden ser, su ingesta diaria promedio de calorías y la frecuencia de la actividad física. La probabilidad condicional puede ayudarlo a determinar el impacto de la actividad física en el promedio de vida de la población si su ingesta diaria de calorías es superior a 2500 kcal o viceversa.

Como establecimos la ingesta calórica diaria <2500kcal, pusimos una condición. Sobre la base de esta condición, se puede determinar el impacto de las actividades físicas en el promedio de vida.

O bien, al observar la desviación de las ventas de dos marcas predominantes de bebidas energéticas, dos variables que influyen en las ventas de estas bebidas energéticas son su presencia y precio. Podemos usar la probabilidad condicional para determinar la influencia del precio y la presencia de dos bebidas energéticas en la intención de compra de los clientes.

Para entender mejor, veamos el mismo ejemplo usado en la distribución marginal:

Calificaciones6.º estándar7.º estándar8.º estándarNúmero total de estudiantesA+75214A-1181029B6181135C47819D1348E0325SUM294437110Muestra de datos

Por ejemplo, desea encontrar la distribución de estudiantes de sexto estándar con una C, en relación con el número total de estudiantes. Simplemente divida la cantidad de estudiantes en 6.° estándar que obtuvieron una C por la cantidad total de estudiantes en los tres estándares que obtuvieron una C.

Entonces la respuesta será b 4/19= 0.21

Multiplicarlo por cien da 21%

La distribución de un estudiante de 7º estándar con una C es 7/19 = 0,37

Multiplicando por 100 da 37%

Y la distribución de un estudiante de octavo estándar con una C es 8/19 = 0.421

Multiplicando por 100 da 42.1%

Diferencia entre distribución condicional y marginal

Diferencia entre distribución condicional y marginalDiferencia entre distribución condicional y marginal

La distribución marginal es la distribución de una variable con respecto a la muestra total, mientras que la distribución condicional es la distribución de una variable con respecto a otra variable.

La distribución marginal es independiente de los resultados de la otra variable. En otras palabras, es simplemente incondicional.

Por ejemplo, si se asigna una variable aleatoria «X» al sexo de los niños en un campamento de verano y otra variable aleatoria «Y» a la edad de estos niños, entonces,

La distribución marginal de niños en un campamento de verano puede estar dada por P(X=niños), mientras que la proporción de niños menores de 8 años está dada por distribución condicional como P(X=niños|Y<8).

Pensamientos finales

La distribución marginal muestra las probabilidades de diferentes valores de las variables sin señalar las otras variables.

Sin embargo, la distribución condicional es la probabilidad de una variable que se calcula con referencia a otra variable.

Ambas teorías de probabilidad son correctas y su aplicación difiere en diferentes problemas, casos y escenarios.

Artículos relacionados

Diferencia entre distribución condicional y marginal (explicada): todas las diferencias

Deja un comentario

¡Contenido premium bloqueado!

Desbloquear Contenido
close-link