ESTADÍSTICA BIDIMENSIONAL
Conceptos Básicos
¿Qué es la Estadística Bidimensional?
Rama de la estadística que se ocupa del estudio simultáneo de dos caracteres () en los individuos de una población. Permite analizar si existe relación entre ambas variables.
Frecuencia Conjunta ()
Es el número de individuos que presentan simultáneamente el valor de la primera variable y el valor de la segunda. La suma de todas las frecuencias conjuntas es el total de la población .
Distribuciones
Distribuciones Marginales
Analiza el comportamiento de una sola variable ignorando la otra. Se obtienen sumando las frecuencias conjuntas por filas () o por columnas ().
- Marginal de : Distribución unidimensional de la variable .
- Marginal de : Distribución unidimensional de la variable .
Distribuciones Condicionadas
Es la distribución de una variable (por ejemplo ) considerando solo los individuos que toman un valor concreto en la otra variable (por ejemplo ). Se estudia una fila o columna específica de la tabla de doble entrada.
Covarianza
Covarianza ()
Fórmula:
Es la media del producto de las desviaciones de cada variable respecto a su media. Indica si hay relación lineal y su sentido.
- : Correlación positiva (directa).
- : Correlación negativa (inversa).
- : No hay correlación (incorrelación).
Correlación
Tipos de Correlación
La correlación indicia la relación o dependencia entre las variables. Puede clasificarse de varias formas:
- Funcional: Existe una relación exacta, .
- Aleatoria: Existe relación estadística pero no exacta.
- Nula: No hay relación entre las variables.
- Directa (Positiva): Al aumentar una variable, aumenta la otra.
- Inversa (Negativa): Al aumentar una variable, la otra disminuye.
- Fuerte: La dependencia es alta (los puntos están muy cerca de la recta de regresión).
- Débil: La dependencia es baja (la nube de puntos es muy dispersa).
Coeficiente de Correlación Lineal ()
Fórmula:
Mide el grado de asociación lineal y el sentido de la correlación. Es adimensional y varía entre y .
- : Correlación directa.
- : Correlación inversa.
- : Correlación fuerte (puntos alineados).
- : Correlación débil (nube de puntos redonda).
Regresión Lineal
Rectas de Regresión
Son las rectas que mejor se ajustan a la nube de puntos mediante el método de mínimos cuadrados. Permiten hacer estimaciones.
Recta de Regresión de Y sobre X
Fórmula:
Minimiza las distancias verticales. Se utiliza para estimar el valor de suponiendo conocido un valor de . El término es la pendiente de la recta.
Recta de Regresión de X sobre Y
Fórmula:
Minimiza las distancias horizontales. Se utiliza para estimar el valor de suponiendo conocido un valor de . No es la misma recta que la anterior (salvo dependencia funcional).