Definiciones científicas y leyes

Coeficiente de Pearson

El coeficiente de correlación de Pearson, también conocido como coeficiente de correlación producto-momento de Pearson, es una medida estadística que evalúa la fuerza y la dirección de la relación lineal entre dos variables cuantitativas. Este coeficiente fue desarrollado por Karl Pearson a finales del siglo XIX y se ha convertido en una herramienta fundamental en la estadística inferencial.

Definición y Fórmula

El coeficiente de correlación de Pearson se denota comúnmente como rr. Su valor oscila entre -1 y 1, donde:

  • r=1r = 1 indica una correlación positiva perfecta, es decir, a medida que una variable aumenta, la otra también lo hace en una relación lineal exacta.
  • r=1r = -1 indica una correlación negativa perfecta, es decir, a medida que una variable aumenta, la otra disminuye en una relación lineal exacta.
  • r=0r = 0 indica que no hay una relación lineal entre las variables.

La fórmula matemática para calcular rr es:

r=n(xy)(x)(y)[nx2(x)2][ny2(y)2]r = \frac{n(\sum xy) – (\sum x)(\sum y)}{\sqrt{[n\sum x^2 – (\sum x)^2][n\sum y^2 – (\sum y)^2]}}

Donde:

  • nn es el número de pares de datos.
  • xx e yy son las variables cuyos valores están siendo correlacionados.
  • xy\sum xy es la suma del producto de los valores de xx e yy.
  • x\sum x y y\sum y son las sumas de los valores individuales de xx e yy, respectivamente.
  • x2\sum x^2 y y2\sum y^2 son las sumas de los cuadrados de los valores individuales de xx e yy.

Interpretación del Coeficiente de Correlación

La interpretación del valor de rr debe hacerse con cuidado y en el contexto del análisis:

  • Valores cercanos a 1 o -1 indican una fuerte correlación lineal.
  • Valores cercanos a 0 indican una débil correlación lineal o ninguna correlación.
  • Es importante destacar que el coeficiente de correlación de Pearson solo mide la relación lineal. Si las variables tienen una relación no lineal, rr no proporcionará una medida adecuada de la relación.

Supuestos del Coeficiente de Correlación de Pearson

Para que el coeficiente de correlación de Pearson sea una medida adecuada, se deben cumplir ciertos supuestos:

  1. Linealidad: La relación entre las variables debe ser lineal.
  2. Normalidad: Idealmente, las variables deberían seguir una distribución normal.
  3. Homocedasticidad: La variabilidad de las diferencias entre las variables debe ser constante a lo largo de los valores de las variables.
  4. Independencia: Las observaciones deben ser independientes entre sí.

Aplicaciones del Coeficiente de Correlación de Pearson

El coeficiente de correlación de Pearson tiene múltiples aplicaciones en diferentes campos, incluyendo:

  • Investigación Científica: Para evaluar la relación entre variables en estudios experimentales y observacionales.
  • Economía y Finanzas: Para analizar la relación entre diferentes indicadores económicos, como la relación entre el precio de las acciones y los índices económicos.
  • Psicología y Ciencias Sociales: Para investigar la relación entre variables comportamentales y sociales, como la relación entre el estrés y el rendimiento académico.
  • Medicina y Salud Pública: Para estudiar la relación entre factores de riesgo y resultados de salud, como la relación entre el tabaquismo y la incidencia de enfermedades cardíacas.

Limitaciones del Coeficiente de Correlación de Pearson

A pesar de su utilidad, el coeficiente de correlación de Pearson tiene varias limitaciones:

  • No captura relaciones no lineales: Si la relación entre las variables no es lineal, rr puede ser engañoso.
  • Sensibilidad a valores atípicos: Los valores atípicos pueden influir significativamente en el valor de rr, llevándolo a representar una relación que no es típica del conjunto de datos.
  • No implica causalidad: Un valor alto de rr no implica que una variable cause la otra. La correlación no es igual a causalidad.

Ejemplo Práctico

Supongamos que queremos analizar la relación entre las horas de estudio y las calificaciones obtenidas en un examen. Tenemos los siguientes datos para cinco estudiantes:

Estudiante Horas de estudio (x) Calificación (y)
1 2 60
2 3 65
3 4 70
4 5 75
5 6 80

Para calcular el coeficiente de correlación de Pearson, utilizamos la fórmula mencionada anteriormente:

  1. Calcular los sumatorios:
    x=2+3+4+5+6=20\sum x = 2 + 3 + 4 + 5 + 6 = 20
    y=60+65+70+75+80=350\sum y = 60 + 65 + 70 + 75 + 80 = 350
    xy=(2×60)+(3×65)+(4×70)+(5×75)+(6×80)=1070\sum xy = (2 \times 60) + (3 \times 65) + (4 \times 70) + (5 \times 75) + (6 \times 80) = 1070
    x2=22+32+42+52+62=90\sum x^2 = 2^2 + 3^2 + 4^2 + 5^2 + 6^2 = 90
    y2=602+652+702+752+802=24750\sum y^2 = 60^2 + 65^2 + 70^2 + 75^2 + 80^2 = 24750

  2. Aplicar la fórmula:
    r=5(1070)(20)(350)[5(90)(20)2][5(24750)(350)2]r = \frac{5(1070) – (20)(350)}{\sqrt{[5(90) – (20)^2][5(24750) – (350)^2]}}
    r=53507000[450400][123750122500]r = \frac{5350 – 7000}{\sqrt{[450 – 400][123750 – 122500]}}
    r=165050×1250r = \frac{-1650}{\sqrt{50 \times 1250}}
    r=1650250r = \frac{-1650}{250}
    r=0.66r = -0.66

En este caso, el valor de rr indica una correlación negativa, lo que sugiere que, a medida que aumentan las horas de estudio, las calificaciones disminuyen, lo cual puede ser contraintuitivo y requeriría una mayor investigación para entender las razones subyacentes.

Conclusión

El coeficiente de correlación de Pearson es una herramienta estadística poderosa para medir la relación lineal entre dos variables cuantitativas. Su interpretación adecuada y su aplicación correcta requieren una comprensión profunda de sus supuestos y limitaciones. A pesar de sus restricciones, sigue siendo una medida invaluable en una amplia gama de disciplinas, ayudando a investigadores y profesionales a comprender mejor las relaciones entre variables y a tomar decisiones informadas basadas en los datos disponibles.

Botón volver arriba