REGRESION LINEAL


Implicaciones de la incertidumbre en gráficas de variables físicas medidas.

Cuando se grafican datos experimentales es imperativo que la gráfica también proporcione información sobre la incertidumbre de las medidas. Esto se hace dibujando barras de error sobre el punto graficado. En la fig.2, se muestra una gráfica entre 2 variables medidas , donde cada dato posee sus barras de error en forma de cruz. Dicha cruz está centrada sobre los valores promedio de cada variable, su extensión a derecha e izquierda está dada por el valor de la incertidumbre , y de manera análoga se procede con la variable vertical .

 

La variable horizontal representa el tiempo medido en segundos, y la vertical una velocidad expresada en metros/segundo. Puede observarse que la incertidumbre en el tiempo es cercana a los 0.5s y esa es la razón por la cual en el eje vertical aparecen explícitos los valores decimales de la escala. De igual manera la incertidumbre en la velocidad oscila alrededor de los 2m/s.

 

A primera vista, la tendencia de los datos parece ser lineal, pero también existe la posibilidad de que la tendencia obedezca a un polinomio de grado superior. Para decidir si esta primera impresión de linealidad es correcta, debe usarse el método de regresión lineal por mínimos cuadrados, el cual proporciona un criterio aproximado que permite juzgar esta cuestión.

Fig2. Gráfica típica de datos experimentales.

 

Método de los mínimos cuadrados para regresión lineal.

 

Los datos de la fig.2 obedecen a un conjunto de datos n =7, que se pueden ilustrar en la tabla I.

x (± 0.5s)

y (± 2m/s)

Tabla I. Representación esquemática de la manera de presentar datos tabulados.

 

Se destaca aquí el rótulo de las variables, sus unidades respectivas y la incertidumbre. A cada dato de x se le designará el nombre genérico , de igual manera se hará con los datos de y. De esta forma cuando aparezca el símbolo se está simbolizando la operación de tomar cada dato de la fila x y sumarlos. El símbolo representa tomar cada dato de la fila y, elevarlo al cuadrado y sumarlos, y de manera análoga el símbolo consiste en tomar un dato de la fila x, multiplicarlo con su pareja de la fila y, y finalmente sumar los resultados.

 

Una vez entendida esta representación, se puede aplicar el método de regresión lineal por mínimos cuadrados. Este consiste encontrar la recta que mejor se ajusta a los datos experimentales. Se basa en un método estadístico que busca minimizar la distancia entre cada punto experimental y la recta buscada, es decir, en minimizar la desviación standard. El análisis estadístico de este problema, demuestra que la recta buscada, cuya ecuación genérica es Y=mX+b, donde m es la pendiente (inclinación de la recta) y b el intercepto (posición donde la recta corta el eje y), está dada por las fórmulas :

(12a)

(12b)

De esta manera, puede hallarse la recta que mejor se ajusta a los datos experimentales. Pero existe un pequeño problema adicional, y es que el método se ajusta a cualquier tipo de datos, sea que tengan tendencia lineal o no. Lo cual quiere decir que si se introducen datos que corresponden a una tendencia polinomial, el método encuentra una recta de todos modos, lo cual es una incongruencia. Afortunadamente este problema puede obviarse calculando un parámetro adicional que se llama coeficiente de correlación R2, que se obtiene mediante la relación :

 

(13)

Al evaluarse este parámetro, se obtiene un valor entre cero y uno, el cual indica el grado de ajuste entre los datos experimentales y la recta calculada. La calidad del ajuste es mayor cuanto más cercano a uno (1) sea el valor del coeficiente de correlación. Esto permite un criterio certero para juzgar la tendencia lineal de los datos.

 

Solo queda por resolver una cuestión, ¿Cuál es la incertidumbre estadística en los resultados de la regresión lineal ? En este caso, la desviación standard es :

(14)

La desviación standard de la media es :

(15)

y para cada , el resultado que se reporta es :

(16)

 

Para concluir esta parte teórica, solo queda añadir que las calculadoras científicas tienen incorporada una rutina de cálculo que realiza rápidamente la evaluación de pendiente, intercepto y coeficiente de correlación para un conjunto de datos dado, cuando se programa en el modo estadístico. Para ello debe consultarse el manual respectivo de su calculadora. Igualmente las hojas electrónicas realizan con rapidez y en un entorno gráfico, la evaluación de estos parámetros.

Regresar a la página principal