La regresión lineal es una herramienta estadística que determina qué tan bien una línea recta se adapta a un conjunto de datos emparejados.& amp; amp; nbsp; La línea recta que mejor se adapta a esos datos se denomina línea de regresión de mínimos cuadrados.& amp; amp; nbsp; esta línea se puede usar de varias maneras. Uno de estos usos es estimar el valor de una variable de respuesta para un valor dado de una variable explicativa. Relacionado con esta idea está el de un residuo.
Los residuos se obtienen realizando restas. Todo lo que debemos hacer es restar el valor predicho de y del valor observado de y para un particular x . El resultado se llama residual.
Fórmula para residuos
La fórmula para residuos es sencilla:
Residual = observado y & amp; # x2013; predicho y
Es importante tener en cuenta que el valor predicho proviene de nuestra línea de regresión. El valor observado proviene de nuestro conjunto de datos.
Ejemplos
Ilustraremos el uso de esta fórmula mediante el uso de un ejemplo. Supongamos que se nos da el siguiente conjunto de datos emparejados:
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
Al usar el software podemos ver que la línea de regresión de mínimos cuadrados es y = 2 x . Usaremos esto para predecir valores para cada valor de x .
Video destacado
Por ejemplo, cuando x = 5 vemos que 2 (5) = 10. Esto nos da el punto a lo largo de nuestra línea de regresión que tiene una coordenada x de 5.
Para calcular el residuo en los puntos x = 5, restamos el valor predicho de nuestro valor observado. Dado que la coordenada y de nuestro punto de datos fue 9, esto proporciona un residuo de 9 & amp; # x2013; 10 = -1.
En la siguiente tabla vemos cómo calcular todos nuestros residuos para este conjunto de datos:
X
Observado y
Predicted y
Residual
1)
2)
2)
0
2)
3)
4)
-1
3)
7)
6)
1)
3)
6)
6)
0
4)
9)
8)
1)
5)
9)
10)
-1
Características de los residuos
Ahora que hemos visto un ejemplo, hay algunas características de los residuos a tener en cuenta:
- Los residuos son positivos para los puntos que caen por encima de la línea de regresión.
- Los residuos son negativos para los puntos que caen por debajo de la línea de regresión.
- Los residuos son cero para los puntos que caen exactamente a lo largo de la línea de regresión.
- Cuanto mayor es el valor absoluto del residuo, más lejos se encuentra el punto de la línea de regresión.
- La suma de todos los residuos debe ser cero. En la práctica, a veces esta suma no es exactamente cero. La razón de esta discrepancia es que los errores de redondeo pueden acumularse.
Usos de residuos
Hay varios usos para residuos. Un uso es ayudarnos a determinar si tenemos un conjunto de datos que tenga una tendencia lineal general, o si debemos considerar un modelo diferente. La razón de esto es que los residuos ayudan a amplificar cualquier patrón no lineal en nuestros datos. Lo que puede ser difícil de ver al mirar una trama dispersa se puede observar más fácilmente examinando los residuos y una parcela residual correspondiente.
Otra razón para considerar los residuos es verificar que se cumplan las condiciones de inferencia para la regresión lineal. Después de verificar una tendencia lineal (comprobando los residuos), también verificamos la distribución de los residuos. Para poder realizar inferencia de regresión, queremos que los residuos de nuestra línea de regresión se distribuyan aproximadamente de manera normal. Un histograma o plantilla de los residuos ayudará a verificar que se haya cumplido esta condición.
& amp; # x203A; Matemáticas