Bootstrapping es una poderosa técnica estadística. Es especialmente útil cuando el tamaño de muestra con el que estamos trabajando es pequeño. En circunstancias habituales, los tamaños de muestra de menos de 40 no pueden tratarse asumiendo una distribución normal o una distribución t. Las técnicas de bootstrap funcionan bastante bien con muestras que tienen menos de 40 elementos. La razón de esto es que el bootstrapping implica un nuevo muestreo. Este tipo de técnicas no asumen nada sobre la distribución de nuestros datos.
Bootstrapping se ha vuelto más popular a medida que los recursos informáticos se han vuelto más fácilmente disponibles. Esto se debe a que para que el arranque sea práctico, se debe usar una computadora. Veremos cómo funciona esto en el siguiente ejemplo de bootstrapping.
Video destacado
Ejemplo
Comenzamos con una muestra estadística de una población de la que no sabemos nada. Nuestro objetivo será un intervalo de confianza del 90% sobre la media de la muestra. Aunque otras técnicas estadísticas utilizadas para determinar los intervalos de confianza suponen que conocemos la desviación media o estándar de nuestra población, el bootstrapping no requiere nada más que la muestra.
Para los propósitos de nuestro ejemplo, asumiremos que la muestra es 1, 2, 4, 4, 10.
Muestra de bootstrap
Ahora reponemos con el reemplazo de nuestra muestra para formar lo que se conoce como muestras de bootstrap. Cada muestra de bootstrap tendrá un tamaño de cinco, al igual que nuestra muestra original. Como estamos seleccionando al azar y luego estamos reemplazando cada valor, las muestras de bootstrap pueden ser diferentes de la muestra original y entre sí.
Para ver ejemplos con los que nos encontraríamos en el mundo real, haríamos este muestreo cientos, si no miles de veces. En lo que sigue a continuación, veremos un ejemplo de 20 muestras de bootstrap:
- 2, 1, 10, 4, 2
- 4, 10, 10, 2, 4
- 1, 4, 1, 4, 4
- 4, 1, 1, 4, 10
- 4, 4, 1, 4, 2
- 4, 10, 10, 10, 4
- 2, 4, 4, 2, 1
- 2, 4, 1, 10, 4
- 1, 10, 2, 10, 10
- 4, 1, 10, 1, 10
- 4, 4, 4, 4, 1
- 1, 2, 4, 4, 2
- 4, 4, 10, 10, 2
- 4, 2, 1, 4, 4
- 4, 4, 4, 4, 4
- 4, 2, 4, 1, 1
- 4, 4, 4, 2, 4
- 10, 4, 1, 4, 4
- 4, 2, 1, 1, 2
- 10, 2, 2, 1, 1
Media
Como estamos utilizando bootstrapping para calcular un intervalo de confianza para la media de la población, ahora calculamos los medios de cada una de nuestras muestras de bootstrap. Estos medios, dispuestos en orden ascendente son: 2, 2.4, 2.6, 2.6, 2.8, 3, 3, 3.2, 3.4, 3.6, 3.8, 4, 4, 4.2, 4.6, 5.2, 6, 6, 6.6, 7.6.
Intervalo de confianza
Ahora obtenemos de nuestra lista de muestras de bootstrap un intervalo de confianza. Como queremos un intervalo de confianza del 90%, utilizamos los percentiles 95 y 5 como punto final de los intervalos. La razón de esto es que dividimos 100% – 90% = 10% a la mitad para que tengamos el 90% medio de todos los medios de muestra de bootstrap.
Para nuestro ejemplo anterior, tenemos un intervalo de confianza de 2.4 a 6.6.
& amp; # x203A; Matemáticas